環(huán)境與生態(tài)統(tǒng)計(jì)||置信區(qū)間的估計(jì)

經(jīng)典統(tǒng)計(jì)學(xué)的核心思想就是用樣本(我們所能采集到的數(shù)據(jù),如總磷濃度,TP)去估計(jì)總體(關(guān)于總體情況的描述);總體的參數(shù)是未知的,不可測(cè)度或難以測(cè)度,注意它是固定了的數(shù)值;

我們采集了有限的TP,而且在前人研究的基礎(chǔ)上已知一個(gè)生態(tài)系統(tǒng)中TP可以被近似為對(duì)數(shù)正態(tài)分布,那么剩下的工作就是要估計(jì)分布的對(duì)數(shù)均值和對(duì)數(shù)標(biāo)準(zhǔn)差。估計(jì)總體的均值和標(biāo)準(zhǔn)差,最自然的方法就是用樣本的均值和標(biāo)準(zhǔn)差去估計(jì)。

為了估計(jì)這個(gè)總體的參數(shù),我們就要通過(guò)樣本來(lái)構(gòu)造統(tǒng)計(jì)量,注意它是一個(gè)隨機(jī)變量。因?yàn)槲覀儾荒軆H用一次采樣的數(shù)據(jù)來(lái)估計(jì)總體,我們每一次采樣都會(huì)得到一個(gè)均值和標(biāo)準(zhǔn)差。這樣這個(gè)用于估計(jì)的值就是一個(gè)隨機(jī)變量。

隨機(jī)變量的意思是隨著你樣本選取的不同,具體到每一個(gè)樣本的統(tǒng)計(jì)量的統(tǒng)計(jì)值也不盡相同。這個(gè)隨機(jī)變量的統(tǒng)計(jì)值就是對(duì)總體參數(shù)的點(diǎn)估計(jì),由于樣本估計(jì)總體總是會(huì)存在一定的偏差,所以我們?yōu)榱烁玫墓烙?jì)總體參數(shù),于是用到了置信區(qū)間。

95%的置信度的意思是如果你從總體中抽取100個(gè)不同樣本,每個(gè)樣本都用相同的統(tǒng)計(jì)量構(gòu)造的置信區(qū)間(注意:由于樣本不相同,這些置信區(qū)間的范圍也不盡相同),那么有95個(gè)置信區(qū)間包含了總體參數(shù)的真值。換句話說(shuō),95%的置信區(qū)間意味著真值\mu落在區(qū)間內(nèi)的概率是0.95。

最關(guān)鍵的是要理解統(tǒng)計(jì)量是隨機(jī)變量而總體的參數(shù)是一個(gè)實(shí)實(shí)在在的數(shù)值。

置信區(qū)間的計(jì)算在知道方差和不知道方差的情況下,計(jì)算公式是不一樣的。

confint<-function(x,sigma=-1,alpha=0.05)
  {
      n<-length(x)
      xb<-mean(x)
      if(sigma>=0)
          {
             tmp<-sigma/sqrt(n)*qnorm(1-alpha/2);df<-n
           }
       else{
           tmp<-sd(x)/sqrt(n)*qt(1-alpha/2,n-1);df<- n-1
           }
       data.frame(mean=xb,df=df,a=xb-tmp,b=xb+tmp)
   }
--------------------- 
作者:DawnJobs 
來(lái)源:CSDN 
原文:https://blog.csdn.net/LittleYearYear/article/details/39940231 
版權(quán)聲明:本文為博主原創(chuàng)文章,轉(zhuǎn)載請(qǐng)附上博文鏈接!

如果不知道方差,則confint(x,alpha) 知道方差,則confint(x,sigma,alpha)

思考:置信區(qū)域的形狀如何?置信區(qū)域與假設(shè)檢驗(yàn)有何聯(lián)系?

按照我的簡(jiǎn)要理解,置信橢圓基本上是對(duì)置信區(qū)域的描述方式,其長(zhǎng)軸和短軸分別為置信區(qū)域的參數(shù),置信橢圓的長(zhǎng)短半軸,分別表示二維位置坐標(biāo)分量的標(biāo)準(zhǔn)差(如經(jīng)度的σλ和緯度的σφ)。一倍標(biāo)準(zhǔn)差(1σ)的概率值是68.3%,二倍標(biāo)準(zhǔn)差(2σ)的概率值為95.5%;三倍標(biāo)準(zhǔn)差(3σ)的概率值是99.7%。

μ的置信度為1?α的置信區(qū)域?yàn)?/p>

當(dāng)p=1時(shí),它是一個(gè)區(qū)間;當(dāng)p=2時(shí),它是一個(gè)橢圓,這時(shí)可將其在坐標(biāo)平面上畫(huà)出;當(dāng)p=3時(shí),它是一個(gè)橢球;當(dāng)p>3時(shí),它是一個(gè)超橢球;它們均以 為中心。

同置信區(qū)間與假設(shè)檢驗(yàn)的關(guān)系一樣,置信區(qū)域與假設(shè)檢驗(yàn)之間也有著同樣的密切關(guān)系。一般來(lái)說(shuō),μ0包含在上述置信區(qū)域內(nèi),當(dāng)且僅當(dāng)原假設(shè) H0:μ=μ0在顯著性水平α下被接受。因此,可以通過(guò)構(gòu)造置信區(qū)域的方法來(lái)進(jìn)行假設(shè)檢驗(yàn)。

我們用 rnorm(20, 0.2, 1)來(lái)構(gòu)建TP的濃度,計(jì)算95% 和50% 的置信區(qū)間:

source("D:\\Users\\Administrator\\Desktop\\RStudio\\Environmental_and_Ecological_Statistics_with_R\\DataCode\\Code\\FrontMatter.R")

################
## Chapter 4  ##
################
plotDIRch4 <- paste(plotDIR, "chapter4","figures", sep="/")
if(file_test("-d", plotDIRch4)){cat("plotDIRch3 already exists")}else{dir.create(plotDIRch4,recursive = TRUE)}
y <- rnorm(20, 0.2, 1)
n <- length (y)
y.bar <- mean(y)
se <- sd(y)/sqrt(n)
int.50 <- y.bar + qt(c(0.25, 0.75), df=n-1)*se
int.95 <- y.bar + qt(c(.025, .975), df=n-1)*se
print( c(y.bar, int.95))
[1] -0.09966904  1.99591665  2.40901554

在這個(gè)案例中,我們假設(shè)TP濃度對(duì)數(shù)值的真實(shí)分布是N(2.05,0.34),并且利用計(jì)算機(jī)從這個(gè)分布中采取30個(gè)隨機(jī)數(shù)來(lái)模仿采樣過(guò)程,然后計(jì)算置信區(qū)間。當(dāng)多次重復(fù),我就會(huì)期望區(qū)間會(huì)包含2.05.

n.sims <- 1000
n.size <- 30
inside <- 0
for (i in 1:n.sims){  ## looping through n.sims iterations
  y <- rnorm(n.size, mean=2.05, sd=0.34)
  ## random samples from N(2.05, 0.34)
 se <- sd(y)/sqrt(n.size)
 int.95 <- mean(y) + qt(c(.025, .975), n.size-1)*se
 inside <- inside + sum(int.95[1]<2.05 & int.95[2]>2.05)
}
inside/n.sims  ## fraction of times true mean inside int.95
[1] 0.951

模擬中心極限定理

樣本均值的分布是正態(tài)的不論中體的分布是怎樣的

## central limit theorem simulation
two.prob()
central.sim(mux=1, vx=1, n=c(5, 20, 100))
#postscript(file=paste(plotDIR, "cltSims.eps", sep="/"),
#           width=4.75, height=3, horizontal=F)
central.sim(mux=1, vx=1, n=c(5, 20, 100))
#dev.off()

以上均是對(duì)均值的推斷,統(tǒng)計(jì)推斷還有第二部分,即是對(duì)標(biāo)準(zhǔn)差的推斷。同樣是用樣本的標(biāo)準(zhǔn)差來(lái)估計(jì)總體的標(biāo)準(zhǔn)差。

通過(guò)對(duì)總體均值和標(biāo)準(zhǔn)差的估計(jì),可以確定模型的參數(shù)。但是,Everglades濕地研究背后的問(wèn)題是要設(shè)定TP的環(huán)境標(biāo)準(zhǔn):使用背景濃度的75百分點(diǎn)作為標(biāo)準(zhǔn)。因此接下來(lái)的問(wèn)題是如何估計(jì)0.75分位數(shù)。如果我們知道總體分布是正態(tài)分布的,且均值和標(biāo)準(zhǔn)差的真值是已知的,那么可以直接估計(jì)0.75分位數(shù)。假設(shè)均值=2.05,標(biāo)準(zhǔn)差=0.34.

qnorm(0.75,mean = 2.05,sd=0.34)
[1] 2.279327

TP濃度分布的0.75分位數(shù)就是e^{2.279327}=9.77pp。但是,如何描述0.75分位數(shù)的不確定性呢?


n.sims=1000
n<-30
y <- rnorm(20, 0.2, 1)
y.bar<-mean(y)
se<-sd(y)
x<-rchisq(n.sims,df=n-1)
sigma.chi2<-se*sqrt((n-1)/x)
sample.mean<-rnorm(n.sims,y.bar,sigma.chi2/sqrt(n))
q.75<-qnorm(0.75,sample.mean,sigma.chi2)
hist(exp(q.75),axes=F,xlab="0.75 Quantile Distribution")
axis(1)

#從模擬的不確定性給出95%的置信區(qū)間

quantile(exp(q.75),probs = c(0.25,0.975))
     25%    97.5% 
1.922981 2.949886 


參考:

如何理解 95% 置信區(qū)間?
用R語(yǔ)言求置信區(qū)間
基礎(chǔ)知識(shí):置信橢圓confidence ellipse

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 227,488評(píng)論 6 531
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 98,034評(píng)論 3 414
  • 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人,你說(shuō)我怎么就攤上這事?!?“怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 175,327評(píng)論 0 373
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我,道長(zhǎng),這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 62,554評(píng)論 1 307
  • 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 71,337評(píng)論 6 404
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 54,883評(píng)論 1 321
  • 那天,我揣著相機(jī)與錄音,去河邊找鬼。 笑死,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 42,975評(píng)論 3 439
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 42,114評(píng)論 0 286
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 48,625評(píng)論 1 332
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 40,555評(píng)論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 42,737評(píng)論 1 369
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,244評(píng)論 5 355
  • 正文 年R本政府宣布,位于F島的核電站,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 43,973評(píng)論 3 345
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 34,362評(píng)論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 35,615評(píng)論 1 280
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 51,343評(píng)論 3 390
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 47,699評(píng)論 2 370

推薦閱讀更多精彩內(nèi)容