極大似然估計

現實情況中我們可能會遇到這樣的一些例子,需要得到一所高校有車學生的分布情況(假定符合參數為p的伯努利分布),某地區(qū)成年男性的身高分布情況(假定符合參數為u1,σ1的正態(tài)分布),南極洲成年帝企鵝的體重分布(假定符合參數為u2,σ2的正態(tài)分布)等等。

由于時間和經費的限制,不可能進行全面統計,我們只能通過一定的觀察,得到一系列的觀察值,在上述假定概率分布模型上,現在需要求出是哪個具體的概率分布生成了這些觀察值。要解決這個問題,就需要用到參數估計方法,即估計出上述的參數p,(u,σ),而最大似然估計就是這樣一種方法。

最大似然估計是一個在已知觀察結果(即樣本)和給定概率分布模型的基礎上,估計概率分布模型的參數,并使得在該參數下,生成這個已知樣本的可能性最大的方法。

舉第一個例子,設我們已經獲得了一個樣本集{X1,X2,…,Xn},其中Xi=0表示選取的學生沒有車,Xi= 1表示選取的學生有車。 Xi服從概率為未知參數p的伯努利分布,那么根據伯努利分布的定義,每個Xi的概率質量函數為:

f(xi;p)=pxi(1?p)1?xi

其中Xi=0或1。 首先,要通過極大似然估計方法求出參數p,需要定義似然函數。前面提到,最大似然估計就是去找參數估計值,使得已經觀察到的樣本值發(fā)生概率最大。既然這些樣本已經實現了,其發(fā)生概率最大才符合邏輯。這就是求所有觀測值樣本的聯合概率最大化。因此,似然函數在形式上,其實就是樣本的聯合概率。對連續(xù)型隨機變量和離散型隨機變量,樣本的似然函數分別是概率密度和概率質量函數的連乘形式。

對于本例,似然函數為:

L(p)=∏i=1nf(xi;p)=px1(1?p)1?x1×px2(1?p)1?x2×...×pxn(1?p)1?xn

將上式化簡,我們得到:

L(p)=p∑xi(1?p)n?∑xi

在實際應用中,為了求解方便,一般使用似然函數的對數。

ln(L(p))=ln(p∑xi(1?p)n?∑xi)=(∑xi)ln(p)+(n?∑xi)ln(1?p)

我們知道,對數函數是單調遞增的。這意味著使得ln(L(p))獲得極大值的p也是使得L(p)獲得極大值的p。下圖為對數函數的圖像。

利用一元函數求極大值的方法,對上式兩邊求p的導數,并令其等于0:

?ln(L(p))?p=∑xip?(n?∑xi)1?p≡0

兩邊乘以p(1-p),得到:

(∑xi)(1?p)?(n?∑xi)p=0

化簡后:

∑xi?np=0

需要說明的是,這里的p實際上是我們估計的p,因此使用如下的符號:

p?=∑xin=∑ni=1xin

假設我們隨機觀察了30個學生的樣本,樣本集為:

{0,0,0,0,0,1,0,0,1,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,1,0,0,1,0}

通過上述的極大似然估計方法,可以求出預估的參數為:

p?=∑ni=1xin=530=0.167

再來看另一個例子:

假定該高校男生的體重呈均值為μ,標準差為σ的正態(tài)分布。我們獲得了隨機采樣10個男學生的體重如下(單位:斤):

序號體重

1115

2122

3130

4127

5149

6160

7152

8138

9149

10180

正態(tài)分布的概率密度函數為:

f(xi;μ,σ2)=1σ2π ̄ ̄ ̄√exp[?(xi?μ)22σ2]

根據上面的定義,似然函數是概率質量函數(離散隨機變量)或概率密度函數(連續(xù)隨機變量)的乘積,因此:

L(μ,σ)=1σn(2π ̄ ̄ ̄√)nexp[?12σ2∑i=1n(xi?μ)2]

我們把上式的似然函數可以看作是參數θ1和θ2的函數,其中:

θ1=μ,θ2=σ2

因此,似然函數可以改寫為:

L(θ1,θ2)=∏i=1nf(xi;θ1,θ2)=θ?n/22(2π)?n/2exp[?12θ2∑i=1n(xi?θ1)2]

而相應的對數似然函數則為:

logL(θ1,θ2)=?n2logθ2?n2log(2π)?∑ni=1(xi?θ1)22θ2

這是一個關于θ1和θ2的二元函數,根據二元函數求極值的方法,先求θ1的偏導數(partial derivative),然后設偏導數為0。我們得到:

?logL(θ1,θ2)?θ1=?2∑ni=1(xi?θ1)2θ2=0

∑i=1n(xi?θ1)=0

∑i=1nxi?nθ1=0

由此我們得到參數θ1的極大似然估計是:

θ1^=μ?=∑ni=1xin=xˉ

現在對θ2求偏導數(partial derivative),然后設偏導數為0。我們得到:

?logL(θ1,θ2)?θ2=?n2θ2+∑ni=1(xi?θ1)22θ22=0

兩邊同時乘以2θ22:

?nθ2+∑i=1n(xi?θ1)2=0

由此得到參數θ2的極大似然估計是:

θ2^=σ?2=∑(xi?θ1)2n=∑(xi?xˉ)2n

概括起來,我們已經求出了均值μ和方差σ2的最大似然估計:

μ?=∑xin=xˉ,σ?2=∑(xi?xˉ)2n

你發(fā)現沒有,這實質上就是教科書中均值和方差的計算公式!

最后我們根據樣本數據,計算μ和方差σ:

μ?=∑xin=142.2,σ?2=∑(xi?xˉ)2n=18.654

于是,我們得到求極大似然估計的一般步驟:

- 根據設定概率模型,寫出聯合概率形式的似然函數

- 對似然函數取對數,并整理

- 求導數或偏導數,并賦值為0

- 求解方程

最后,談談“似然估計”的使用前提:

- 已經假定了概率模型,如二項分布,正態(tài)分布等;

- 已經有了一些觀察結果的集合。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 228,119評論 6 531
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發(fā)現死者居然都...
    沈念sama閱讀 98,382評論 3 415
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事?!?“怎么了?”我有些...
    開封第一講書人閱讀 176,038評論 0 373
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 62,853評論 1 309
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,616評論 6 408
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 55,112評論 1 323
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,192評論 3 441
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,355評論 0 288
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發(fā)現了一具尸體,經...
    沈念sama閱讀 48,869評論 1 334
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,727評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 42,928評論 1 369
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,467評論 5 358
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 44,165評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,570評論 0 26
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,813評論 1 282
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,585評論 3 390
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 47,892評論 2 372

推薦閱讀更多精彩內容

  • 極大似然估計是一種參數估計的方法。先驗概率是 知因求果,后驗概率是 知果求因,極大似然是 知果求最可能的原因。即它...
    不會停的蝸牛閱讀 9,420評論 1 23
  • 極大似然估計和貝葉斯估計是兩種估計模型參數的方法。分別代表了兩種學派的思想。 極大似然估計是概率學派的觀點,其認為...
    codeman_liu閱讀 760評論 0 0
  • 〇、說明 極大似然估計(Maximum Likelihood Estimation,MLE),也稱最大似然估計。統...
    Herbert002閱讀 4,218評論 0 5
  • 【概述】 SVM訓練分類器的方法是尋找到超平面,使正負樣本在超平面的兩側(分類正確性即“分得開”),且樣本到超平面...
    sealaes閱讀 11,107評論 0 7
  • 前些日子和朋友說起現在的95后也開始闖蕩社會了,時間都TM去哪兒了?!是啊,95后的領軍人物也都是2字打頭的年齡了...
    Redfever閱讀 398評論 2 2