定量分析課程筆記

寫在前面

周末在清華MEM連上了2天定量分析課程,感覺受益頗深。定量分析是有一套系統化的、嚴謹的方法去挖掘數據的內在關系、并通過嚴謹的檢驗方法來印證最初的假設、最終發現新的現實規律來指導后續的工作。也就是一個從數據(事實)中獲取信息(知識)的過程。


MINITAB

一個統計分析軟件,使我們做數據定量分析的主要工具,可以借助它來幫助我們描述數據、探索數據的關聯、最終檢驗(確定)這種關聯。有30天試用期。


箱線圖Box-Plot

箱線圖從上到下的幾個點分別為:max(最大值)、1st quarter(四分位數)、median(中位數)、3rd quarter(四分位數)、min(最小值),可能還會包含工具幫我們識別出來的singular point(奇異點)。圖形有點類似K線,但是表示的意義不一樣。如果按照箱線圖的規則去定義K線或許能讓投資者了解到交易價格的分布,而不是僅僅關注價格。

使用場景:給定了幾個不同品牌地毯耐用度(平均壽命)的測量數據,如何去判斷哪種比較耐用呢?箱線圖可以幫助我們直觀的感受幾組數據,比單單從平均值來判斷更加全面

4種地毯使用壽命的箱線圖

minitab中的位置:圖形->箱線圖


直方圖Histogram&正態分布

直方圖很早就一直在接觸,能夠反映樣本值在不同區間的分布情況。我們可以把它用在判別給定數據是否符合正態分布上。現實生活中很多東西都是符合正態分布的,結合直方圖,我們通過觀察可以識別數據中的一些問題。

使用場景:課上有這樣一個例子,一個科學家懷疑一家面包店偷工減料,這家面包店聲稱自己用20直徑的模具做面包。科學家采集了一定量的數據,發現平均值明顯小于20,于是找到了面包師,面包師不服,要求重新取樣來統計,第二次的平均值超過了20。

分別把兩次數據的制作成直方圖來看,發現第一次的數據基本符合正態分布 ,而第二次的數據像是正態分布的右半段。推測:面包師很可能對第二次的數據做了手腳,把直徑大于20的面包單獨挑了出來。

前后兩次面包直徑頻率直方圖

minitab中的位置:圖形->直方圖


正態性檢驗

除了直接從直方圖中觀察數據是否符合正態分布,我們也可以借助minitab的正態性檢驗來做。

使用場景:人工降雨是否有效?隨機選取了52片云彩,26次實施人工降雨、26次不實施。分別記錄降雨量,用箱線圖和直方圖來看,可以大概看出人工降雨會有一些優勢。

人工降雨與非人工降雨的比較
非人工降雨
人工降雨

為了更加深入發掘降雨量的規律,我們先對兩組數據分別進行正態性檢驗

非人工降雨正態性檢驗
人工降雨正態性檢驗

圖上可以看到,兩組數據正態分布的假設p值都<.005,假設不可信。兩組數據都不符合正態分布。

minitab中的位置:統計->基本統計量->正態性檢驗


Box-Cox變換

Box-Cox變換是統計建模中常用的一種數據變換,用于連續的響應變量不滿足正態分布的情況。Box-Cox變換,變換之后,可以一定程度上減小不可觀測的誤差和預測變量的相關性。我的理解是這樣的:真實世界中的很多誤差(殘差)都是遵循正態概率分布的,但是我們在觀測計量某種數據的時候是在用人類文明發展過程中創造出來的單位(尺度)來度量,最終數據按照人所方便理解的形式被測量出來,但這兩者其實有某種數學上的聯系。Box-Cox變換就是試圖找到這種聯系。

Box-Cox轉換公式

還是上面人工降雨的例子,Box-Cox分析圖如下。可以看出95%置信區間在-0.08到0.17之間,這里可以用0取整。代入上面公式,可以用log來做變換。

人工降雨案例Box-Cox圖

經過變換后P值較大,無法拒絕兩組數據符合正態分布的假設。

ln(Unseeded_Clouds)正態性檢驗
ln(Seeded_Clouds)正態性檢驗

這個時候我們再用箱線圖去比較兩組數據,會更加的清晰和直觀。

Box-Cox變換后的箱線圖

minitab中的位置:統計->控制圖->Box-Cox變換。


結語

今天就先寫這些,因果關系的論證、假設檢驗以及回歸分析與預測的一些方法,后面再總結。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 227,967評論 6 531
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,273評論 3 415
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 175,870評論 0 373
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 62,742評論 1 309
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,527評論 6 407
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 55,010評論 1 322
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,108評論 3 440
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,250評論 0 288
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 48,769評論 1 333
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,656評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 42,853評論 1 369
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,371評論 5 358
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,103評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,472評論 0 26
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,717評論 1 281
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,487評論 3 390
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 47,815評論 2 372

推薦閱讀更多精彩內容