1-6

歡迎回來,在上一講 我們說了我們?nèi)绾问褂脭?shù)據(jù)
讓我們成為(思維)更清晰的思考者在這一講 我們將談?wù)?br> 如何使用模型來處理數(shù)據(jù) 這也是人們使用模型的重要原因
事實(shí)上 當(dāng)你問科學(xué)家們?yōu)槭裁磿褂媚P?不論他們是社會科學(xué)方面的科學(xué)家
還是自然科學(xué)方面的科學(xué)家他們大都會說我們使用
模型是為了更好地利用和理解數(shù)據(jù)
我將從多個方向來闡釋什么是更好地利用和理解數(shù)據(jù) 我想給一些
人們用模型來處理數(shù)據(jù)的特定原因和方法 第一個
實(shí)在的原因是為了理解數(shù)據(jù)里的基本樣式
我需要一個什么樣的例子?你觀察數(shù)據(jù) 它可能剛好是一條
筆直的直線 沒有什么可以變化假如你在觀察系統(tǒng)
系統(tǒng)沒有足夠的能量 我們知道能量不會消失也不會產(chǎn)生
所以能量是一個不變的量 我們有模型可以解釋能量為什么是不變的模型
相對應(yīng)地 我們可以觀察到一些數(shù)據(jù)是一條直線
一條攀升的直線 當(dāng)你有模型 就可以對其作出解釋 我們也
如何在數(shù)據(jù)中看到相應(yīng)的樣式 我們可以看到事物上升
之后緩慢下降 比如經(jīng)濟(jì)周期 我們也有模型可以解釋
一些種類的循環(huán)曲線 我們有一些(圖形)十分尖銳的數(shù)據(jù)
我們也有模型可以解釋它 我們討論了各種各樣
諸如毛球狀數(shù)據(jù),消防水袋狀數(shù)據(jù)數(shù)據(jù) 類型不勝枚舉
數(shù)據(jù)必須有相應(yīng)的樣式 我們能做的就是利用模型
來理解為什么我們觀察到了這種樣式
在基本樣式之外 我們也使用模型預(yù)測特定點(diǎn) 所以假定
你在找個房子 你看到這個房子正在出售
你會想這幢房子會花費(fèi)多少 你可以建一個這樣的模型
房子價格取決于其尺寸 這是房子的尺寸平方英尺
這是價格 我們把美元符號放在那表示
價格 也許你會得到一個線性模型 你的線性模型表明大體上
每增加一平方英尺,房價上漲$100或 $200
在你的模型里你有一個
2,000 平方英尺的房子 找到這一點(diǎn)
$100 每平方英尺 你的模型
估計那個房子$200,000 我們可用簡單的模型來
預(yù)估一棟房子
的價格 這是一個常用模型來建立模型
通過那個模型來預(yù)估某一點(diǎn)的值 模型的第三個原因
其說是預(yù)估點(diǎn)不如說是確立范圍 假設(shè)
你是總統(tǒng)的經(jīng)濟(jì)顧問 不一定你想要這份工作
假設(shè)你是 總統(tǒng)到你這來說
明年或者下個月的通貨膨脹是多少通貨膨脹
變化并不迅速 你也許可以對總統(tǒng)說
我認(rèn)為會是1.2% 你也許相當(dāng)自信會是 1.2%
但是假設(shè)總統(tǒng)說 "我要很長時間段的
預(yù)測 所以十年后的通貨膨脹會是多少
沒人知道十年后的通貨膨脹值 所以你也許會有
相當(dāng)復(fù)雜的模型 但是也不會給你某點(diǎn)的預(yù)測
有很大可能性你會獲得
其值介于0%和3%之間 他會給你一個范圍
你的模型不會告訴你到底會發(fā)生什么 因?yàn)橥话l(fā)事件太多了
這太復(fù)雜了太不確定了
但是 你的模型可能會給你關(guān)于將要發(fā)生事情的一些范圍
那對于制定政策十分有用 理由四
預(yù)測過去 我的意思是你可以使用模型來數(shù)據(jù)模型來預(yù)測過去
預(yù)測過去有很多理由 讓你這么做一個原因是
你也許沒有過去的數(shù)據(jù) 你也許想用模型去計算
我們認(rèn)為的過去是什么樣的
地質(zhì)學(xué)家這么做 生物學(xué)家這么做 人類學(xué)家這么做
考古學(xué)家這么做 他們嘗試著使用模型和數(shù)據(jù)來發(fā)現(xiàn)
溫度過去是什么樣 過去有多少動物
過去的文明是什么樣的 若你有數(shù)據(jù)
你就可以使用數(shù)據(jù)來判斷模型的優(yōu)劣你就可以事實(shí)上回溯數(shù)據(jù)
來判斷實(shí)際上模型是否有效 我解釋一下 現(xiàn)在假設(shè)
我們考察一些數(shù)據(jù)流 也許是就業(yè)率
假定失業(yè)率在一段時間內(nèi)看上去像這個
現(xiàn)在你要做的的是說我們有了一個模型
我們想看這個模型是否可靠 故你要做的就是驗(yàn)證模型
給模型的數(shù)據(jù)到這兒 其符合的很好
在這一點(diǎn) 就在這兒 讓我們看看我們的模型預(yù)測到目前是否可靠
若運(yùn)行模型 它會是這樣的 如果它向那樣
你可以說我們的模型 在過去如果使用該模型
它不會有效 那會讓你合理懷疑
模型現(xiàn)在是否有效 所以回溯 往回推算和測試數(shù)據(jù)
是驗(yàn)證模型是否有效的好方法 理由五
預(yù)測其它事情 你建模可能這樣的原因 假定你
對失業(yè)率很感興趣 你建模
預(yù)測失業(yè)率 但是其中就會牽涉通貨膨脹率
所以你會得到其他的東西這是驗(yàn)證你的模型到底有多強(qiáng)悍的好方法
因?yàn)橥ǔD銥橐患陆藗€模型而這個模型給了你其他東西
還有一種類型預(yù)測 非常酷
當(dāng)建立第一個太陽系模型 日心模型
太陽居中心 所以太陽就在中心
行星繞行 該模型并不十分可靠 人們推測
外面一定有個大行星致使其他行星軌道傾斜
其他行星軌道有點(diǎn)傾斜這個大行星是海王星
人看不到它,但模型預(yù)測它存在 所以模型預(yù)測一些東西
一些其他東西 在數(shù)據(jù)中非常明顯 故模型可以預(yù)測
其他一些東西 在你所預(yù)期可預(yù)見事情以外這確實(shí)很酷
理由六 告知數(shù)據(jù)收集 假定
你對教育系統(tǒng)改革感興趣(這事我感興趣)
你想知道我們?nèi)绾巫寣W(xué)校更好 在上一講
成為思路更清晰的思考者 模型迫使我們
命名相應(yīng)的變量 故我想考慮學(xué)校怎么樣?如何讓學(xué)校更好?
有很多關(guān)于學(xué)校表現(xiàn)的數(shù)據(jù) 故我想要的
是一個模型來解釋為什么一些學(xué)生學(xué)習(xí)差
一些學(xué)習(xí)好 模型的各部分是什么?也許是
諸如教師質(zhì)量(teacher quality) 我們命為TQ 家長情況(parental status)
命為 PS 令尊令堂是否上過大學(xué) 他們是否有高中學(xué)位
他們是醫(yī)生 律師亦或是其他職業(yè) 學(xué)區(qū)的總開支
這個也會有影響 因素諸如
教室尺寸(class size) 命名CS 教室尺寸很可能有大的影響
你也許會說技術(shù)也有影響 教室里面有技術(shù)嗎?
你甚至?xí)f健康也很重要 健康
真的是個重要因素?你甚至?xí)f學(xué)校其他學(xué)生
是什么樣的 同群效應(yīng)怎么樣?其他同學(xué)所做的
產(chǎn)生的影響怎么樣?故若你沒有模型你甚至不知道
要什么樣的數(shù)據(jù) 模型可以讓你知道我們要什么樣的數(shù)據(jù)
什么樣的數(shù)據(jù)應(yīng)該包括 我們應(yīng)該采集什么數(shù)據(jù)
使用模型會十分有用因?yàn)樗嬖V你要采集什么樣的數(shù)據(jù)
最后二個 為什么你的模型有一點(diǎn)不一樣
但是二者又相似 這是我們可以使用數(shù)據(jù)
來讓我們更了解模型 之后我們可以用模型來讓我們更了解世界
我來解釋一下
這些模型讓我們評估
模型中的隱藏參數(shù)這有一個流行病學(xué)經(jīng)典模型
是SIR模型 有三類人
是易感人群 感染人群
和恢復(fù)人群 所以有一種疾病 你可能易感
可能被感染或者恢復(fù) 當(dāng)你恢復(fù)
你就有免疫 你不會再感染 假定
你為疾病預(yù)防中心工作 你看到一些東西 人們
染病 你不知道是不是流感作祟但是
你又不大能確定該病的傳染是怎樣的
是空氣傳播嗎?病毒通過粘液傳播?亦或是其他方式?
你同時不能確定其毒性 所以你不知道
多少人會患病 讓我們畫張簡圖
時間在這個軸 你有患病人數(shù)
你能做的是 你能看到隨著時間的推移
到底多少人染病 如果通過數(shù)據(jù)你可以看到隨時間推移多少人
患病 你可以預(yù)測病毒毒性 諸如
它從一個人傳給另一人有多大可能性 其也可以讓你知道
病毒是像這樣的 還是像那樣的 而且
通過數(shù)據(jù)你可以估計隱藏的參數(shù) 也就是說 病毒毒性多大
你不能通過看數(shù)據(jù)來說一個人比另一個人患病的概率有多大
你也不能通過觀察世界來得到這一概率
但通過觀察有多少人患病 你就可以回溯并估計那個參數(shù)
你可以求得 這確實(shí)很酷 最后一個原因
校準(zhǔn) 校準(zhǔn)指的是建模之后
校準(zhǔn)使它盡可能接近真實(shí)世界 讓我在這給個例子
假設(shè)我想寫個關(guān)于森林火災(zāi)的模型 所以我在這畫了一些難看的樹
一個 二個 我想知道
這個概率
林火從這棵樹跳到這棵樹的概率是多少 它的移動速度多塊 以及
諸如此類之事 我能干什么?我可以獲得的是
如果州政府有數(shù)以千計的有關(guān)過去森林火災(zāi)的數(shù)據(jù)通過過去的數(shù)據(jù) 我可以
校正森林火災(zāi)的真實(shí)模型 其傳播概率多大
他們的傳播速度取決于樹木的干燥程度
當(dāng)?shù)亟邓慷?風(fēng)速強(qiáng)弱 諸如此類
一旦我有所有的數(shù)據(jù) 我就可以算出來
一個特定森林的危險程度 我可以說北新墨西哥州
過去2年都沒有雨水 這是土壤干燥程度 這是樹木干燥程度
這是我們有多少英畝的森林
這是風(fēng)速是多少你可以準(zhǔn)確知道一個特定森林
在特定時間內(nèi)有多危險 故你可以用所有過去的指數(shù)
來校正一個特定模型 你的大模型 之后你可以使用那個模型
來制定政策 這將會是我下一講的內(nèi)容
我們?nèi)绾问褂媚P蛠?決定策略和設(shè)計 東西 謝謝

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 227,572評論 6 531
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 98,071評論 3 414
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 175,409評論 0 373
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經(jīng)常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 62,569評論 1 307
  • 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 71,360評論 6 404
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 54,895評論 1 321
  • 那天,我揣著相機(jī)與錄音,去河邊找鬼。 笑死,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 42,979評論 3 440
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 42,123評論 0 286
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 48,643評論 1 333
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 40,559評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 42,742評論 1 369
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,250評論 5 356
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 43,981評論 3 346
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,363評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,622評論 1 280
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,354評論 3 390
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 47,707評論 2 370

推薦閱讀更多精彩內(nèi)容