伯克松悖論
醫(yī)學(xué)統(tǒng)計(jì)中的一種偏差
伯克松悖論是醫(yī)學(xué)統(tǒng)計(jì)中的一種偏差。當(dāng)不同個(gè)體被納入研究樣本的機(jī)會(huì)不同時(shí),研究樣本中的兩個(gè)變量 X 和 Y 表現(xiàn)出統(tǒng)計(jì)相關(guān),而總體中 X 和 Y 卻不存在這種相關(guān)性。這一現(xiàn)象便是伯克松悖論。
伯克森悖論是美國醫(yī)生和統(tǒng)計(jì)學(xué)家約瑟夫·伯克森在 1946 年提出的一個(gè)問題。他研究了一個(gè)醫(yī)院中患有糖尿病的病人和患有膽囊炎的病人,結(jié)果發(fā)現(xiàn)患有糖尿病的人群中,同時(shí)患膽囊炎人數(shù)較少;而沒有糖尿病的人群中,患膽囊炎的人數(shù)比例較高。這似乎說明患有糖尿病可以保護(hù)病人不受到膽囊炎的折磨,但是從醫(yī)學(xué)上講無法證明糖尿病能對(duì)膽囊炎起到任何保護(hù)作用。他將這個(gè)研究寫成了論文《用四格表分析醫(yī)院數(shù)據(jù)的局限性》,并發(fā)表在雜志《生物學(xué)公報(bào)》上,這個(gè)問題就稱為伯克森悖論。
伯克森悖論產(chǎn)生的最主要原因是:文章中統(tǒng)計(jì)的患者都是醫(yī)院的病人,從而忽略了那些沒有住院的人。
分析
為了簡(jiǎn)化起見,我們假設(shè)這個(gè)醫(yī)院只治療兩種疾病:糖尿病和膽囊炎。然后畫一個(gè)平面直角坐標(biāo)系:橫坐標(biāo)表示他患有糖尿病的嚴(yán)重程度,縱軸表示患有膽囊炎的嚴(yán)重程度,再把每一個(gè)人按照兩種疾病的輕重畫在坐標(biāo)系中。
伯克森悖論
如果我們對(duì)全體人群進(jìn)行統(tǒng)計(jì),就會(huì)發(fā)現(xiàn)糖尿病和膽囊炎并沒有相關(guān)性。但是如果只對(duì)醫(yī)院中的患者進(jìn)行統(tǒng)計(jì),就會(huì)出問題。如果病人的糖尿病或者膽囊炎問題比較輕,病人就不需要住院,所以也不會(huì)被統(tǒng)計(jì)到。來到醫(yī)院的病人要么是糖尿病,要么是膽囊炎,要么二者兼有。所以,我們需要把圖像左下方的點(diǎn)都去掉,他們不在我們統(tǒng)計(jì)的范圍內(nèi),我們只會(huì)統(tǒng)計(jì)到這條線右上方的點(diǎn)。這回糖尿病和膽囊炎就表現(xiàn)出負(fù)相關(guān)了。不患有糖尿病的人,更有可能患有膽囊炎,而患有糖尿病的人,膽囊炎的比例就會(huì)下降了。
可見伯克森悖論是一種統(tǒng)計(jì)偏差,因?yàn)槲覀兒雎粤松眢w健康而沒有入院的人,只在醫(yī)院的病人中進(jìn)行統(tǒng)計(jì),這些病人一定患有這樣或者那樣的疾病。所以,如果患者沒有糖尿病,那么就一定患有其他疾病,比如膽囊炎,這就形成了糖尿病與膽囊炎負(fù)相關(guān)的假象。