寫給所有人的極簡統(tǒng)計學
永野裕之
23個想法
圖表
>> 那就是圖表繪制者可以(在某種程度上)改變讀者對數(shù)據(jù)變化程度的印象。
>> 柱狀圖也可以通過在圖表中的數(shù)值間隔上“下功夫”,改變讀者的印象。
>> 餅狀圖一般從時鐘的12點位置開始,按照比例從大到小的順序?qū)⒏鱾€項目進行排序。
>> 帶狀圖通常用于根據(jù)年份等條件,比較同一項目的占比變化情況。
數(shù)據(jù)與變量
>> 離散型數(shù)據(jù)”是指兩個相鄰的項之間沒有可取值的數(shù)據(jù)。
代表值
>> 中位數(shù):將數(shù)據(jù)由大到小排列時,位于最中間的數(shù)值。
>> 數(shù)據(jù)存在偏離值(與其他數(shù)值相比,很明顯偏大或偏小的值)的情況,平均值會因為偏離值的影響偏大或偏小。在這種情況下,更多時候會使用更加適合的中位數(shù)來代替平均數(shù),作為數(shù)據(jù)的代表值。
>> 眾數(shù):一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)值。
研究數(shù)據(jù)的離散性
>> 數(shù)據(jù)的離散性
>> 方差和標準差
>> 四分位數(shù)是指,將數(shù)據(jù)從小到大排列并分成4等份后,處于3個分割點上的數(shù)。這3個四分位數(shù)按照從小到大的順序分別被稱為第一四分位數(shù)、第二四分位數(shù)和第三四分位數(shù)。
箱形圖
>> 我們可以將5大要數(shù)列出來,制成箱形圖。
>> [插圖]
>> 被5大要數(shù)切分成的各區(qū)間,各包含了整體數(shù)據(jù)值的約25%,若每個區(qū)間的長度均等,則意味著數(shù)據(jù)整體的離散性是均勻的。反之,若各區(qū)間長度不均,則表明數(shù)據(jù)的離散程度有所偏離。
在統(tǒng)計學中的應用
>> 四分位數(shù)以及將其圖表化的箱形圖等,用于表示數(shù)據(jù)離散程度的知識點。
>> 四分位數(shù)與箱形圖都是以中位數(shù)為基準來表示數(shù)據(jù)離散程度的。
>> 方差與標準差等值是以平均數(shù)為基準來表示數(shù)據(jù)離散程度的。
方差
>> 這種以平均數(shù)為基準,“(與平均數(shù)的差)2的平均數(shù)”被稱作方差。
點位圖
>> 矩形圖與箱形圖,適用于針對單變量數(shù)據(jù)加以整理,并表示其傾向特征的圖像
>> 要抓住兩個變量之間的傾向特征,就必須要用到別的圖表,這就是點位圖(又稱散布圖)。
>> 對于從所有數(shù)據(jù)的一部分標本(樣本)中得出的結果,其是否可
>> 以代表所有數(shù)據(jù)特征的方法被稱作“推測統(tǒng)計”。
相關系數(shù)
>> 表示相關關系的正負與強弱的數(shù)值,這就是相關系數(shù)。