作業一飛機乘客
從兩個方面對這組數據進行分析:
1)計算每年的飛機乘客數據,然后進行分析
作業代碼及具體過程:
數據分析:
計算出每年的乘客數量,可以從直方圖中得出:1)數據在1600~2100,以及2300~2800這兩個區間最多,數量各位3個;2)數據在人數較少的區間和人數較多的區間集中,而在中間區間較少,呈現出一定的不均勻性;3)從得出的數據來看,乘客數量呈現逐年增長的趨勢(從data_b中得出);4)計算出每年的數據后,不太適合通過直方圖分析(數據量太少),除此外,還讀取不出其人數隨著時間的一個變化情況,此時通過折線圖或許更利于數據分析。
2)直接對原始數據進行分析
作業代碼及具體過程:
分別將組數修改為15,20,其計算結果如下:
數據分析:
1)隨著組數的增加,觀察到的數據的細節更為豐富,但是也增加了對規律的把握;2)人數在100至200的三個區間和350到370的區間內的月數出現的最多;3)人數大于450的月數比較少,低于三次。
作業二 ?體重數據分析
代碼及具體過程:
數據分析:
1)體重主要集中在45~50這個區間,其頻次均超過了10;2)少于43以及大于57的數據很少,其頻次少于4;3)增加組數可以展現出數據更為豐富的特征,但是太復雜不利于我們去進行數據分析——合理的選擇組數很重要。