python入門掙扎指南 - 安裝及直方圖

小白上路掙扎指南:

  1. 安裝anaconda,詳見簡書余欣博士文章 ,安裝過程中涉及的如在哪輸入命令行等問題,還可參閱唐瑟同學的這篇入門分享
  2. 安裝Jupyter notebook,詳見簡書余欣博士文章,關于安裝了Python 2環境后,如何在Jupyter notebook中實現的問題,參考這篇文章,如1中所述安裝好py2環境后,activate py2,之后輸入conda install notebook ipykernel,進一步選y,最后ipython kernel install --user,即可在jupyter notebook中選擇py2的環境了。
    Paste_Image.png
  3. 啟動Jupyter notebook
  4. 加載Python包
import pandas as pd #導入pandas包,命名為pd。
import numpy as np #導入numpy,命名為np。
import matplotlib.pyplot as plt #導入matplotlib.pyplot,命名為plt。
from scipy import stats #從scipy導入stats 
  1. 導入數據
weight_data = pd.read_table('weight.txt') #用pd讀取文件,命名為weight_data
weight_data.shape    # 展示DataFrame的維度
  1. 數據處理
weight_data['weight'].mean() #求均值
weight_data['weight'].var() #求方差
  1. 數據可視化
fig = plt.figure() #創造畫布fig
plt.rcParams["font.family"] = "SimHei" #修改默認字體,以正確顯示中文(參考自小密圈中@木子 同學的分享)
x = weight_data['weight'] #以x代表weight_data表中weight欄
ax = fig.add_subplot(111) #將分為1*1的畫布上自左向右自上向下第1格畫圖命名為ax,若改為234,即將畫布分為2*3的格子,在第4格子填入ax
numBins = 10 #柱的數目(最終將生成此數+1的edge),此處亦可輸入[0,40,50,90],定制尺度的分布
ax.hist(x,numBins,color='blue',alpha=0.2) #alpha是透明度設置
plt.title(u'體重直方圖') #設置繪圖標題 
plt.show() #展示圖

結果展示:

體重文件的數據分析及展示部分

數據特征:眾數落在40~50,小于平均值50.7,是右偏的。體重較高的會和大多數眾數差得比較遠。

附加:讀取csv文件

先看看表中文件的具體樣式
進一步的數據處理及可視化

數據特征:依然是一個右偏分布,極大值偏離很遠,這對航空運力是很大的挑戰,峰值管理并不好做,運力峰值和日常運力的協調應該會比較難。

包的介紹

pandas,全稱Python Data Analysis Librarylist,是基于NumPy 的一種工具,該工具是為了解決數據分析任務而創建的。Pandas 納入了大量庫和一些標準的數據模型,提供了高效地操作大型數據集所需的工具。Pandas最初被作為金融數據分析工具而開發出來,因此,pandas為時間序列分析提供了很好的支持。 Pandas的名稱來自于面板數據(panel data)和python數據分析(data analysis)。

NumPy,全稱Numeric Python,是Python的一種開源的數值計算擴展。可用來存儲和處理大型矩陣,比Python自身的嵌套列表結構要高效,因array只能由存儲相同的數據類型,利用內存更高效。同時numpy跟C/C++和Fortran代碼的工具包可通融。numpy和稀疏矩陣運算包scipy配合更佳方便。

Matplotlib是一個 Python 的 2D繪圖庫,它以各種硬拷貝格式和跨平臺的交互式環境生成出版質量級別的圖形。可以方便地生成繪圖,直方圖,功率譜,條形圖,錯誤圖,散點圖等。matplotlib的pyplot子庫提供了和matlab類似的繪圖API,方便用戶快速繪制2D圖表。matplotlib.pyplot是命令行式函數的集合,每一個函數都對圖像作了修改,比如創建圖形,在圖像上創建畫圖區域,在畫圖區域上畫線,在線上標注等。

SciPy函數庫在NumPy庫的基礎上增加了眾多的數學、科學以及工程計算中常用的庫函數。例如線性代數、常微分方程數值求解、信號處理、圖像處理、稀疏矩陣等等。

help()和dir()

method的查詢,比如dir(list),會把list的所有方法列出,help(list.append)可以查看具體的。設a=abc.def,則help(a)亦可查詢幫助。
導入包的情況,若查詢類型是pandas.core.frame.DataFrame,但已經導入為pd,則help文件使用時也需在type部分寫為pd,如help(pd.core.frame.DataFrame.shape),或者可以直接在瀏覽器搜索panda shape也可。

import和from import

import xx導入模塊對于模塊中的函數,每次調用需要“模塊.函數”來用。
from xx import fun 直接導入模塊中某函數,直接fun()就可用。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 227,401評論 6 531
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,011評論 3 413
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 175,263評論 0 373
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 62,543評論 1 307
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,323評論 6 404
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 54,874評論 1 321
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 42,968評論 3 439
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,095評論 0 286
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 48,605評論 1 331
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,551評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 42,720評論 1 369
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,242評論 5 355
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 43,961評論 3 345
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,358評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,612評論 1 280
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,330評論 3 390
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 47,690評論 2 370

推薦閱讀更多精彩內容