1.Python包的導入
* 貌似 jupyter 有種方法可以不用導入 matplotlib.pyplot 就可以實現圖形的展示,待研究
補充說明:
1.可以使用%matplotlib inline
2.stock.plt() 為 pandas 內置作圖函數
2.讀取本地數據庫,解析index,并指定“Date”為本數據庫的索引
3.查看數據,一共有4種方法:
stock -- 查看全量數據(當數據量過大時,中間會用“...”隱藏)
stock.head() -- 默認查看前5行數據,增加參數后可自定義查看行數
stock.tail() -- 默認查看逆序5行數據,增加參數后可自定義查看行數
stock.info() -- 以參數值方式查看數據庫
4.計算基礎統計值
通過 stock.describe()可以輸出 計數、均值、標準差、最大/最小值、1/4、1/2、3/4位值
5.通過 matplotlib 繪圖(pandas默認將索引作為 X 軸)
默認出全量數據 stock.plot() ,可通過定義Y軸 stock.plot(y = 'Open') 指定出圖字段
6.索引和切片,三種方式:
(1)使用[]
stock["Close"] -- 讀取全量 Close 列表
stock["Close"]['2017-06-01'] -- 讀取指定索引 Close 列表
(2)使用 .loc[]
stock.loc['2017-06-01','Close'] -- 讀取指定索引 Close 列表
stock.loc['2017-06-01':'2017-06-05','Close'] -- 讀取指定索引區間 Close 列表
(3)使用 .iloc[]
stock.iloc[0,3] -- 讀取第0行3列值
stock.iloc[0:2,0:3] -- -- 讀取第0-2行0-3列值
(4)另一種通過命令方式讀取全量數據方法
7.過濾
8.生成新列