學習python一段時間,numpy,pandas,matplotlib等這些包同房在學,經(jīng)常將他們的函數(shù)混淆,所以將之前學過的,和用到過的歸類整理出來,整理知識
一、多維數(shù)組對象
1. 1numpy的多維數(shù)組ndarray
1.1.1 創(chuàng)建數(shù)組
一維數(shù)組:arr1 = np.array([1,2,3,4])
二維數(shù)組:arr2 = np.array([[1,2,3,4],[5,6,7,8]])
查看數(shù)組的維數(shù):arr2.ndim
查看數(shù)組形狀:arr2.shape
查看數(shù)組元素類型:arr2.dtype
1.1.2 其他創(chuàng)建數(shù)組方法:
np.zeros(10)
np.zeros((3,6))
np.empty((2,3,4)) #返回的是一些未初始化的垃圾值
1.1.3 函數(shù)
- array()
- asarray()
- arange()
- ones()/ones_like()
- zeros()/zeros_like()
- empty()/empty_like()
- eye()/identity() # 創(chuàng)建一個正方的N*N單位矩陣(對角線為1,其余為0)
1.2. ndarry的數(shù)據(jù)類型
1.2.1 創(chuàng)建時指定dtype
arr1 = np.array([1, 2, 3,4], dtype = np.float)
1.2.2 使用astype()方法顯式的轉(zhuǎn)換dtype
float_arr = arr.astype(np.float64)
另一種方法:
arr1的數(shù)據(jù)類型為int, arr2的數(shù)據(jù)類型為float
將arr2的數(shù)據(jù)類型轉(zhuǎn)換為和arr1一樣:
arr2.astype(arr1.dtype)
1.3. 數(shù)組和標量之間的運算
1.3.1標量與數(shù)組的運算會傳播到整個數(shù)組
- 大小相同的數(shù)組間的運算會應(yīng)用到元素級
arr = [[1,2,3,4],[5,6,7,8])
arr * arr #對應(yīng)位置數(shù)據(jù)相乘
arr - arr
1/arr
arr**0.5 - 大小不同的數(shù)組間運算叫廣播
1.4 索引和切片
1.4.1 基本索引和切片
- 一維數(shù)組
arr = np.arange(10)
- arr[5]
- arr[5:8]
- arr[5:8] = 12 #切片賦值
!切片得到的是視圖,更改會體現(xiàn)在源數(shù)據(jù)上
eg:
arr_slice = arr[5:8]
arr_slice = 64
對arr_slice賦值,也會體現(xiàn)在arr[5:8]上
!可以進行顯式的復(fù)制操作
eg:arr_slice = arr[5:8].copy()
- 二維數(shù)組
arr2d = np.array([[1,2,3], [4,5,6],[7,8,9]])
- arr2d[2]
- arr2d[0][2]
- 三維數(shù)組
略
1.4.2 切片索引
- arr2d[:2] #沿第0軸切片
- arr2d[:2, 1:]
1.4.3 布爾索引
data 為一個多維數(shù)組
data[[布爾數(shù)組]]
- 布爾數(shù)組用于組索引
- 返回布爾值為1的元素
- 布爾數(shù)組的長度與被索引軸長度一致
1.4.3 花式索引
- 利用整數(shù)數(shù)組進行索引
arr[[1,3,5]]
- 選擇arr數(shù)組的1,3,5行(從0開始)
arr[[-3, -5, -7]]
- 負數(shù)表示從末尾開始選行,倒數(shù)3,5,7行(從1開始)
arr[[1,3,5],[2,4,6]]
- 選擇的是元素(1,2),(3,4),(5,6),得到的是一個一維數(shù)組,而不是一個矩陣
arr[[1,3,5]][:, [2,4,6]]
- 得到1,3,5行的2,4,6列數(shù)據(jù),一個3X3矩陣
- 或者使用函數(shù):np.ix_()
arr[np.ix_([1,3,5],[2,4,6])]
1.5 數(shù)組的轉(zhuǎn)置和軸對換
1.5.1 轉(zhuǎn)置 (返回的是源數(shù)據(jù)視圖)
二維數(shù)組:arr.T#軸對換
高維數(shù)組:arr.transpose((1,0,2))
二、通用函數(shù)
2.1 一元函數(shù)
np.abs()
np.sqrt() # 平方根
np.square() #平方
......
2.2 二元函數(shù)
np.add() # 將數(shù)組對應(yīng)元素相加
np.subtract() # 從第一個數(shù)組中減去第二個數(shù)組中的元素
......
三、利用數(shù)組進行數(shù)據(jù)處理
3.1 將條件邏輯表述為數(shù)據(jù)運算
np.where( cond, x, y)
等價于:x if condition else y
條件為1時返回x, 條件為0時返回y
3.2 數(shù)學和統(tǒng)計方法
- 兩種方法:函數(shù)調(diào)用:np.mean(arr) /對象方法:arr.mean()
- 統(tǒng)計函數(shù):np.sum()、np.std()、np.var().....
- 最小(大)元素索引:np.argmin()/np.argmax()
- 累計和/積:np.cumsum() / cumprod()
3.3 用于布爾型數(shù)組的方法
布爾值會被轉(zhuǎn)換位1,0 ,所以用sum()來對布爾型數(shù)組計數(shù)
- bools.any() 測試數(shù)組中是否存在一個或多個True
- bools.all()數(shù)組中的所有值是否都為True
3.4 排序
多維數(shù)組可以在任何一個軸上進行排序,只需將軸編號傳給sort()
- arr.sort() 就地排序,會改變數(shù)組本身
- np.sort() 頂級方法,返回數(shù)組的副本
3.5 集合邏輯
- np.unique(x) 返回x中的唯一元素,并有序返回結(jié)果
- np.intersect1d(x,y)計算x,y中的公共元素,并返回有序結(jié)果
- union1d(x,y) 計算x,y中的并集,并返回有序結(jié)果
......
四、用于數(shù)組的文件輸入輸出
np.save('文件名', arr) #將arr數(shù)組保存到磁盤上.npy文件
np.load('文件名.npy')
np.savez('file.npz', arr1, arr2)# 多個數(shù)組壓縮保存到一個壓縮文件中
五 線性代數(shù)
np.linalg中有一組標準的矩陣分解運算以及求逆、行列式等
- 矩陣乘法:
x, y 為兩個二矩陣
x.dot(y) 相當于 np.dot(x, y)
......
六、隨機數(shù)生成
np.random模塊對python內(nèi)置的random進行補充
- seed 隨機數(shù)生成器種子
- rand 產(chǎn)生均勻分布的樣本值
- randint 從給定范圍隨機選取整數(shù)
- randn 產(chǎn)生標準正態(tài)分布的樣本值
- normal 產(chǎn)生正態(tài)分布樣本值
- binomial 產(chǎn)生二項分布樣本值