NumPy說明

NumPy是Python中關(guān)于科學(xué)計算的一個類庫,在這里簡單介紹一下。

來源:https://docs.scipy.org/doc/numpy-dev/user/quickstart.html

基礎(chǔ)篇

NumPy的主要對象是同種元素的多維數(shù)組。這是一個所有的元素都是一種類型、通過一個正整數(shù)元組索引的元素表格(通常是元素是數(shù)字)。在NumPy中維度(dimensions)叫做軸(axes),軸的個數(shù)叫做秩(rank)。

例如,在3D空間一個點的坐標[1, 2, 3]是一個秩為1的數(shù)組,因為它只有一個軸。那個軸長度為3.又例如,在以下例子中,數(shù)組的秩為2(它有兩個維度).第一個維度長度為2,第二個維度長度為3.

[[1.,0.,0.], [0.,1.,2.]]

NumPy的數(shù)組類被稱作ndarray。通常被稱作數(shù)組。注意numpy.array和標準Python庫類array.array并不相同,后者只處理一維數(shù)組和提供少量功能。更多重要ndarray對象屬性有:

ndarray.ndim

數(shù)組軸的個數(shù),在python的世界中,軸的個數(shù)被稱作秩

ndarray.shape

數(shù)組的維度。這是一個指示數(shù)組在每個維度上大小的整數(shù)元組。例如一個n排m列的矩陣,它的shape屬性將是(2,3),這個元組的長度顯然是秩,即維度或者ndim屬性

ndarray.size

數(shù)組元素的總個數(shù),等于shape屬性中元組元素的乘積。

ndarray.dtype

一個用來描述數(shù)組中元素類型的對象,可以通過創(chuàng)造或指定dtype使用標準Python類型。另外NumPy提供它自己的數(shù)據(jù)類型。

ndarray.itemsize

數(shù)組中每個元素的字節(jié)大小。例如,一個元素類型為float64的數(shù)組itemsiz屬性值為8(=64/8),又如,一個元素類型為complex32的數(shù)組item屬性為4(=32/8).

ndarray.data

包含實際數(shù)組元素的緩沖區(qū),通常我們不需要使用這個屬性,因為我們總是通過索引來使用數(shù)組中的元素。

一個例子1

>>> from numpy ?import *

>>> a = arange(15).reshape(3,5)

>>> aarray([[0,1,2,3,4], ? ? ? [5,6,7,8,9], ? ? ? [10,11,12,13,14]])

>>> a.shape(3,5)

>>> a.ndim2

>>> a.dtype.name'int32'

>>> a.itemsize4

>>> a.size15

>>> type(a)numpy.ndarray

>>> b = array([6,7,8])

>>> barray([6,7,8])

>>> type(b)numpy.ndarray

創(chuàng)建數(shù)組

有好幾種創(chuàng)建數(shù)組的方法。

例如,你可以使用array函數(shù)從常規(guī)的Python列表和元組創(chuàng)造數(shù)組。所創(chuàng)建的數(shù)組類型由原序列中的元素類型推導(dǎo)而來。

>>> from numpy ?import *

>>> a = array( [2,3,4] )

>>> aarray([2,3,4])

>>> a.dtypedtype('int32')

>>> b = array([1.2,3.5,5.1])

>>> b.dtypedtype('float64') ?一個常見的錯誤包括用多個數(shù)值參數(shù)調(diào)用`array`而不是提供一個由數(shù)值組成的列表作為一個參數(shù)。

>>> a = array(1,2,3,4)# WRONG

>>> a = array([1,2,3,4])# RIGHT

數(shù)組將序列包含序列轉(zhuǎn)化成二維的數(shù)組,序列包含序列包含序列轉(zhuǎn)化成三維數(shù)組等等。

>>> b = array( [ (1.5,2,3), (4,5,6) ] )>>> barray([[ 1.5, ?2. , ?3. ],

[ 4. , ?5. , ?6. ]])

數(shù)組類型可以在創(chuàng)建時顯示指定

>>> c = array( [ [1,2], [3,4] ], dtype=complex )

>>> carray([[ 1.+0.j, ?2.+0.j],

[ 3.+0.j, ?4.+0.j]])

通常,數(shù)組的元素開始都是未知的,但是它的大小已知。因此,NumPy提供了一些使用占位符創(chuàng)建數(shù)組的函數(shù)。這最小化了擴展數(shù)組的需要和高昂的運算代價。

函數(shù)function創(chuàng)建一個全是0的數(shù)組,函數(shù)ones創(chuàng)建一個全1的數(shù)組,函數(shù)empty創(chuàng)建一個內(nèi)容隨機并且依賴與內(nèi)存狀態(tài)的數(shù)組。默認創(chuàng)建的數(shù)組類型(dtype)都是float64。

>>> zeros( (3,4) )array([[0., ?0., ?0., ?0.],

[0., ?0., ?0., ?0.],

[0., ?0., ?0., ?0.]])

>>> ones( (2,3,4), dtype=int16 ) ? ? ? ? ? ? ? ?# dtype can also be specifiedarray([[[ 1, 1, 1, 1],

[ 1, 1, 1, 1],

[ 1, 1, 1, 1]],[[ 1, 1, 1, 1],

[ 1, 1, 1, 1],

[ 1, 1, 1, 1]]], dtype=int16)

>>> empty( (2,3) )array([[ ?3.73603959e-262, ? 6.02658058e-154, ? 6.55490914e-260],

[ ?5.30498948e-313, ? 3.14673309e-307, ? 1.00000000e+000]])

為了創(chuàng)建一個數(shù)列,NumPy提供一個類似arange的函數(shù)返回數(shù)組而不是列表:

>>> arange(10,30,5)array([10,15,20,25])

>>> arange(0,2,0.3)# it accepts float argumentsarray([0. ,0.3,0.6,0.9,1.2,1.5,1.8])

當arange使用浮點數(shù)參數(shù)時,由于有限的浮點數(shù)精度,通常無法預(yù)測獲得的元素個數(shù)。因此,最好使用函數(shù)linspace去接收我們想要的元素個數(shù)來代替用range來指定步長。

其它函數(shù)array, zeros, zeros_like, ones, ones_like, empty, empty_like, arange, linspace, rand, randn, fromfunction, fromfile參考:NumPy示例

打印數(shù)組

當你打印一個數(shù)組,NumPy以類似嵌套列表的形式顯示它,但是呈以下布局:

最后的軸從左到右打印

次后的軸從頂向下打印

剩下的軸從頂向下打印,每個切片通過一個空行與下一個隔開

一維數(shù)組被打印成行,二維數(shù)組成矩陣,三維數(shù)組成矩陣列表。

>>> a = arange(6) ? ? ?#1d array

>>>printa[012345]

>>> b = arange(12).reshape(4,3) ? ? ? ? ? #2d array

>>>printb[[ 0 ?1 ?2]

[ 3 ?4 ?5]

[ 6 ?7 ?8]

[ 9 10 11]]

>>>>>> c = arange(24).reshape(2,3,4) ? ? ? ? #3d array

>>>printc[[[ 0 ?1 ?2 ?3]

[ 4 ?5 ?6 ?7]

[ 8 ?9 10 11]][[12 13 14 15]

[16 17 18 19]

[20 21 22 23]]]

查看形狀操作一節(jié)獲得有關(guān)reshape的更多細節(jié)

如果一個數(shù)組用來打印太大了,NumPy自動省略中間部分而只打印角落

>>>printarange(10000)[ ? 0 ? ?1 ? ?2 ..., 9997 9998 9999]>>>>>>printarange(10000).reshape(100,100)[[ ? 0 ? ?1 ? ?2 ..., ? 97 ? 98 ? 99][ 100 ?101 ?102 ..., ?197 ?198 ?199][ 200 ?201 ?202 ..., ?297 ?298 ?299]...,[9700 9701 9702 ..., 9797 9798 9799][9800 9801 9802 ..., 9897 9898 9899][9900 9901 9902 ..., 9997 9998 9999]]

禁用NumPy的這種行為并強制打印整個數(shù)組,你可以設(shè)置printoptions參數(shù)來更改打印選項。

>>> set_printoptions(threshold='nan')

基本運算

數(shù)組的算術(shù)運算是按元素的。新的數(shù)組被創(chuàng)建并且被結(jié)果填充。

>>> a = array( [20,30,40,50] )>>> b = arange(4)>>> barray([0,1,2,3])>>> c = a-b>>> carray([20,29,38,47])>>> b**2array([0,1,4,9])>>>10*sin(a)array([9.12945251, -9.88031624,7.4511316, -2.62374854])>>> a<35array([True, True, False, False], dtype=bool)

不像許多矩陣語言,NumPy中的乘法運算符*指示按元素計算,矩陣乘法可以使用dot函數(shù)或創(chuàng)建矩陣對象實現(xiàn)(參見教程中的矩陣章節(jié))

>>> A = array([[1,1],

... ? ? ? ? ? ? [0,1]])>>> B = array([[2,0],

... ? ? ? ? ? ? [3,4]])>>> A*B ? ? ? ? ? ? ? ? ? ? ? ? # elementwise productarray([[2, 0],

[0, 4]])>>> dot(A,B) ? ? ? ? ? ? ? ? ? ?# matrix productarray([[5, 4],

[3, 4]])

有些操作符像+=和*=被用來更改已存在數(shù)組而不創(chuàng)建一個新的數(shù)組。

>>> a = ones((2,3), dtype=int)>>> b = random.random((2,3))>>> a *=3>>> aarray([[3,3,3], ? ? ? [3,3,3]])>>> b += a>>> barray([[3.69092703,3.8324276,3.0114541], ? ? ? [3.18679111,3.3039349,3.37600289]])>>> a += b# b is converted to integer type>>> aarray([[6,6,6], ? ? ? [6,6,6]])

當運算的是不同類型的數(shù)組時,結(jié)果數(shù)組和更普遍和精確的已知(這種行為叫做upcast)。

>>> a = ones(3, dtype=int32)>>> b = linspace(0,pi,3)>>> b.dtype.name'float64'>>> c = a+b>>> carray([1. ? ? ? ?,2.57079633,4.14159265])>>> c.dtype.name'float64'>>> d = exp(c*1j)>>> darray([0.54030231+0.84147098j, -0.84147098+0.54030231j, ? ? ? -0.54030231-0.84147098j])>>> d.dtype.name'complex128'許多非數(shù)組運算,如計算數(shù)組所有元素之和,被作為ndarray類的方法實現(xiàn)>>> a = random.random((2,3))>>> aarray([[0.6903007,0.39168346,0.16524769], ? ? ? [0.48819875,0.77188505,0.94792155]])>>> a.sum()3.4552372100521485>>> a.min()0.16524768654743593>>> a.max()0.9479215542670073

這些運算默認應(yīng)用到數(shù)組好像它就是一個數(shù)字組成的列表,無關(guān)數(shù)組的形狀。然而,指定axis參數(shù)你可以吧運算應(yīng)用到數(shù)組指定的軸上:

>>> b = arange(12).reshape(3,4)>>> barray([[0,1,2,3], ? ? ? [4,5,6,7], ? ? ? [8,9,10,11]])>>>>>> b.sum(axis=0)# sum of each columnarray([12,15,18,21])>>>>>> b.min(axis=1)# min of each rowarray([0,4,8])>>>>>> b.cumsum(axis=1)# cumulative sum along each rowarray([[0,1,3,6], ? ? ? [4,9,15,22], ? ? ? [8,17,27,38]])

通用函數(shù)(ufunc)

NumPy提供常見的數(shù)學(xué)函數(shù)如sin,cos和exp。在NumPy中,這些叫作“通用函數(shù)”(ufunc)。在NumPy里這些函數(shù)作用按數(shù)組的元素運算,產(chǎn)生一個數(shù)組作為輸出。

>>> B = arange(3)>>> Barray([0,1,2])>>> exp(B)array([1. ? ? ? ?,2.71828183,7.3890561])>>> sqrt(B)array([0. ? ? ? ?,1. ? ? ? ?,1.41421356])>>> C = array([2., -1.,4.])>>> add(B, C)array([2.,0.,6.])

更多函數(shù)all, alltrue, any, apply along axis, argmax, argmin, argsort, average, bincount, ceil, clip, conj, conjugate, corrcoef, cov, cross, cumprod, cumsum, diff, dot, floor, inner, inv, lexsort, max, maximum, mean, median, min, minimum, nonzero, outer, prod, re, round, sometrue, sort, std, sum, trace, transpose, var, vdot, vectorize, where 參見:NumPy示例

索引,切片和迭代

一維數(shù)組可以被索引、切片和迭代,就像列表和其它Python序列。

>>> a = arange(10)**3>>> aarray([0,1,8,27,64,125,216,343,512,729])>>> a[2]8>>> a[2:5]array([8,27,64])>>> a[:6:2] = -1000# equivalent to a[0:6:2] = -1000; from start to position 6, exclusive, set every 2nd element to -1000>>> aarray([-1000,1, -1000,27, -1000,125,216,343,512,729])>>> a[ ::-1]# reversed aarray([729,512,343,216,125, -1000,27, -1000,1, -1000])>>> for i ina:... ? ? ? ? print i**(1/3.),...nan1.0nan3.0nan5.06.07.08.09.0

多維數(shù)組可以每個軸有一個索引。這些索引由一個逗號分割的元組給出。

>>>deff(x,y):...return10*x+y...>>>b = fromfunction(f,(5,4),dtype=int)>>>barray([[0,1,2,3], ? ? ? [10,11,12,13], ? ? ? [20,21,22,23], ? ? ? [30,31,32,33], ? ? ? [40,41,42,43]])>>>b[2,3]23>>>b[0:5,1]# each row in the second column of barray([1,11,21,31,41])>>>b[ : ,1]# equivalent to the previous examplearray([1,11,21,31,41])>>>b[1:3, : ]# each column in the second and third row of barray([[10,11,12,13], ? ? ? [20,21,22,23]])

當少于軸數(shù)的索引被提供時,確失的索引被認為是整個切片:

>>> b[-1]# the last row. Equivalent to b[-1,:]array([40,41,42,43])

b[i]中括號中的表達式被當作i和一系列:,來代表剩下的軸。NumPy也允許你使用“點”像b[i,...]。

點(…)代表許多產(chǎn)生一個完整的索引元組必要的分號。如果x是秩為5的數(shù)組(即它有5個軸),那么:

x[1,2,…] 等同于 x[1,2,:,:,:],

x[…,3] 等同于 x[:,:,:,:,3]

x[4,…,5,:] 等同 x[4,:,:,5,:].

>>>c=array([[[0,1,2],# a 3D array (two stacked 2D arrays)...[10,12,13]],......[[100,101,102],...[110,112,113]]])>>>c.shape(2,2,3)>>>c[1,...]# same as c[1,:,:]orc[1]array([[100,101,102],[110,112,113]])>>>c[...,2]# same as c[:,:,2]array([[2,13],[102,113]])

迭代多維數(shù)組是就第一個軸而言的:2

>>>forrowinb:...printrow...[0 1 2 3][10 11 12 13][20 21 22 23][30 31 32 33][40 41 42 43]

然而,如果一個人想對每個數(shù)組中元素進行運算,我們可以使用flat屬性,該屬性是數(shù)組元素的一個迭代器:

>>>forelementinb.flat:...printelement,...012310111213202122233031323340414243

更多[], …, newaxis, ndenumerate, indices, index exp 參考NumPy示例

形狀操作

更改數(shù)組的形狀

一個數(shù)組的形狀由它每個軸上的元素個數(shù)給出:

>>> a = floor(10*random.random((3,4)))>>> aarray([[7.,5.,9.,3.], ? ? ? [7.,2.,7.,8.], ? ? ? [6.,8.,3.,2.]])>>> a.shape(3,4)

一個數(shù)組的形狀可以被多種命令修改:

>>> a.ravel()# flatten the arrayarray([7.,5.,9.,3.,7.,2.,7.,8.,6.,8.,3.,2.])>>> a.shape = (6,2)>>> a.transpose()array([[7.,9.,7.,7.,6.,3.], ? ? ? [5.,3.,2.,8.,8.,2.]])

由ravel()展平的數(shù)組元素的順序通常是“C風(fēng)格”的,就是說,最右邊的索引變化得最快,所以元素a[0,0]之后是a[0,1]。如果數(shù)組被改變形狀(reshape)成其它形狀,數(shù)組仍然是“C風(fēng)格”的。NumPy通常創(chuàng)建一個以這個順序保存數(shù)據(jù)的數(shù)組,所以ravel()將總是不需要復(fù)制它的參數(shù)3。但是如果數(shù)組是通過切片其它數(shù)組或有不同尋常的選項時,它可能需要被復(fù)制。函數(shù)reshape()和ravel()還可以被同過一些可選參數(shù)構(gòu)建成FORTRAN風(fēng)格的數(shù)組,即最左邊的索引變化最快。

reshape函數(shù)改變參數(shù)形狀并返回它,而resize函數(shù)改變數(shù)組自身。

>>> aarray([[ 7., ?5.],

[ 9., ?3.],

[ 7., ?2.],

[ 7., ?8.],

[ 6., ?8.],

[ 3., ?2.]])>>> a.resize((2,6))>>> aarray([[ 7., ?5., ?9., ?3., ?7., ?2.],

[ 7., ?8., ?6., ?8., ?3., ?2.]])

如果在改變形狀操作中一個維度被給做-1,其維度將自動被計算

更多 shape, reshape, resize, ravel 參考NumPy示例

組合(stack)不同的數(shù)組

幾種方法可以沿不同軸將數(shù)組堆疊在一起:

>>> a = floor(10*random.random((2,2)))>>> aarray([[ 1., ?1.],

[ 5., ?8.]])>>> b = floor(10*random.random((2,2)))>>> barray([[ 3., ?3.],

[ 6., ?0.]])>>> vstack((a,b))array([[ 1., ?1.],

[ 5., ?8.],

[ 3., ?3.],

[ 6., ?0.]])>>> hstack((a,b))array([[ 1., ?1., ?3., ?3.],

[ 5., ?8., ?6., ?0.]])

函數(shù)column_stack以列將一維數(shù)組合成二維數(shù)組,它等同與vstack對一維數(shù)組。

>>> column_stack((a,b)) ? # With2D arraysarray([[ 1., ?1., ?3., ?3.],

[ 5., ?8., ?6., ?0.]])>>> a=array([4.,2.])>>> b=array([2.,8.])>>> a[:,newaxis] ?# This allows to have a2D columns vectorarray([[ 4.],

[ 2.]])>>> column_stack((a[:,newaxis],b[:,newaxis]))array([[ 4., ?2.],

[ 2., ?8.]])>>> vstack((a[:,newaxis],b[:,newaxis])) # The behavior of vstack is differentarray([[ 4.],

[ 2.],

[ 2.],

[ 8.]])

row_stack函數(shù),另一方面,將一維數(shù)組以行組合成二維數(shù)組。

對那些維度比二維更高的數(shù)組,hstack沿著第二個軸組合,vstack沿著第一個軸組合,concatenate允許可選參數(shù)給出組合時沿著的軸。

Note

在復(fù)雜情況下,r_[]和c_[]對創(chuàng)建沿著一個方向組合的數(shù)很有用,它們允許范圍符號(“:”):

>>>r_[1:4,0,4]array([1,2,3,0,4])

當使用數(shù)組作為參數(shù)時,r_和c_的默認行為和vstack和hstack很像,但是允許可選的參數(shù)給出組合所沿著的軸的代號。

更多函數(shù)hstack , vstack, column_stack , row_stack , concatenate , c_ , r_ 參見NumPy示例.

將一個數(shù)組分割(split)成幾個小數(shù)組

使用hsplit你能將數(shù)組沿著它的水平軸分割,或者指定返回相同形狀數(shù)組的個數(shù),或者指定在哪些列后發(fā)生分割:

>>> a = floor(10*random.random((2,12)))>>> aarray([[ 8., ?8., ?3., ?9., ?0., ?4., ?3., ?0., ?0., ?6., ?4., ?4.],

[ 0., ?3., ?2., ?9., ?6., ?0., ?4., ?5., ?7., ?5., ?1., ?4.]])>>> hsplit(a,3) ? # Split a into3[array([[ 8., ?8., ?3., ?9.],

[ 0., ?3., ?2., ?9.]]), array([[ 0., ?4., ?3., ?0.],

[ 6., ?0., ?4., ?5.]]), array([[ 0., ?6., ?4., ?4.],

[ 7., ?5., ?1., ?4.]])]>>> hsplit(a,(3,4)) ? # Split a after the thirdandthe fourth column[array([[ 8., ?8., ?3.],

[ 0., ?3., ?2.]]), array([[ 9.],

[ 9.]]), array([[ 0., ?4., ?3., ?0., ?0., ?6., ?4., ?4.],

[ 6., ?0., ?4., ?5., ?7., ?5., ?1., ?4.]])]

vsplit沿著縱向的軸分割,array split允許指定沿哪個軸分割。

復(fù)制和視圖

當運算和處理數(shù)組時,它們的數(shù)據(jù)有時被拷貝到新的數(shù)組有時不是。這通常是新手的困惑之源。這有三種情況:

完全不拷貝

簡單的賦值不拷貝數(shù)組對象或它們的數(shù)據(jù)。

>>> a = arange(12)>>> b = a# no new object is created>>> b is a# a and b are two names for the same ndarray objectTrue>>> b.shape =3,4# changes the shape of a>>> a.shape(3,4)

Python 傳遞不定對象作為參考4,所以函數(shù)調(diào)用不拷貝數(shù)組。

>>>deff(x):...printid(x)...>>>id(a)# id is a unique identifier of an object148293216>>>f(a)148293216

視圖(view)和淺復(fù)制

不同的數(shù)組對象分享同一個數(shù)據(jù)。視圖方法創(chuàng)造一個新的數(shù)組對象指向同一數(shù)據(jù)。

>>> c = a.view()>>> c is aFalse>>> c.base is a# c is a view of the data owned by aTrue>>> c.flags.owndataFalse>>>>>> c.shape =2,6# a's shape doesn't change>>> a.shape(3,4)>>> c[0,4] =1234# a's data changes>>> aarray([[0,1,2,3], ? ? ? [1234,5,6,7], ? ? ? [8,9,10,11]])

切片數(shù)組返回它的一個視圖:

>>> s = a[ : ,1:3]# spaces added for clarity; could also be written "s = a[:,1:3]">>> s[:] =10# s[:] is a view of s. Note the difference between s=10 and s[:]=10>>> aarray([[0,10,10,3], ? ? ? [1234,10,10,7], ? ? ? [8,10,10,11]])

深復(fù)制

這個復(fù)制方法完全復(fù)制數(shù)組和它的數(shù)據(jù)。

>>> d = a.copy() ? ? ? ? ? ? ? ? ? ? ? ? ?# anewarrayobjectwithnewdataiscreated>>> d is aFalse>>> d.base is a ? ? ? ? ? ? ? ? ? ? ? ? ? # d doesn'tshare anythingwithaFalse>>> d[0,0] =9999>>> aarray([[0,10,10,3], ? ? ? [1234,10,10,7], ? ? ? [8,10,10,11]])

函數(shù)和方法(method)總覽

這是個NumPy函數(shù)和方法分類排列目錄。這些名字鏈接到NumPy示例,你可以看到這些函數(shù)起作用。[^5]

創(chuàng)建數(shù)組

arange, array, copy, empty, empty_like,eye, fromfile, fromfunction, identity,linspace,logspace, mgrid, ogrid,ones, ones_like, r ,zeros, zeros_like

轉(zhuǎn)化

astype, atleast1d, atleast2d, atleast3d, mat

操作

arraysplit, column stack, concatenate, diagonal,dsplit, dstack, hsplit, hstack, item, newaxis, ravel,repeat, reshape,resize, squeeze, swapaxes, take, transpose,vsplit, vstack

詢問

all,any,nonzero,where

排序

argmax, argmin, argsort,max,min,ptp, searchsorted,sort

運算

choose, compress, cumprod, cumsum, inner, fill,imag, prod, put, putmask,real, sum

基本統(tǒng)計

cov, mean, std,var

基本線性代數(shù)

cross,dot, outer, svd, vdot

進階

廣播法則(rule)

廣播法則能使通用函數(shù)有意義地處理不具有相同形狀的輸入。

廣播第一法則是,如果所有的輸入數(shù)組維度不都相同,一個“1”將被重復(fù)地添加在維度較小的數(shù)組上直至所有的數(shù)組擁有一樣的維度。

廣播第二法則確定長度為1的數(shù)組沿著特殊的方向表現(xiàn)地好像它有沿著那個方向最大形狀的大小。對數(shù)組來說,沿著那個維度的數(shù)組元素的值理應(yīng)相同。

應(yīng)用廣播法則之后,所有數(shù)組的大小必須匹配。更多細節(jié)可以從這個文檔找到。

花哨的索引和索引技巧

NumPy比普通Python序列提供更多的索引功能。除了索引整數(shù)和切片,正如我們之前看到的,數(shù)組可以被整數(shù)數(shù)組和布爾數(shù)組索引。

通過數(shù)組索引

>>> a = arange(12)**2# the first 12 square numbers>>> i = array( [1,1,3,8,5] )# an array of indices>>> a[i]# the elements of a at the positions iarray([1,1,9,64,25])>>>>>> j = array( [ [3,4], [9,7] ] )# a bidimensional array of indices>>> a[j]# the same shape as jarray([[9,16], ? ? ? [81,49]])

當被索引數(shù)組a是多維的時,每一個唯一的索引數(shù)列指向a的第一維5。以下示例通過將圖片標簽用調(diào)色版轉(zhuǎn)換成色彩圖像展示了這種行為。

>>>palette = array( [ [0,0,0],# black...[255,0,0],# red...[0,255,0],# green...[0,0,255],# blue...[255,255,255] ] )# white>>>image = array( [ [0,1,2,0],# each value corresponds to a color in the palette...[0,3,4,0] ?] )>>>palette[image]# the (2,4,3) color imagearray([[[0,0,0], ? ? ? ?[255,0,0], ? ? ? ?[0,255,0], ? ? ? ?[0,0,0]], ? ? ? [[0,0,0], ? ? ? ?[0,0,255], ? ? ? ?[255,255,255], ? ? ? ?[0,0,0]]])

我們也可以給出不不止一維的索引,每一維的索引數(shù)組必須有相同的形狀。

>>> a = arange(12).reshape(3,4)>>> aarray([[ 0, ?1, ?2, ?3],

[ 4, ?5, ?6, ?7],

[ 8, ?9, 10, 11]])>>> i = array( [ [0,1], ? ? ? ? ? ? ? ? ? ? ? ?# indicesforthe first dim of a... ? ? ? ? ? ? ?[1,2] ] )>>> j = array( [ [2,1], ? ? ? ? ? ? ? ? ? ? ? ?# indicesforthe second dim... ? ? ? ? ? ? ?[3,3] ] )>>>>>> a[i,j] ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? # iandj must have equal shapearray([[ 2, ?5],

[ 7, 11]])>>>>>> a[i,2]array([[ 2, ?6],

[ 6, 10]])>>>>>> a[:,j] ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? # i.e., a[ : , j]array([[[ 2, ?1],

[ 3, ?3]],[[ 6, ?5],

[ 7, ?7]],[[10, ?9],

[11, 11]]])

自然,我們可以把i和j放到序列中(比如說列表)然后通過list索引。

>>> l = [i,j]>>> a[l]# equivalent to a[i,j]array([[2,5], ? ? ? [7,11]])

然而,我們不能把i和j放在一個數(shù)組中,因為這個數(shù)組將被解釋成索引a的第一維。

>>> s = array( [i,j] )>>> a[s] ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? #notwhat we want---------------------------------------------------------------------------IndexError ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?Traceback (most recent call last)in()----> 1 a[s]IndexError: index (3) out of range (0<=index<2)indimension0>>>>>> a[tuple(s)] ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?# same as a[i,j]array([[ 2, ?5],

[ 7, 11]])

另一個常用的數(shù)組索引用法是搜索時間序列最大值6

>>> time = linspace(20,145,5)# time scale>>> data = sin(arange(20)).reshape(5,4)# 4 time-dependent series>>> timearray([20. ?,51.25,82.5,113.75,145. ?])>>> dataarray([[0. ? ? ? ?,0.84147098,0.90929743,0.14112001], ? ? ? [-0.7568025, -0.95892427, -0.2794155,0.6569866], ? ? ? [0.98935825,0.41211849, -0.54402111, -0.99999021], ? ? ? [-0.53657292,0.42016704,0.99060736,0.65028784], ? ? ? [-0.28790332, -0.96139749, -0.75098725,0.14987721]])>>>>>> ind = data.argmax(axis=0)# index of the maxima for each series>>> indarray([2,0,3,1])>>>>>> time_max = time[ ind]# times corresponding to the maxima>>>>>> data_max = data[ind, xrange(data.shape[1])]# => data[ind[0],0], data[ind[1],1]...>>>>>> time_maxarray([82.5,20. ?,113.75,51.25])>>> data_maxarray([0.98935825,0.84147098,0.99060736,0.6569866])>>>>>> all(data_max == data.max(axis=0))True

你也可以使用數(shù)組索引作為目標來賦值:

>>> a = arange(5)>>> aarray([0,1,2,3,4])>>> a[[1,3,4]] =0>>> aarray([0,0,2,0,0])

然而,當一個索引列表包含重復(fù)時,賦值被多次完成,保留最后的值:

>>> a = arange(5)>>> a[[0,0,2]]=[1,2,3]>>> aarray([2,1,3,3,4])

這足夠合理,但是小心如果你想用Python的+=結(jié)構(gòu),可能結(jié)果并非你所期望:

>>> a = arange(5)>>> a[[0,0,2]]+=1>>> aarray([1,1,3,3,4])

即使0在索引列表中出現(xiàn)兩次,索引為0的元素僅僅增加一次。這是因為Python要求a+=1和a=a+1等同。

通過布爾數(shù)組索引

當我們使用整數(shù)數(shù)組索引數(shù)組時,我們提供一個索引列表去選擇。通過布爾數(shù)組索引的方法是不同的我們顯式地選擇數(shù)組中我們想要和不想要的元素。

我們能想到的使用布爾數(shù)組的索引最自然方式就是使用和原數(shù)組一樣形狀的布爾數(shù)組。

>>>a = arange(12).reshape(3,4)>>>b = a >4>>>b# b is a boolean with a's shapearray([[False,False,False,False], ? ? ? [False,True,True,True], ? ? ? [True,True,True,True]], dtype=bool)>>>a[b]# 1d array with the selected elementsarray([5,6,7,8,9,10,11])

這個屬性在賦值時非常有用:

>>> a[b] =0# All elements of'a'higher than4become0>>> aarray([[0, 1, 2, 3],

[4, 0, 0, 0],

[0, 0, 0, 0]])

你可以參考曼德博集合示例看看如何使用布爾索引來生成曼德博集合的圖像。

第二種通過布爾來索引的方法更近似于整數(shù)索引;對數(shù)組的每個維度我們給一個一維布爾數(shù)組來選擇我們想要的切片。

>>> a = arange(12).reshape(3,4)>>> b1 = array([False,True,True])# first dim selection>>> b2 = array([True,False,True,False])# second dim selection>>>>>> a[b1,:]# selecting rowsarray([[4,5,6,7], ? ? ? [8,9,10,11]])>>>>>> a[b1]# same thingarray([[4,5,6,7], ? ? ? [8,9,10,11]])>>>>>> a[:,b2]# selecting columnsarray([[0,2], ? ? ? [4,6], ? ? ? [8,10]])>>>>>> a[b1,b2]# a weird thing to doarray([4,10])

注意一維數(shù)組的長度必須和你想要切片的維度或軸的長度一致,在之前的例子中,b1是一個秩為1長度為三的數(shù)組(a的行數(shù)),b2(長度為4)與a的第二秩(列)相一致。7

ix_()函數(shù)

ix_函數(shù)可以為了獲得多元組的結(jié)果而用來結(jié)合不同向量。例如,如果你想要用所有向量a、b和c元素組成的三元組來計算a+b*c:

>>> a = array([2,3,4,5])>>> b = array([8,5,4])>>> c = array([5,4,6,8,3])>>> ax,bx,cx = ix_(a,b,c)>>> axarray([[[2]],[[3]],[[4]],[[5]]])>>> bxarray([[[8],

[5],

[4]]])>>> cxarray([[[5, 4, 6, 8, 3]]])>>> ax.shape, bx.shape, cx.shape((4,1,1), (1,3,1), (1,1,5))>>> result = ax+bx*cx>>> resultarray([[[42, 34, 50, 66, 26],

[27, 22, 32, 42, 17],

[22, 18, 26, 34, 14]],[[43, 35, 51, 67, 27],

[28, 23, 33, 43, 18],

[23, 19, 27, 35, 15]],[[44, 36, 52, 68, 28],

[29, 24, 34, 44, 19],

[24, 20, 28, 36, 16]],[[45, 37, 53, 69, 29],

[30, 25, 35, 45, 20],

[25, 21, 29, 37, 17]]])>>> result[3,2,4]17>>> a[3]+b[2]*c[4]17

你也可以實行如下簡化:

defufunc_reduce(ufct, *vectors):vs = ix_(*vectors) ? ?r = ufct.identityforvinvs: ? ? ? ?r = ufct(r,v)returnr

然后這樣使用它:

>>> ufunc_reduce(add,a,b,c)array([[[15, 14, 16, 18, 13],

[12, 11, 13, 15, 10],

[11, 10, 12, 14, ?9]],[[16, 15, 17, 19, 14],

[13, 12, 14, 16, 11],

[12, 11, 13, 15, 10]],[[17, 16, 18, 20, 15],

[14, 13, 15, 17, 12],

[13, 12, 14, 16, 11]],[[18, 17, 19, 21, 16],

[15, 14, 16, 18, 13],

[14, 13, 15, 17, 12]]])

這個reduce與ufunc.reduce(比如說add.reduce)相比的優(yōu)勢在于它利用了廣播法則,避免了創(chuàng)建一個輸出大小乘以向量個數(shù)的參數(shù)數(shù)組。8

用字符串索引

參見RecordArray。

線性代數(shù)

繼續(xù)前進,基本線性代數(shù)包含在這里。

簡單數(shù)組運算

參考numpy文件夾中的linalg.py獲得更多信息

>>> from numpy import *>>> from numpy.linalg import *>>> a = array([[1.0, 2.0], [3.0, 4.0]])>>>printa[[ 1. ?2.]

[ 3. ?4.]]>>> a.transpose()array([[ 1., ?3.],

[ 2., ?4.]])>>> inv(a)array([[-2. , ?1. ],

[ 1.5, -0.5]])>>> u = eye(2) # unit2x2 matrix;"eye"represents"I">>> uarray([[ 1., ?0.],

[ 0., ?1.]])>>> j = array([[0.0, -1.0], [1.0, 0.0]])>>> dot (j, j) # matrix productarray([[-1., ?0.],

[ 0., -1.]])>>> trace(u) ?# trace2.0>>> y = array([[5.], [7.]])>>> solve(a, y)array([[-3.],

[ 4.]])>>> eig(j)(array([0.+1.j,0.-1.j]),array([[ 0.70710678+0.j, ?0.70710678+0.j],

[ 0.00000000-0.70710678j, ?0.00000000+0.70710678j]]))Parameters: ? ?square matrixReturns ? ?The eigenvalues, each repeated according to its multiplicity. ? ?The normalized (unit"length") eigenvectors, such that the ? ?column ``v[:,i]`` is the eigenvector corresponding to the ? ?eigenvalue ``w[i]`` .

矩陣類

這是一個關(guān)于矩陣類的簡短介紹。

>>> A = matrix('1.0 2.0; 3.0 4.0')>>> A[[ 1. ?2.]

[ 3. ?4.]]>>>type(A) ?# file where class is defined>>> A.T ?# transpose[[ 1. ?3.]

[ 2. ?4.]]>>> X = matrix('5.0 7.0')>>> Y = X.T>>> Y[[5.]

[7.]]>>>printA*Y ?# matrix multiplication[[19.]

[43.]]>>>printA.I ?# inverse[[-2. ? 1. ]

[ 1.5 -0.5]]>>> solve(A, Y) ?# solving linear equationmatrix([[-3.],

[ 4.]])

索引:比較矩陣和二維數(shù)組

注意NumPy中數(shù)組和矩陣有些重要的區(qū)別。NumPy提供了兩個基本的對象:一個N維數(shù)組對象和一個通用函數(shù)對象。其它對象都是建構(gòu)在它們之上 的。特別的,矩陣是繼承自NumPy數(shù)組對象的二維數(shù)組對象。對數(shù)組和矩陣,索引都必須包含合適的一個或多個這些組合:整數(shù)標量、省略號 (ellipses)、整數(shù)列表;布爾值,整數(shù)或布爾值構(gòu)成的元組,和一個一維整數(shù)或布爾值數(shù)組。矩陣可以被用作矩陣的索引,但是通常需要數(shù)組、列表或者 其它形式來完成這個任務(wù)。

像平常在Python中一樣,索引是從0開始的。傳統(tǒng)上我們用矩形的行和列表示一個二維數(shù)組或矩陣,其中沿著0軸的方向被穿過的稱作行,沿著1軸的方向被穿過的是列。9

讓我們創(chuàng)建數(shù)組和矩陣用來切片:

>>> A = arange(12)>>> Aarray([0,1,2,3,4,5,6,7,8,9,10,11])>>> A.shape = (3,4)>>> M = mat(A.copy())>>>printtype(A)," ?",type(M)>>>printA[[ 0 ?1 ?2 ?3]

[ 4 ?5 ?6 ?7]

[ 8 ?9 10 11]]>>>printM[[ 0 ?1 ?2 ?3]

[ 4 ?5 ?6 ?7]

[ 8 ?9 10 11]]

現(xiàn)在,讓我們簡單的切幾片?;镜那衅褂们衅瑢ο蠡蛘麛?shù)。例如,A[:]和M[:]的求值將表現(xiàn)得和Python索引很相似。然而要注意很重要的一點就是NumPy切片數(shù)組不創(chuàng)建數(shù)據(jù)的副本;切片提供統(tǒng)一數(shù)據(jù)的視圖。

>>>printA[:];printA[:].shape[[ 0 ?1 ?2 ?3]

[ 4 ?5 ?6 ?7]

[ 8 ?9 10 11]](3,4)>>>printM[:];printM[:].shape[[ 0 ?1 ?2 ?3]

[ 4 ?5 ?6 ?7]

[ 8 ?9 10 11]](3,4)

現(xiàn)在有些和Python索引不同的了:你可以同時使用逗號分割索引來沿著多個軸索引。

>>>printA[:,1];printA[:,1].shape[1 5 9](3,)>>>printM[:,1];printM[:,1].shape[[1][5][9]](3,1)

注意最后兩個結(jié)果的不同。對二維數(shù)組使用一個冒號產(chǎn)生一個一維數(shù)組,然而矩陣產(chǎn)生了一個二維矩陣。10例如,一個M[2,:]切片產(chǎn)生了一個形狀為(1,4)的矩陣,相比之下,一個數(shù)組的切片總是產(chǎn)生一個最低可能維度11的數(shù)組。例如,如果C是一個三維數(shù)組,C[...,1]產(chǎn)生一個二維的數(shù)組而C[1,:,1]產(chǎn)生一個一維數(shù)組。從這時開始,如果相應(yīng)的矩陣切片結(jié)果是相同的話,我們將只展示數(shù)組切片的結(jié)果。

假如我們想要一個數(shù)組的第一列和第三列,一種方法是使用列表切片:

>>> A[:,[1,3]]array([[ 1, ?3],

[ 5, ?7],

[ 9, 11]])

稍微復(fù)雜點的方法是使用take()方法(method):

>>> A[:,].take([1,3],axis=1)array([[ 1, ?3],

[ 5, ?7],

[ 9, 11]])

如果我們想跳過第一行,我們可以這樣:

>>> A[1:,].take([1,3],axis=1)array([[ 5, ?7],

[ 9, 11]])

或者我們僅僅使用A[1:,[1,3]]。還有一種方法是通過矩陣向量積(叉積)。

>>> A[ix_((1,2),(1,3))]array([[ 5, ?7],

[ 9, 11]])

為了讀者的方便,在次寫下之前的矩陣:

>>> A[ix_((1,2),(1,3))]array([[ 5, ?7],

[ 9, 11]])

現(xiàn)在讓我們做些更復(fù)雜的。比如說我們想要保留第一行大于1的列。一種方法是創(chuàng)建布爾索引:

>>> A[0,:]>1array([False,False,True,True], dtype=bool)>>> A[:,A[0,:]>1]array([[2,3], ? ? ? [6,7], ? ? ? [10,11]])

就是我們想要的!但是索引矩陣沒這么方便。

>>> M[0,:]>1matrix([[False, False, True, True]], dtype=bool)>>> M[:,M[0,:]>1]matrix([[2, 3]])

這個過程的問題是用“矩陣切片”來切片產(chǎn)生一個矩陣12,但是矩陣有個方便的A屬性,它的值是數(shù)組呈現(xiàn)的。所以我們僅僅做以下替代:

>>> M[:,M.A[0,:]>1]matrix([[ 2, ?3],

[ 6, ?7],

[10, 11]])

如果我們想要在矩陣兩個方向有條件地切片,我們必須稍微調(diào)整策略,代之以:

>>>A[A[:,0]>2,A[0,:]>1]array([ 6, 11])>>>M[M.A[:,0]>2,M.A[0,:]>1]matrix([[ 6, 11]])

我們需要使用向量積ix_:

>>> A[ix_(A[:,0]>2,A[0,:]>1)]array([[ 6, ?7],

[10, 11]])>>> M[ix_(M.A[:,0]>2,M.A[0,:]>1)]matrix([[ 6, ?7],

[10, 11]])

技巧和提示

下面我們給出簡短和有用的提示。

“自動”改變形狀

更改數(shù)組的維度,你可以省略一個尺寸,它將被自動推導(dǎo)出來。

>>> a = arange(30)>>> a.shape =2,-1,3#-1means"whatever is needed">>> a.shape(2,5,3)>>> aarray([[[ 0, ?1, ?2],

[ 3, ?4, ?5],

[ 6, ?7, ?8],

[ 9, 10, 11],

[12, 13, 14]],[[15, 16, 17],

[18, 19, 20],

[21, 22, 23],

[24, 25, 26],

[27, 28, 29]]])

向量組合(stacking)

我們?nèi)绾斡脙蓚€相同尺寸的行向量列表構(gòu)建一個二維數(shù)組?在MATLAB中這非常簡單:如果x和y是兩個相同長度的向量,你僅僅需要做m=[x;y]。在NumPy中這個過程通過函數(shù)column_stack、dstack、hstack和vstack來完成,取決于你想要在那個維度上組合。例如:

x= arange(0,10,2) ? ? ? ? ? ? ? ? ? ? # x=([0,2,4,6,8])y= arange(5) ? ? ? ? ? ? ? ? ? ? ? ? ?# y=([0,1,2,3,4])m= vstack([x,y]) ? ? ? ? ? ? ? ? ? ? ?# m=([[0,2,4,6,8],# ? ? [0,1,2,3,4]])xy= hstack([x,y]) ? ? ? ? ? ? ? ? ? ? # xy =([0,2,4,6,8,0,1,2,3,4])

二維以上這些函數(shù)背后的邏輯會很奇怪。

參考寫個Matlab用戶的NumPy指南并且在這里添加你的新發(fā)現(xiàn): )

直方圖(histogram)

NumPy中histogram函數(shù)應(yīng)用到一個數(shù)組返回一對變量:直方圖數(shù)組和箱式向量。注意:matplotlib也有一個用來建立直方圖的函數(shù)(叫作hist,正如matlab中一樣)與NumPy中的不同。主要的差別是pylab.hist自動繪制直方圖,而numpy.histogram僅僅產(chǎn)生數(shù)據(jù)。

importnumpyimportpylab# Build a vector of10000normal deviateswithvariance0.5^2andmean2mu, sigma =2,0.5v = numpy.random.normal(mu,sigma,10000)# Plot a normalized histogramwith50binspylab.hist(v,bins=50, normed=1) ? ? ? # matplotlib version (plot)pylab.show()# Compute the histogramwithnumpyandthen plot it(n,bins) = numpy.histogram(v,bins=50, normed=True) ?# NumPy version (no plot)pylab.plot(.5*(bins[1:]+bins[:-1]), n)pylab.show()

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 227,533評論 6 531
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 98,055評論 3 414
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事?!?“怎么了?”我有些...
    開封第一講書人閱讀 175,365評論 0 373
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經(jīng)常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 62,561評論 1 307
  • 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,346評論 6 404
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 54,889評論 1 321
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 42,978評論 3 439
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 42,118評論 0 286
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 48,637評論 1 333
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 40,558評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 42,739評論 1 369
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,246評論 5 355
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 43,980評論 3 346
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,362評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,619評論 1 280
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,347評論 3 390
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 47,702評論 2 370

推薦閱讀更多精彩內(nèi)容