最近在慕課網學習廖雪峰老師的Python進階課程,做筆記總結一下重點。
基本變量及其類型
變量
在Python中,能夠直接處理的數據類型有以下幾種:
整數
如-100
,0xdf92
浮點數
如2.55
,1.23e9
字符串
字符串是以 ' '
或'' ''
括起來的任意文本,如'xyz'
,''lmn''
布爾值
在Python中,可以直接用True
、False
表示布爾值(請注意大小寫),也可以通過布爾運算計算出來。
布爾值可以用and
、or
和not
運算
空值
空值是Python里一個特殊的值,用None
表示。None
不能理解為0,因為0是有意義的,而None是一個特殊的空值
print語句
打印語句
>>>print 'hello, world'
hello, world```
>打印多個字符串
print 'I','love','Python'
I love Python```
打印運算結果
>>>print 2+3
5```
print '100 + 200 =', 100 + 200
100 + 200 = 300 ```
注釋
Python的注釋以 #
開頭,后面的文字直到行尾都算注釋
# 這一行全部都是注釋...
print 'hello' # 這也是注釋```
####什么是變量
在Python中,變量的概念基本上和初中代數的方程變量是一致的
在Python程序中,**變量**是用一個**變量名**表示,變量名必須是大小寫英文、數字和下劃線(_)的組合,且不能用數字開頭
比如:
`a=1`
變量`a`是一個整數
`t_007 = 'T007'`
變量```t_007```是一個字符串
在Python中,等號`=`是賦值語句,可以把任意數據類型賦值給變量,同一個變量可以反復賦值,而且可以是不同類型的變量。這種變量本身類型不固定的語言稱之為**動態語言**,與之對應的是**靜態語言**。
####定義字符串
* 如果字符串本身包含'怎么辦?比如我們要表示字符串` I'm OK `,這時,可以用`" "`括起來表示:
`"I'm OK"`
* 類似的,如果字符串包含`"`,我們就可以用`' '`
括起來表示:
`'Learn "Python" in imooc'`
* 如果字符串既包含`'`又包含`"`怎么辦?
這個時候,就需要對字符串的某些特殊字符進行“轉義”,Python字符串用` \ `進行轉義
要表示字符串` Bob said "I'm OK".`
由于` ' `和 `" `會引起歧義,因此,我們在它前面插入一個`\ `表示這是一個普通字符,不代表字符串的起始,因此,這個字符串又可以表示為:
`'Bob said \"I\'m OK\".'`
**注意:**轉義字符` \ `不計入字符串的內容中
常用的轉義字符還有:
\n 表示換行
\t 表示一個制表符
\\ 表示 \ 字符本身
####raw字符串與多行字符串
* 如果一個字符串包含很多需要轉義的字符,對每一個字符都進行轉義會很麻煩。為了避免這種情況,我們可以在字符串前面加個前綴`r `,表示這是一個 raw 字符串,里面的字符就不需要轉義了。例如:
r'(_)/ (_)/'```
但是r'...'
表示法不能表示多行字符串,也不能表示包含'
和 "
的字符串
- 如果要表示多行字符串,可以用
'''...'''
表示:
'''Line 1
Line 2
Line 3'''
上面這個字符串的表示方法和下面的是完全一樣的:
'Line 1\nLine 2\nLine 3' - 還可以在多行字符串前面添加
r
,把這個多行字符串也變成一個raw字符串:
>>>print r''' "To be, or not to be": that is the question.
Whether it's nobler in the mind to suffer.'''
"To be, or not to be": that is the question.
Whether it's nobler in the mind to suffer.
Unicode字符串
如果中文字符串在Python環境下遇到 UnicodeDecodeError,這是因為.py文件保存的格式有問題。可以在第一行添加注釋:
# -*- coding: utf-8 -*-```
如.py文件:
-- coding: utf-8 --
print '''靜夜思
床前明月光,
疑是地上霜。
舉頭望明月,
低頭思故鄉。
'''```
運行得到:
靜夜思
床前明月光,
疑是地上霜。
舉頭望明月,
低頭思故鄉。
整數和浮點數
Python支持對整數和浮點數直接進行四則混合運算,運算規則和數學上的四則運算規則完全一致。
布爾類型
我們已經了解了Python支持布爾類型的數據,布爾類型只有True
和False
兩種值。
Python把0
、空字符串' '
和None
看成 False
,其他數值和非空字符串都看成True
,如:
True and 'a=T' 計算結果是 'a=T'
繼續計算 'a=T' or 'a=F' 計算結果還是 'a=T'```
**要解釋上述結果,又涉及到 and 和 or 運算的一條重要法則:短路計算。**
1. 在計算 `a and b `時,如果 a 是 False,則根據與運算法則,整個結果必定為 False,因此返回 a;如果 a 是 True,則整個計算結果必定取決與 b,因此返回 b。
2. 在計算 `a or b `時,如果 a 是 True,則根據或運算法則,整個計算結果必定為 True,因此返回 a;如果 a 是 False,則整個計算結果必定取決于 b,因此返回 b。
**所以Python解釋器在做布爾運算時,只要能提前確定計算結果,它就不會往后算了,直接返回結果。**
運行如下代碼:
a = 'python'
print 'hello,', a or 'world'
b = ''
print 'hello,', b or 'world'```
打印結果為:
hello, python
hello, world```
___
###List和Tuple類型
####創建list
Python內置的一種數據類型是列表:`list`。`list`是一種有序的集合,可以隨時添加和刪除其中的元素。
比如,列出班里所有同學的名字,就可以用一個list表示:
['Michael', 'Bob', 'Tracy']
['Michael', 'Bob', 'Tracy']```
list是數學意義上的有序集合,也就是說,list中的元素是按照順序排列的。
構造list非常簡單,按照上面的代碼,直接用 [ ]
把list的所有元素都括起來,就是一個list對象。通常,我們會把list賦值給一個變量,這樣,就可以通過變量來引用list:
>>> classmates = ['Michael', 'Bob', 'Tracy']
>>> classmates # 打印classmates變量的內容
['Michael', 'Bob', 'Tracy']```
由于Python是**動態語言**,所以list中包含的元素并不要求都必須是同一種數據類型,我們完全可以在list中包含各種數據:
L = ['Michael', 100, True]
一個元素也沒有的list,就是空list:
empty_list = []```
按照索引訪問list
由于list是一個有序集合,所以,我們可以用一個list按分數從高到低表示出班里的3個同學:
>>> L = ['Adam', 'Lisa', 'Bart']```
那我們如何從list中獲取指定第 N 名的同學呢?方法是通過索引來獲取list中的指定元素。
(**需要特別注意的是**,索引從 0 開始,也就是說,第一個元素的索引是0,第二個元素的索引是1,以此類推。)
因此,要打印第一名同學的名字,用 L[0]:
print L[0]
Adam```
要打印第四名同學的名字,用 L[3]:
>>> print L[3]
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
IndexError: list index out of range```
報錯了!IndexError意思就是索引超出了范圍,因為上面的list只有3個元素,有效的索引是 0,1,2。
所以,使用索引時,**千萬注意不要越界**。
####倒序訪問list
如何得到分數最低的同學?
* 方法一
我們可以先數一數這個 list,發現它包含3個元素,因此,最后一個元素的索引是2:
print L[2]
Bart```
- 方法二
Bart同學是最后一名,俗稱倒數第一,所以,我們可以用 -1 這個索引來表示最后一個元素:
>>> print L[-1]
Bart```
(注意:使用倒序索引時,也要注意**不要越界**)
####添加新元素
今天,班里轉來一名新同學 Paul,如何把新同學添加到現有的 list 中呢?
* 方法一
用 list 的 `append()` 方法,把新同學追加到 list 的末尾:
L = ['Adam', 'Lisa', 'Bart']
L.append('Paul')
print L
['Adam', 'Lisa', 'Bart', 'Paul']```
append()總是把新的元素添加到 list 的尾部
如果把Paul 同學添加到第一的位置怎么辦?
- 方法二
方法是用list的insert()
方法,它接受兩個參數,第一個參數是索引號,第二個參數是待添加的新元素:
>>> L = ['Adam', 'Lisa', 'Bart']
>>> L.insert(0, 'Paul')
>>> print L
['Paul', 'Adam', 'Lisa', 'Bart']```
( 注意**`L.insert(0, 'Paul')`**的意思是,'Paul'將被添加到索引為 0 的位置上(也就是第一個),而原來索引為 0 的Adam同學,以及后面的所有同學,都自動向后移動一位。)
####從list刪除元素
Paul同學剛來幾天又要轉走了,那么我們怎么把Paul 從現有的list中刪除呢?
* 如果Paul同學排在最后一個,我們可以用list的`pop()`方法刪除:
L = ['Adam', 'Lisa', 'Bart', 'Paul']
L.pop()
'Paul'
print L
['Adam', 'Lisa', 'Bart']```
注意:pop()方法總是刪掉list的最后一個元素,并且它還返回這個元素,所以我們執行 L.pop()
后,會打印出 'Paul'。
- 如果Paul同學不是排在最后一個怎么辦?比如Paul同學排在第三:
>>> L = ['Adam', 'Lisa', 'Paul', 'Bart']```
要把Paul踢出list,我們就必須**先定位Paul的位置**。由于Paul的索引是2,因此,用 pop(2)
把Paul刪掉:
L.pop(2)
'Paul'
print L
['Adam', 'Lisa', 'Bart']```
從list替換元素
假設現在班里仍然是3名同學:
>>> L = ['Adam', 'Lisa', 'Bart']```
現在,Bart同學要轉學走了,碰巧來了一個Paul同學,要更新班級成員名單。
* 方法一
我們可以先把Bart刪掉(pop),再把Paul添加(append或insert)進來。
* 方法二
L[2] = 'Paul'
print L
L = ['Adam', 'Lisa', 'Paul']```
對list中的某一個索引賦值,就可以直接用新的元素替換掉原來的元素,list包含的元素個數保持不變。
由于Bart還可以用 -1 做索引,因此,下面的代碼也可以完成同樣的替換工作:
>>> L[-1] = 'Paul'```
####創建tuple
tuple是另一種有序的列表,中文翻譯為“ 元組 ”。tuple 和 list 非常類似,但是,**tuple一旦創建完畢,就不能修改了!!!**
同樣是表示班里同學的名稱,用tuple表示如下:
t = ('Adam', 'Lisa', 'Bart')```
創建tuple和創建list唯一不同之處是用( )
替代了[ ]
。
現在,這個t
就不能改變了,tuple沒有 append()方法,也沒有insert()和pop()方法。所以,新同學沒法直接往 tuple 中添加,老同學想退出 tuple 也不行。
獲取 tuple 元素的方式和 list 是一模一樣的,我們可以正常使用 t[0],t[-1]等索引方式訪問元素,但是不能賦值成別的元素!!!
創建單元素tuple
tuple和list一樣,可以包含 0 個、1個和任意多個元素
- 創建包含 0 個元素的 tuple,也就是空tuple,直接用 ()表示:
>>> t = ()
>>> print t
()```
* 創建包含1個元素的 tuple
t = (1)
print t
1
好像哪里不對!t 不是 tuple ,而是整數1。**為什么**呢?
因為`()`既可以表示tuple,又可以作為括號表示運算時的優先級,結果 (1) 被Python解釋器計算出結果 1,導致我們得到的不是tuple,而是整數 1。
正是因為用()定義單元素的tuple有歧義,所以 Python 規定,單元素 tuple 要多加一個逗號`“,”`,這樣就避免了歧義:
t = (1,)
print t
(1,)```
Python在打印單元素tuple時,也自動添加了一個“,”
,為了更明確地告訴你這是一個tuple。
多元素 tuple 加不加這個額外的“,”效果是一樣的:
>>> t = (1, 2, 3,)
>>> print t
(1, 2, 3)```
####“可變”的tuple
前面我們看到了tuple一旦創建就不能修改。現在,我們來看一個“可變”的tuple:
t = ('a', 'b', ['A', 'B'])```
注意到 t 有 3 個元素:'a','b'和一個list:['A', 'B']。list作為一個整體是tuple的第3個元素。list對象可以通過 t[2] 拿到:
>>> L = t[2]```
然后,我們把list的兩個元素改一改:
L[0] = 'X'
L[1] = 'Y'```
再看看tuple的內容:
>>> print t
('a', 'b', ['X', 'Y'])```
表面上看,tuple的元素確實變了,但其實變的不是 tuple 的元素,而是list的元素。
tuple一開始指向的list并沒有改成別的list,所以,tuple所謂的**“不變”**是說,tuple的每個元素,指向永遠不變。即**指向'a',就不能改成指向'b'**,指向一個list,就不能改成指向其他對象,但指向的這個list本身是可變的!
理解了**“指向不變”**后,要創建一個內容也不變的tuple怎么做?那就必須保證tuple的每一個元素本身也不能變。
例如:
t = ('a', 'b', ('A', 'B'))```
就是不可變的。
條件判斷和循環
if語句
計算機之所以能做很多自動化的任務,因為它可以自己做條件判斷。
比如,輸入用戶年齡,根據年齡打印不同的內容,在Python程序中,可以用if語句實現:
age = 20
if age >= 18:
print 'your age is', age
print 'adult'
print 'END'```
**注意: **<font color=#FF4500 >Python代碼的縮進規則</font>。具有相同縮進的代碼被視為代碼塊,上面的3,4行 print 語句就構成一個代碼塊(但不包括第5行的print)。如果 if 語句判斷為 True,就會執行這個代碼塊。
縮進要嚴格按照Python的習慣寫法:<font color=#FF4500 >4個空格,不要使用Tab,更不要混合Tab和空格</font>,否則很容易造成因為縮進引起的語法錯誤。
**注意**: if 語句后接表達式,然后用`:`表示代碼塊開始。
如果在<font color=#FF4500 >Python交互環境下敲代碼</font>,還要特別<font color=#FF4500 >留意縮進</font>,并且<font color=#FF4500 >退出縮進需要多敲一行回車</font>:
age = 20
if age >= 18:
... print 'your age is', age
... print 'adult't = (1, 2, 3,)
>>> print t
(1, 2, 3)####“可變”的tuple 前面我們看到了tuple一旦創建就不能修改。現在,我們來看一個“可變”的tuple:
>>> t = ('a', 'b', ['A', 'B'])**注意**到 t 有 3 個元素:**'a','b'**和一個list:**['A', 'B']**。list作為一個整體是tuple的第3個元素。list對象可以通過 t[2] 拿到:
>>> L = t[2]然后,我們把list的兩個元素改一改:
>>> L[0] = 'X'
>>> L[1] = 'Y'再看看tuple的內容:
>>> print t
('a', 'b', ['X', 'Y'])表面上看,tuple的元素確實變了,但其實變的不是 tuple 的元素,而是list的元素。 tuple一開始指向的list并沒有改成別的list,所以,tuple所謂的**“不變”**是說,tuple的每個元素,指向永遠不變。即**指向'a',就不能改成指向'b'**,指向一個list,就不能改成指向其他對象,但指向的這個list本身是可變的! 理解了**“指向不變”**后,要創建一個內容也不變的tuple怎么做?那就必須保證tuple的每一個元素本身也不能變。 例如:
t = ('a', 'b', ('A', 'B'))就是不可變的。 ----------------- ###條件判斷和循環 ####if語句 計算機之所以能做很多自動化的任務,因為它可以自己做條件判斷。 比如,輸入用戶年齡,根據年齡打印不同的內容,在Python程序中,可以用if語句實現:
age = 20
if age >= 18:
print 'your age is', age
print 'adult'
print 'END'**注意: **<font color=#FF4500 >Python代碼的縮進規則</font>。具有相同縮進的代碼被視為代碼塊,上面的3,4行 print 語句就構成一個代碼塊(但不包括第5行的print)。如果 if 語句判斷為 True,就會執行這個代碼塊。 縮進要嚴格按照Python的習慣寫法:<font color=#FF4500 >4個空格,不要使用Tab,更不要混合Tab和空格</font>,否則很容易造成因為縮進引起的語法錯誤。 **注意**: if 語句后接表達式,然后用`:`表示代碼塊開始。 如果在<font color=#FF4500 >Python交互環境下敲代碼</font>,還要特別<font color=#FF4500 >留意縮進</font>,并且<font color=#FF4500 >退出縮進需要多敲一行回車</font>:
>>> age = 20
>>> if age >= 18:
... print 'your age is', age
... print 'adult'
...
your age is 20
print t
(1, 2, 3)####“可變”的tuple 前面我們看到了tuple一旦創建就不能修改。現在,我們來看一個“可變”的tuple:
>>> t = ('a', 'b', ['A', 'B'])**注意**到 t 有 3 個元素:**'a','b'**和一個list:**['A', 'B']**。list作為一個整體是tuple的第3個元素。list對象可以通過 t[2] 拿到:
>>> L = t[2]然后,我們把list的兩個元素改一改:
>>> L[0] = 'X'
>>> L[1] = 'Y'再看看tuple的內容:
>>> print t
('a', 'b', ['X', 'Y'])表面上看,tuple的元素確實變了,但其實變的不是 tuple 的元素,而是list的元素。 tuple一開始指向的list并沒有改成別的list,所以,tuple所謂的**“不變”**是說,tuple的每個元素,指向永遠不變。即**指向'a',就不能改成指向'b'**,指向一個list,就不能改成指向其他對象,但指向的這個list本身是可變的! 理解了**“指向不變”**后,要創建一個內容也不變的tuple怎么做?那就必須保證tuple的每一個元素本身也不能變。 例如:
t = ('a', 'b', ('A', 'B'))就是不可變的。 ----------------- ###條件判斷和循環 ####if語句 計算機之所以能做很多自動化的任務,因為它可以自己做條件判斷。 比如,輸入用戶年齡,根據年齡打印不同的內容,在Python程序中,可以用if語句實現:
age = 20
if age >= 18:
print 'your age is', age
print 'adult'
print 'END'**注意: **<font color=#FF4500 >Python代碼的縮進規則</font>。具有相同縮進的代碼被視為代碼塊,上面的3,4行 print 語句就構成一個代碼塊(但不包括第5行的print)。如果 if 語句判斷為 True,就會執行這個代碼塊。 縮進要嚴格按照Python的習慣寫法:<font color=#FF4500 >4個空格,不要使用Tab,更不要混合Tab和空格</font>,否則很容易造成因為縮進引起的語法錯誤。 **注意**: if 語句后接表達式,然后用`:`表示代碼塊開始。 如果在<font color=#FF4500 >Python交互環境下敲代碼</font>,還要特別<font color=#FF4500 >留意縮進</font>,并且<font color=#FF4500 >退出縮進需要多敲一行回車</font>:
>>> age = 20
>>> if age >= 18:
... print 'your age is', age
... print 'adult'
...
your age is 20
adult```
if-else語句
當 if 語句判斷表達式的結果為 True 時,就會執行 if 包含的代碼塊:
if age >= 18: print 'adult'```
如果我們想判斷年齡在18歲以下時,打印出 'teenager',怎么辦?
可以用一個 <font color=#FF4500 >if ... else ... </font>語句:
if age >= 18:
print 'adult'
else:
print 'teenager'```
if-elif-else語句
有的時候,一個 if ... else ... 還不夠用。比如,根據年齡的劃分:
條件1:18歲或以上:adult
條件2:6歲或以上:teenager
條件3:6歲以下:kid```
要避免嵌套結構的 if ... else ...,我們可以用 if ... 多個elif ... else ...的結構,一次寫完所有的規則:
if age >= 18:
print 'adult'
elif age >= 6:
print 'teenager'
elif age >= 3:
print 'kid'
else:
print 'baby'```
elif 意思就是 else if。這樣一來,我們就寫出了結構非常清晰的一系列條件判斷。
**特別注意: **這一系列條件判斷會從上到下依次判斷,如果某個判斷為 True,執行完對應的代碼塊,后面的條件判斷就直接忽略,不再執行了
for循環
list或tuple可以表示一個有序集合。如果我們想依次訪問一個list中的每一個元素呢?比如 list:
L = ['Adam', 'Lisa', 'Bart']```
Python的 for 循環就可以依次把list或tuple的每個元素迭代出來:
L = ['Adam', 'Lisa', 'Bart']for name in L: print name```
注意: name 這個變量是在 for 循環中定義的,意思是,依次取出list中的每一個元素,并把元素賦值給 name,然后執行for循環體(就是縮進的代碼塊)。
這樣一來,遍歷一個list或tuple就非常容易了。
while循環
和 for 循環不同的另一種循環是 while 循環,while 循環不會迭代 list 或 tuple 的元素,而是根據表達式判斷循環是否結束。
比如要從 0 開始打印不大于 N 的整數:
N = 10
x = 0
while x < N:
print x
x = x + 1```
while循環每次先判斷 x < N,如果為True,則執行循環體的代碼塊,否則,退出循環。
在循環體內,x = x + 1 會讓 x 不斷增加,最終因為 x < N 不成立而退出循環。
####break退出循環
用 for 循環或者 while 循環時,如果要在循環體內直接退出循環,可以使用 break 語句
比如計算1至100的整數和,我們用while來實現:
sum = 0
x = 1
while True:
sum = sum + x
x = x + 1
if x > 100:
break
print sum```
咋一看, while True 就是一個死循環,但是在循環體內,我們還判斷了 x > 100 條件成立時,用break語句退出循環,這樣也可以實現循環的結束。
continue繼續循環
在循環過程中,可以用break退出當前循環,還可以用continue跳過后續循環代碼,繼續下一次循環。
現在老師只想統計及格分數的平均分,就要把 x < 60 的分數剔除掉,這時,利用 continue,可以做到當 x < 60的時候,不繼續執行循環體的后續代碼,直接進入下一次循環:
L = [75, 98, 59, 81, 66, 43, 69, 85]
sum = 0.0
n = 0
for x in L:
if x < 60:
continue
sum = sum + x
n = n + 1```
####多重循環
在循環內部,還可以嵌套循環,我們來看一個例子:
for x in ['A', 'B', 'C']:
for y in ['1', '2', '3']:
print x + y
x 每循環一次,y 就會循環 3 次,這樣,我們可以打印出一個全排列:
A1
A2
A3
B1
B2
B3
C1
C2
C3
__________
###Dict和Set類型
####什么是dict
我們已經知道,list 和 tuple 可以用來表示順序集合,例如,班里同學的名字:
['Adam', 'Lisa', 'Bart']```
或者考試的成績列表:
[95, 85, 59]```
但是,要根據名字找到對應的成績,用兩個 list 表示就不方便。
如果把名字和分數關聯起來,組成類似的查找表:
'Adam' ==> 95
'Lisa' ==> 85
'Bart' ==> 59```
那么給定一個名字,就可以直接查到分數。
Python的 dict 就是專門干這件事的。用 dict 表示“名字”-“成績”的查找表如下:
d = {
'Adam': 95,
'Lisa': 85,
'Bart': 59
}
我們把名字稱為key,對應的成績稱為value,dict就是通過 key 來查找 value。
花括號 {} 表示這是一個dict,然后按照** key: value**, 寫出來即可。最后一個 key: value 的逗號可以省略。
由于dict也是集合,len() 函數可以計算任意集合的大小:
>>> len(d)
3
注意: 一個 key-value 算一個,因此,dict大小為3。
訪問dict
我們已經能創建一個dict,用于表示名字和成績的對應關系:
d = {
'Adam': 95,
'Lisa': 85,
'Bart': 59
}```
那么,如何根據名字來查找對應的成績呢?
可以簡單地使用 `d[key]` 的形式來查找對應的 value,這和 list 很像,不同之處是,**list 必須使用索引返回對應的元素,而dict使用key:**
print d['Adam']
95
print d['Paul']
Traceback (most recent call last):
File "index.py", line 11, in <module>
print d['Paul']
KeyError: 'Paul'
**注意:** 通過 key 訪問 dict 的value,只要 key 存在,dict就返回對應的value。如果key不存在,會直接報錯:KeyError。
要避免 KeyError 發生,有兩個辦法:
* **一是先判斷一下 key 是否存在,用 in 操作符:**
if 'Paul' in d:
print d['Paul']```
如果 'Paul' 不存在,if語句判斷為False,自然不會執行 print d['Paul'] ,從而避免了錯誤。
- 二是使用dict本身提供的一個 get 方法,在Key不存在的時候,返回None:
>>> print d.get('Bart')
59
>>> print d.get('Paul')
None```
####dict的特點
* **dict的第一個特點是<font color=#FF4500 >查找速度快 </font>,無論dict有10個元素還是10萬個元素,查找速度都一樣**。而list的查找速度隨著元素增加而逐漸下降。
不過dict的查找速度快不是沒有代價的,**dict的缺點是占用內存大,還會浪費很多內容**,list正好相反,占用內存小,但是查找速度慢。
由于dict是按 key 查找,所以,在一個dict中,key不能重復。
* **dict的第二個特點就是存儲的key-value序對是<font color=#FF4500 >沒有順序 </font>的!**這和list不一樣:
d = {
'Adam': 95,
'Lisa': 85,
'Bart': 59
}
當我們試圖打印這個dict時:
print d
{'Lisa': 85, 'Adam': 95, 'Bart': 59}```
打印的順序不一定是我們創建時的順序,而且,不同的機器打印的順序都可能不同,這說明dict內部是無序的,不能用dict存儲有序的集合。
- dict的第三個特點是作為 key 的元素必須不可變,Python的基本類型如字符串、整數、浮點數都是不可變的,都可以作為 key。但是list是可變的,就不能作為 key。
不可變這個限制僅作用于key,value是否可變無所謂:
{
'123': [1, 2, 3], # key 是 str,value是list
123: '123', # key 是 int,value 是 str
('a', 'b'): True # key 是 tuple,并且tuple的每個元素都是不可變對象,value是 boolean
}```
最常用的key還是字符串,因為用起來最方便。
####什么是set
**dict的作用是建立一組 key 和一組 value 的映射關系,dict的key是不能重復的。**
有的時候,我們只想要 dict 的 key,不關心 key 對應的 value,目的就是保證這個集合的元素不會重復,這時,set就派上用場了。
**set 持有一系列元素,這一點和 list 很像,但是set的元素沒有重復,而且是無序的,這點和 dict 的 key很像。**
創建 set 的方式是調用 set() 并傳入一個 list,list的元素將作為set的元素:
s = set(['A', 'B', 'C'])
可以查看 set 的內容:
print s
set(['A', 'C', 'B'])```
注意,上述打印的形式類似 list, 但它不是 list,仔細看還可以發現,打印的順序和原始 list 的順序有可能是不同的,因為set內部存儲的元素是<font color=#FF4500 >無序</font>的。
因為<font color=#FF4500 >set不能包含重復的元素 </font>,所以,當我們傳入包含重復元素的 list 會怎么樣呢?
>>> s = set(['A', 'B', 'C', 'C'])
>>> print s
set(['A', 'C', 'B'])
>>> len(s)
3
結果顯示,set會自動去掉重復的元素,原來的list有4個元素,但set只有3個元素。
訪問set
由于set存儲的是無序集合,所以我們沒法通過索引來訪問。
訪問 set中的某個元素實際上就是判斷一個元素是否在set中。
例如,存儲了班里同學名字的set:
>>> s = set(['Adam', 'Lisa', 'Bart', 'Paul'])```
**我們可以用 in 操作符判斷:**
Bart是該班的同學嗎?
'Bart' in s
True```print d
{'Lisa': 85, 'Adam': 95, 'Bart': 59}打印的順序不一定是我們創建時的順序,而且,不同的機器打印的順序都可能不同,這說明dict內部是**無序**的,不能用dict存儲有序的集合。 * **dict的第三個特點是作為 key 的元素必須不可變**,Python的基本類型如字符串、整數、浮點數都是不可變的,都可以作為 key。但是list是可變的,就不能作為 key。 不可變這個限制僅作用于key,value是否可變無所謂:
{
'123': [1, 2, 3], # key 是 str,value是list
123: '123', # key 是 int,value 是 str
('a', 'b'): True # key 是 tuple,并且tuple的每個元素都是不可變對象,value是 boolean
}最常用的key還是字符串,因為用起來最方便。 ####什么是set **dict的作用是建立一組 key 和一組 value 的映射關系,dict的key是不能重復的。** 有的時候,我們只想要 dict 的 key,不關心 key 對應的 value,目的就是保證這個集合的元素不會重復,這時,set就派上用場了。 **set 持有一系列元素,這一點和 list 很像,但是set的元素沒有重復,而且是無序的,這點和 dict 的 key很像。** 創建 set 的方式是調用 set() 并傳入一個 list,list的元素將作為set的元素:
>>> s = set(['A', 'B', 'C'])
可以查看 set 的內容:
>>> print s
set(['A', 'C', 'B'])**注意**,上述打印的形式類似 list, 但它不是 list,仔細看還可以發現,打印的順序和原始 list 的順序有可能是不同的,因為set內部存儲的元素是**<font color=#FF4500 >無序</font>**的。 因為**<font color=#FF4500 >set不能包含重復的元素 </font>**,所以,當我們傳入包含重復元素的 list 會怎么樣呢?
>>> s = set(['A', 'B', 'C', 'C'])
>>> print s
set(['A', 'C', 'B'])
>>> len(s)
3
結果顯示,set會自動去掉重復的元素,原來的list有4個元素,但set只有3個元素。 ####訪問set 由于**set存儲的是無序集合**,所以我們沒法通過索引來訪問。 訪問 set中的某個元素實際上就是判斷一個元素是否在set中。 例如,存儲了班里同學名字的set:
>>> s = set(['Adam', 'Lisa', 'Bart', 'Paul'])**我們可以用 in 操作符判斷:** Bart是該班的同學嗎?
>>> 'Bart' in s
True```
Bill是該班的同學嗎?
>>> 'Bill' in s
False```
bart是該班的同學嗎?
'bart' in s
False```
看來大小寫很重要,'Bart' 和 'bart'被認為是兩個不同的元素
set的特點
set的內部結構和dict很像,唯一區別是不存儲value,因此,判斷一個元素是否在set中速度很快。
set存儲的元素和dict的key類似,必須是不變對象,因此,任何可變對象是不能放入set中的。
最后,<font color=#FF4500 >set存儲的元素也是沒有順序的 </font>。
set的這些特點,可以應用在哪些地方呢?
星期一到星期日可以用字符串'MON', 'TUE', ... 'SUN'表示。
假設我們讓用戶輸入星期一至星期日的某天,如何判斷用戶的輸入是否是一個有效的星期呢?
可以用** if 語句**判斷,但這樣做非常繁瑣。
如果事先創建好一個set,包含'MON' ~ 'SUN':
weekdays = set(['MON', 'TUE', 'WED', 'THU', 'FRI', 'SAT', 'SUN'])```
再判斷輸入是否有效,只需要判斷該字符串是否在set中:
x = '???' # 用戶輸入的字符串
if x in weekdays:
print 'input ok'
else:
print 'input error'```
這樣一來,代碼就簡單多了。
遍歷set
由于 set 也是一個集合,所以,遍歷 set 和遍歷 list 類似,都可以通過 for 循環實現。
直接使用 for 循環可以遍歷 set 的元素:
>>> s = set(['Adam', 'Lisa', 'Bart'])
>>> for name in s:
.. print name
...
Lisa
Adam
Bart```
**注意: **觀察 for 循環在遍歷set時,元素的順序和list的順序很可能是不同的,而且不同的機器上運行的結果也可能不同。
例:用 for 循環遍歷如下的set,打印出 name: score 來。
s = set([('Adam', 95), ('Lisa', 85), ('Bart', 59)])```
代碼:
s = set([('Adam', 95), ('Lisa', 85), ('Bart', 59)])
for x in s:
print x[0]+':',x[1]```
打印結果:
Lisa: 85
Adam: 95
Bart: 59```
更新set
由于set存儲的是一組不重復的無序元素,因此,更新set主要做兩件事:
一是把新的元素添加到set中,二是把已有元素從set中刪除。
添加元素時,用set的add()方法:
>>> s = set([1, 2, 3])
>>> s.add(4)
>>> print s
set([1, 2, 3, 4])```
如果添加的元素已經存在于set中,add()不會報錯,但是不會加進去了:
s = set([1, 2, 3])
s.add(3)
print s
set([1, 2, 3])```
刪除set中的元素時,用set的<font color=#FF4500 >remove() </font>方法:
>>> s = set([1, 2, 3, 4])
>>> s.remove(4)
>>> print s
set([1, 2, 3])```
如果刪除的元素不存在set中,remove()會報錯:
s = set([1, 2, 3])
s.remove(4)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
KeyError: 4```
所以用add()可以直接添加,而remove()前需要判斷。
函數
什么是函數
抽象是數學中非常常見的概念。
借助抽象,我們才能不關心底層的具體計算過程,而直接在更高的層次上思考問題。
寫計算機程序也是一樣,函數就是最基本的一種代碼抽象的方式。
Python不但能非常靈活地定義函數,而且本身內置了很多有用的函數,可以直接調用。
調用函數
Python內置了很多有用的函數,我們可以直接調用。
要調用一個函數,需要知道<font color=#FF4500 >函數的名稱和參數</font>,比如求絕對值的函數 abs,它接收一個參數。
可以直接從Python的官方網站查看文檔:
http://docs.python.org/2/library/functions.html
#abs
也可以在交互式命令行通過 help(abs)
查看abs函數的幫助信息。
調用 **abs **函數:
>>> abs(100)
100
>>> abs(-20)
20
>>> abs(12.34)
12.34```
調用函數的時候,如果傳入的參數數量不對,會報**TypeError**的錯誤,并且Python會明確地告訴你:abs()有且僅有1個參數,但給出了兩個:
abs(1, 2)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: abs() takes exactly one argument (2 given)```
如果傳入的參數數量是對的,但參數類型不能被函數所接受,也會報TypeError的錯誤,并且給出錯誤信息:str是錯誤的參數類型:
>>> abs('a')
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: bad operand type for abs(): 'str'```
而比較函數**<font color=#FF4500 >cmp(x, y) </font>** 就需要兩個參數,如果 **x<y**,返回** -1**,如果** x==y**,返回 **0**,如果 **x>y**,返回 **1**:
cmp(1, 2)
-1
cmp(2, 1)
1
cmp(3, 3)
0```
Python內置的常用函數還包括數據類型轉換函數,比如<font color=#FF4500 > int() </font>函數可以把其他數據類型轉換為整數:
>>> int('123')
123
>>> int(12.34)
12```
**<font color=#FF4500 >str()</font>**函數把其他類型轉換成 str:
str(123)
'123'
str(1.23)
'1.23'```
例子:
sum()函數接受一個list作為參數,并返回list所有元素之和。請計算 11 + 22 + 33 + ... + 100100
代碼:
L = [ ]
x=1
while x<=100:
L.append(x*x)
x=x+1
print sum(L)```
打印結果:
338350```
編寫函數
在Python中,定義一個函數要使用** def 語句,依次寫出函數名、括號、括號中的參數和冒號:**,然后,在縮進塊中編寫函數體,函數的返回值用 return語句返回。
例子:定義一個 square_of_sum 函數,它接受一個list,返回list中每個元素平方的和。
代碼:
def square_of_sum(L):
sum=0
for x in L:
sum = sum +x**2
return sum
print square_of_sum([1, 2, 3, 4, 5])
print square_of_sum([-5, 0, 5, 15, 25])```
打印結果:
55
900```
注意,函數體內部的語句在執行時,一旦執行到return時,函數就執行完畢,并將結果返回。因此,函數內部通過條件判斷和循環可以實現非常復雜的邏輯。
如果沒有return語句,函數執行完畢后也會返回結果,只是結果為 None。
<font color=#FF4500 > return None可以簡寫為return。 </font>
返回多值
函數可以返回多個值嗎?答案是肯定的。
比如在游戲中經常需要從一個點移動到另一個點,給出坐標、位移和角度,就可以計算出新的坐標:
<font color=#FF4500 >#math</font>包提供了sin()和 cos()函數,我們先用import引用它:
import math
def move(x, y, step, angle):
nx = x + step * math.cos(angle)
ny = y - step * math.sin(angle)
return nx, ny```
這樣我們就可以同時獲得返回值:
x, y = move(100, 100, 60, math.pi / 6)
print x, y
cmp(3, 3)
0Python內置的常用函數還包括數據類型轉換函數,比如**<font color=#FF4500 > int() </font>**函數可以把其他數據類型轉換為整數:
>>> int('123')
123
>>> int(12.34)
12**<font color=#FF4500 >str()</font>**函數把其他類型轉換成 str:
>>> str(123)
'123'
>>> str(1.23)
'1.23'例子: sum()函數接受一個list作為參數,并返回list所有元素之和。請計算 1*1 + 2*2 + 3*3 + ... + 100*100 代碼:
L = [ ]
x=1
while x<=100:
L.append(xx)
x=x+1
print sum(L)打印結果:
338350####編寫函數 在Python中,定義一個函數要使用** def **語句,依次寫出**函數名**、**括號**、括號中的**參數**和**冒號:**,然后,在縮進塊中編寫函數體,函數的返回值用 **return**語句返回。 例子:定義一個 square_of_sum 函數,它接受一個list,返回list中每個元素平方的和。 代碼:
def square_of_sum(L):
sum=0
for x in L:
sum = sum +x*2
return sum
print square_of_sum([1, 2, 3, 4, 5])
print square_of_sum([-5, 0, 5, 15, 25])打印結果:
55
900**注意**,函數體內部的語句在執行時,一旦執行到return時,函數就執行完畢,并將結果返回。因此,函數內部通過條件判斷和循環可以實現非常復雜的邏輯。 如果沒有return語句,函數執行完畢后也會返回結果,只是結果為 None。 **<font color=#FF4500 > return None可以簡寫為return。 </font>** ####返回多值 函數可以返回多個值嗎?答案是肯定的。 比如在游戲中經常需要從一個點移動到另一個點,給出坐標、位移和角度,就可以計算出新的坐標: **<font color=#FF4500 >#math</font>**包提供了**sin()**和 **cos()**函數,我們先用import引用它:
import math
def move(x, y, step, angle):
nx = x + step * math.cos(angle)
ny = y - step * math.sin(angle)
return nx, ny這樣我們就可以同時獲得返回值:
>>> x, y = move(100, 100, 60, math.pi / 6)
>>> print x, y
151.961524227 70.0```
但其實這只是一種假象,Python函數返回的仍然是單一值:
>>> r = move(100, 100, 60, math.pi / 6)
>>> print r
(151.96152422706632, 70.0)```
用print打印返回結果,原來返回值是一個**tuple**!
但是,在語法上,返回一個tuple可以省略括號,而多個變量可以同時接收一個tuple,按位置賦給對應的值,所以,**Python的函數**返回多值其實就是**返回一個tuple**,但寫起來更方便。
例子:
一元二次方程的定義是:ax2 + bx + c = 0
請編寫一個函數,返回一元二次方程的兩個解。
**注意:**Python的math包提供了sqrt()函數用于計算平方根。
代碼:
import math
def quadratic_equation(a, b, c):
de=b2-4ac
if de>=0:
x1=(-b+math.sqrt(b2-4ac))/(2a)
x2=(-b-math.sqrt(b2-4ac))/(2a)
return x1,x2
else:
return
print quadratic_equation(2, 3, 0)
print quadratic_equation(1, -6, 5)```
打印結果:
(0.0, -1.5)
(5.0, 1.0)```
####遞歸函數
在函數內部,可以調用其他函數。如果一個函數在內部調用自身本身,這個函數就是遞歸函數。
舉個例子,我們來計算階乘 **n! = 1 * 2 * 3 * ... * n**,用函數 **fact(n)**表示,可以看出:
fact(n) = n! = 1 * 2 * 3 * ... * (n-1) * n = (n-1)! * n = fact(n-1) * n```
所以,fact(n)可以表示為 n * fact(n-1),只有n=1時需要特殊處理。
于是,fact(n)用遞歸的方式寫出來就是:
def fact(n):
if n==1:
return 1
return n * fact(n - 1)```
如果我們計算fact(5),可以根據函數定義看到計算過程如下:
===> fact(5)
===> 5 * fact(4)
===> 5 * (4 * fact(3))
===> 5 * (4 * (3 * fact(2)))
===> 5 * (4 * (3 * (2 * fact(1))))
===> 5 * (4 * (3 * (2 * 1)))
===> 5 * (4 * (3 * 2))
===> 5 * (4 * 6)
===> 5 * 24
===> 120```
遞歸函數的優點是定義簡單,邏輯清晰。理論上,所有的遞歸函數都可以寫成循環的方式,但循環的邏輯不如遞歸清晰。
<font color=#FF4500 >使用遞歸函數需要注意防止棧溢出。</font>在計算機中,函數調用是通過棧(stack)這種數據結構實現的,每當進入一個函數調用,棧就會加一層棧幀,每當函數返回,棧就會減一層棧幀。由于棧的大小不是無限的,所以,遞歸調用的次數過多,會導致棧溢出。
例子:
漢諾(http://baike.baidu.com/view/191666.htm) 的移動也可以看做是遞歸函數。
我們對柱子編號為a, b, c,將所有圓盤從a移到c可以描述為:
如果a只有一個圓盤,可以直接移動到c;
如果a有N個圓盤,可以看成a有1個圓盤(底盤) + (N-1)個圓盤,首先需要把 (N-1) 個圓盤移動到 b,然后,將 a的最后一個圓盤移動到c,再將b的(N-1)個圓盤移動到c。
請編寫一個函數,給定輸入 n, a, b, c,打印出移動的步驟:
move(n, a, b, c)
例如,輸入 move(2, 'A', 'B', 'C'),打印出:
A --> B
A --> C
B --> C
代碼:
#-*- coding:utf-8 -*-
# move(n, a, b, c)表示的是有n個盤子在a柱子上,將要移到c柱子上面去
def move(n, a, b, c):
# 如果a柱子上面只有一個盤子,則直接移到c柱子上面去并輸出路徑,結束遞歸
if n == 1:
print a, '-->', c
return
# 表示的是將n-1的盤子從a柱子上面移到b柱子上面去
move(n-1, a, c, b)
# 輸出最下面個盤子移從a移到c的路徑
print a, '-->', c
# 將b柱子上面的n-1個盤子移動到c柱子上面
move(n-1, b, a, c)
move(4, 'A', 'B', 'C')```
打印結果:
A --> B
A --> C
B --> C
A --> B
C --> A
C --> B
A --> B
A --> C
B --> C
B --> A
C --> A
B --> C
A --> B
A --> C
B --> C```
定義默認參數
定義函數的時候,還可以有默認參數。
例如Python自帶的 int() 函數,其實就有兩個參數,我們既可以傳一個參數,又可以傳兩個參數:
>>> int('123')
123
>>> int('123', 8)
83```
int()函數的第二個參數是轉換進制,如果不傳,默認是十進制 (base=10),如果傳了,就用傳入的參數。
可見,**函數的默認參數的作用是簡化調用**,你只需要把必須的參數傳進去。但是在需要的時候,又可以傳入額外的參數來覆蓋默認參數值。
我們來定義一個計算 x 的N次方的函數:
def power(x, n):
s = 1
while n > 0:
n = n - 1
s = s * x
return s```
假設計算平方的次數最多,我們就可以把 n 的默認值設定為 2:
def power(x, n=2):
s = 1
while n > 0:
n = n - 1
s = s * x
return s```
這樣一來,計算平方就不需要傳入兩個參數了:
power(5)
25
由于函數的參數按從左到右的順序匹配,所以**默認參數只能定義在必需參數的后面:**
OK:
def fn1(a, b=1, c=2):
pass
Error:
def fn2(a=1, b):
pass```
例子:
定義一個 greet() 函數,它包含一個默認參數,如果沒有傳入,打印 'Hello, world.',如果傳入,打印 'Hello, xxx.'默認參數的默認值可以設定為'world'
代碼:
def greet(name='world'):
print 'Hello, ' + name + '.'
greet()
greet('Bart')```
打印結果:
Hello,world.
Hello,Bart.```
定義可變參數
如果想讓一個函數能接受任意個參數,我們就可以定義一個可變參數:
def fn(*args):
print args```
可變參數的名字前面有個 *** **號,我們可以傳入0個、1個或多個參數給可變參數:
fn()
()
fn('a')
('a',)
fn('a', 'b')
('a', 'b')
fn('a', 'b', 'c')
('a', 'b', 'c')```
可變參數也不是很神秘,Python解釋器會把傳入的一組參數組裝成一個tuple傳遞給可變參數,因此,在函數內部,直接把變量** args** 看成一個 tuple 就好了。
定義可變參數的目的也是為了簡化調用。假設我們要計算任意個數的平均值,就可以定義一個可變參數:
def average(*args):
...```
這樣,在調用的時候,可以這樣寫:
average()
0
average(1, 2)
1.5
average(1, 2, 2, 3, 4)
2.4```
例子:
編寫接受可變參數的 average() 函數。
可變參數 args 是一個tuple,當0個參數傳入時,args是一個空tuple。
代碼:
def average(*args):
sum = 0.0
if len(args) == 0:
return sum
for x in args:
sum = sum + x
return sum / len(args)
print average()
print average(1, 2)
print average(1, 2, 2, 3, 4)```
打印結果:
0.0
1.5
2.4```
切片
對list進行切片
取一個list的部分元素是非常常見的操作。比如,一個list如下:
>>> L = ['Adam', 'Lisa', 'Bart', 'Paul']```
取前N個元素,也就是索引為0-(N-1)的元素,可以用循環,對這種經常取指定索引范圍的操作,用循環十分繁瑣,因此,Python提供了切片(Slice)操作符,能大大簡化這種操作。
對應上面的問題,取前3個元素,用一行代碼就可以完成切片:
L[0:3]
['Adam', 'Lisa', 'Bart']```
L[0:3]表示,從索引0開始取,直到索引3為止,但不包括索引3。即索引0,1,2,正好是3個元素。
如果第一個索引是0,還可以省略:
>>> L[:3]
['Adam', 'Lisa', 'Bart']```
也可以從索引1開始,取出2個元素出來:
L[1:3]
['Lisa', 'Bart']```
只用一個** : **,表示從頭到尾:
>>> L[:]
['Adam', 'Lisa', 'Bart', 'Paul']```
**因此,L[:]實際上復制出了一個新list。**
切片操作還可以指定第三個參數:
L[::2]
['Adam', 'Bart']```
第三個參數表示每N個取一個,上面的 L[::2] 會每兩個元素取出一個來,也就是隔一個取一個。
把list換成tuple,切片操作完全相同,只是切片的結果也變成了tuple。
例子:
range()函數可以創建一個數列:
>>> range(1, 101)
[1, 2, 3, ..., 100]```
請利用切片,取出:
1. 前10個數;
2. 3的倍數;
3. 不大于50的5的倍數。
代碼:
L = range(1, 101)
print L[0:10]
print L[2::3]
print L[4:50:5]
打印結果:
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
[3, 6, 9, 12, 15, 18, 21, 24, 27, 30, 33, 36, 39, 42, 45, 48, 51, 54, 57, 60, 63, 66, 69, 72, 75, 78, 81, 84, 87, 90, 93, 96, 99]
[5, 10, 15, 20, 25, 30, 35, 40, 45, 50]```
倒序切片
對于list,既然Python支持L[-1]取倒數第一個元素,那么它同樣支持倒數切片,試試:
>>> L = ['Adam', 'Lisa', 'Bart', 'Paul']
>>> L[-2:]
['Bart', 'Paul']
>>> L[:-2]
['Adam', 'Lisa']
>>> L[-3:-1]
['Lisa', 'Bart']
>>> L[-4:-1:2]
['Adam', 'Bart']```
記住倒數第一個元素的索引是-1。
**倒序切片包含起始索引,不包含結束索引。**
####對字符串切片
字符串 'xxx'和 Unicode字符串 u'xxx'也可以看成是一種**list**,每個元素就是一個字符。因此,字符串也可以用切片操作,只是操作結果仍是字符串:
'ABCDEFG'[:3]
'ABC'
'ABCDEFG'[-3:]
'EFG'
'ABCDEFG'[::2]
'ACEG'```
在很多編程語言中,針對字符串提供了很多各種截取函數,其實目的就是對字符串切片。Python沒有針對字符串的截取函數,只需要切片一個操作就可以完成,非常簡單。
例子:
字符串有個方法 upper() 可以把字符變成大寫字母:
>>> 'abc'.upper()
'ABC'```
但它會把所有字母都變成大寫。請設計一個函數,它接受一個字符串,然后返回一個僅首字母變成大寫的字符串。
**提示:**利用切片操作簡化字符串操作。
代碼:
def firstCharUpper(s):
return s[0].upper()+s[1:]
print firstCharUpper('hello')
print firstCharUpper('sunday')
print firstCharUpper('september')```
打印結果:
Hello
Sunday
September```
###迭代
####什么是迭代
在Python中,如果給定一個**list**或**tuple**,我們可以通過for循環來遍歷這個list或tuple,這種遍歷我們成為迭代(Iteration)。
在Python中,迭代是通過 for ... in 來完成的,而很多語言比如C或者Java,迭代list是通過下標完成的,比如Java代碼:
for (i=0; i<list.length; i++) {
n = list[i];
}
可以看出,Python的for循環抽象程度要高于Java的for循環。
**因為 Python 的 for循環不僅可以用在list或tuple上,還可以作用在其他任何可迭代對象上。**
因此,迭代操作就是對于一個集合,無論該集合是有序還是無序,我們用 for 循環總是可以依次取出集合的每一個元素。
注意: 集合是指包含一組元素的數據結構,我們已經介紹的包括:
- 有序集合:list,tuple,str和unicode;
- 無序集合:set
- 無序集合并且具有 key-value 對:dict```
而迭代是一個動詞,它指的是一種操作,在Python中,就是 for 循環。
迭代與按下標訪問數組最大的不同是,后者是一種具體的迭代實現方式,而前者只關心迭代結果,根本不關心迭代內部是如何實現的。
例子:
用for循環迭代數列 1-100 并打印出7的倍數
代碼:
for i in range(1,101):
if i %7 == 0:
print i```
打印結果:
7
14
21
28
35
42
49
56
63
70
77
84
91
98```
索引迭代
Python中,迭代永遠是取出元素本身,而非元素的索引。
對于有序集合,元素確實是有索引的。有的時候,我們確實想在 for 循環中拿到索引,怎么辦?
方法是使用 enumerate() 函數:
>>> L = ['Adam', 'Lisa', 'Bart', 'Paul']
>>> for index, name in enumerate(L):
... print index, '-', name
...
0 - Adam
1 - Lisa
2 - Bart
4 - Paul```
使用 enumerate() 函數,我們可以在for循環中同時綁定索引index和元素name。但是,這不是 enumerate() 的特殊語法。實際上,enumerate() 函數把:
['Adam', 'Lisa', 'Bart', 'Paul']```
變成了類似:
**[(0, 'Adam'), (1, 'Lisa'), (2, 'Bart'), (3, 'Paul')]**```
因此,迭代的每一個元素實際上是一個tuple:
for t in enumerate(L):
index = t[0]
name = t[1]
print index, '-', name```
如果我們知道每個tuple元素都包含兩個元素,for循環又可以進一步簡寫為:
for index, name in enumerate(L):
print index, '-', name```
這樣不但代碼更簡單,而且還少了兩條賦值語句。
可見,索引迭代也不是真的按索引訪問,而是由 enumerate() 函數自動把每個元素變成 (index, element) 這樣的tuple,再迭代,就同時獲得了索引和元素本身。
例子:
zip()函數可以把兩個 list 變成一個 list:
zip([10, 20, 30], ['A', 'B', 'C'])[(10, 'A'), (20, 'B'), (30, 'C')]```
在迭代 ['Adam', 'Lisa', 'Bart', 'Paul'] 時,如果我們想打印出名次 - 名字(名次從1開始),請考慮如何在迭代中打印出來。
提示:考慮使用zip()函數和range()函數
代碼:
L = ['Adam', 'Lisa', 'Bart', 'Paul']
for index, name in zip(range(1,len(L)+1),L):
print index,'-',name```
打印結果:
1 - Adam
2 - Lisa
3 - Bart
4 - Paul```
迭代dict的value
我們已經了解了dict對象本身就是可迭代對象,用 for 循環直接迭代 dict,可以每次拿到dict的一個key。
如果我們希望迭代 dict 對象的value,應該怎么做?
dict 對象有一個 values() 方法,這個方法把dict轉換成一個包含所有value的list,這樣,我們迭代的就是 dict的每一個 value:
d = { 'Adam': 95, 'Lisa': 85, 'Bart': 59 }
print d.values()
# [85, 95, 59]
for v in d.values():
print v
# 85
# 95
# 59
如果仔細閱讀Python的文檔,還可以發現,dict除了values()方法外,還有一個** itervalues() 方法,用 itervalues()** 方法替代 values()方法,迭代效果完全一樣:
d = { 'Adam': 95, 'Lisa': 85, 'Bart': 59 }
print d.itervalues()
# <dictionary-valueiterator object at 0x106adbb50>
for v in d.itervalues():
print v
# 85
# 95
# 59```
**那這兩個方法有何不同之處呢?**
1. **values()** 方法實際上把一個 dict 轉換成了包含 value 的list。
2. 但是 **itervalues()** 方法不會轉換,它會在迭代過程中依次從 dict 中取出 value,所以 itervalues() 方法比 values() 方法節省了生成 list 所需的內存。
3. 打印 itervalues() 發現它返回一個 <dictionary-valueiterator> 對象,這說明在Python中,**for 循環可作用的迭代對象遠不止 list,tuple,str,unicode,dict等**,任何可迭代對象都可以作用于for循環,而內部如何迭代我們通常并不用關心。
**如果一個對象說自己可迭代,那我們就直接用 for 循環去迭代它,可見,迭代是一種抽象的數據操作,它不對迭代對象內部的數據有任何要求。**
####迭代dict的key和value
我們了解了如何**迭代 dict** 的**key**和**value**,那么,在一個 for 循環中,能否同時迭代 key和value?答案是肯定的。
首先,我們看看 dict 對象的 **items()** 方法返回的值:
d = { 'Adam': 95, 'Lisa': 85, 'Bart': 59 }
print d.items()
[('Lisa', 85), ('Adam', 95), ('Bart', 59)]```
可以看到,items() 方法把dict對象轉換成了包含tuple的list,我們對這個list進行迭代,可以同時獲得key和value:
>>> for key, value in d.items():
... print key, ':', value
...
Lisa : 85
Adam : 95
Bart : 59```
和 values() 有一個 itervalues() 似, **items() **也有一個對應的 **iteritems()**,iteritems() 不把dict轉換成list,而是在迭代過程中不斷給出 tuple,所以, iteritems() 不占用額外的內存。
###列表生成式
####生成列表
要生成list [1, 2, 3, 4, 5, 6, 7, 8, 9, 10],我們可以用range(1, 11):
range(1, 11)
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]```
但如果要生成[1x1, 2x2, 3x3, ..., 10x10]怎么做?方法一是循環:
>>> L = []
>>> for x in range(1, 11):
... L.append(x * x)
...
>>> L
[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]```
但是循環太繁瑣,而列表生成式則可以用一行語句代替循環生成上面的list:
[x * x for x in range(1, 11)]
[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]```
這種寫法就是Python特有的列表生成式。利用列表生成式,可以以非常簡潔的代碼生成 list。
寫列表生成式時,把要生成的元素 x * x 放到前面,后面跟 for 循環,就可以把list創建出來,十分有用,多寫幾次,很快就可以熟悉這種語法。
注意:range(1, 100, 2) 可以生成list [1, 3, 5, 7, 9,...]
復雜表達式
使用for循環的迭代不僅可以迭代普通的list,還可以迭代dict。
假設有如下的dict:
d = { 'Adam': 95, 'Lisa': 85, 'Bart': 59 }```
完全可以通過一個復雜的列表生成式把它變成一個 HTML 表格:
tds = ['<tr><td>%s</td><td>%s</td></tr>' % (name, score) for name, score in d.iteritems()]
print '<table>'
print '<tr><th>Name</th><th>Score</th><tr>'
print '\n'.join(tds)
print '</table>'```
注:字符串可以通過 % 進行格式化,用指定的參數替代** **%s。字符串的join()方法可以把一個 list 拼接成一個字符串。
把打印出來的結果保存為一個html文件,就可以在瀏覽器中看到效果了:
<table border="1">
<tr><th>Name</th><th>Score</th><tr>
<tr><td>Lisa</td><td>85</td></tr>
<tr><td>Adam</td><td>95</td></tr>
<tr><td>Bart</td><td>59</td></tr>
</table>```
[](http://img.mukewang.com/540fcd2a0001ff4600940104.jpg)
####條件過濾
列表生成式的 **for 循環后面還可以加上 if 判斷**。例如:
[x * x for x in range(1, 11)]
[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]```
如果我們只想要偶數的平方,不改動 range()的情況下,可以加上 if 來篩選:
>>> [x * x for x in range(1, 11) if x % 2 == 0]
[4, 16, 36, 64, 100]```
有了 if 條件,只有 if 判斷為 True 的時候,才把循環的當前元素添加到列表中。
例子:
編寫一個函數,它接受一個 list,然后把list中所有字符串變成大寫后返回,非字符串元素將被忽略。
**提示:**
1. **isinstance(x, str)** 可以判斷變量 x 是否是字符串;
2. 字符串的 **upper()** 方法可以返回大寫的字母
代碼:
def toUppers(L):
return[x.upper()for x in L if isinstance(x,str)]
print toUppers(['Hello', 'world', 101])
打印結果:
['HELLO', 'WORLD']```
多層表達式
for循環可以嵌套,因此,在列表生成式中,也可以用多層 for 循環來生成列表。
對于字符串 'ABC' 和 '123',可以使用兩層循環,生成全排列:
>>> [m + n for m in 'ABC' for n in '123']
['A1', 'A2', 'A3', 'B1', 'B2', 'B3', 'C1', 'C2', 'C3']```
翻譯成循環代碼就像下面這樣:
L = []
for m in 'ABC':
for n in '123':
L.append(m + n)```
例子:
利用 3 層for循環的列表生成式,找出對稱的 3 位數。例如,121 就是對稱數,因為從右到左倒過來還是 121。
代碼:
print [100 * n1 + 10 * n2 + n3 for n1 in range(1, 10) for n2 in range(10) for n3 in range(10) if n1==n3]```
打印結果:
[101, 111, 121, 131, 141, 151, 161, 171, 181, 191, 202, 212, 222, 232, 242, 252, 262, 272, 282, 292, 303, 313, 323,
333, 343, 353, 363, 373, 383, 393, 404, 414, 424, 434, 444, 454, 464, 474, 484, 494, 505, 515, 525, 535, 545, 555,
565, 575, 585, 595, 606, 616, 626, 636, 646, 656, 666, 676, 686, 696, 707, 717, 727, 737, 747, 757, 767, 777, 787,
797, 808, 818, 828, 838, 848, 858, 868, 878, 888, 898, 909, 919, 929, 939, 949, 959, 969, 979, 989, 999]```