六、python網絡編程(socket與http請求的python實現)

要說python優雅在何處,與其他語言相比最為明顯的,那一定是網絡操作了。python可以讓我們用最少的語句寫出功能強大的程序,網絡操作有相當多的開源庫可以使用,而不用像其他語言一樣,步驟繁瑣。接下來從低到高介紹python網絡編程

  1. socket網絡編程接口
    • 基本概念
      可以這樣來理解socket,完成一段網絡通信需要五個元素,協議族,協議類型,協議,目標ip地址,目標端口號,這是由TCP/IP網絡結構決定的。socket作為一種數據結構,將以上五個信息組合起來,稱為套接字。根據面向連接與非連接,套接字類型分為Datagram與Stream兩種類型。Datagram套接字使用UDP協議,向目標地址發送數據包,不保證可靠送達,Stream使用TCP協議,是可靠的、具有差錯與流量控制的傳輸協議,也就是說,stream類型的套接字傳輸信息,具有較好的可靠性,而Datagram類型的套接字具有更高的實時性。
    • 初始化流式套接字的步驟
      • 服務端
        • 使用socket函數創建套接字
        • 綁定到指定的ip地址
        • 監聽客戶端連接
        • 獲取客戶端連接后,使用返回的套接字收發數據
        • 通信結束,關閉套接字
      • 客戶端
        • 創建套接字
        • 連接指定ip地址
        • 連接成功后收發數據
        • 關閉套接字
      • 常用套接字函數



      • 例程
        • 時間戳服務器
                     #!/usr/bin/env python
           import socket
           from time import ctime
           
           
           host='127.0.0.1'
           port=8000
           bufsize=1024
           addr=(host, port)
           
           sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
           sock.bind(addr)
           sock.listen(5)
           while True:
               print 'waiting for connection...'
               clisock, cliaddr = sock.accept()
               print 'connected from', cliaddr
               print 'peername:', clisock.getpeername()
               data = clisock.recv(bufsize)
               if not data:
                   break
               clisock.send('[%s] %s' % (ctime(), data))
               clisock.close()
           sock.close()
          
        • 客戶端
           #!/usr/bin/env python
           from time import ctime
           import socket
           
           host='127.0.0.1'
           port=8000
           addr=(host, port)
           bufsize=1024
           
           
           while True:
               sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
               sock.connect(addr)
               data = raw_input(u'>')
               if not data:
                   break
               sock.send(data)
               data = sock.recv(bufsize)
               print data
                      #!/usr/bin/env python
           from time import ctime
           import socket
           
           host='127.0.0.1'
           port=8000
           addr=(host, port)
           bufsize=1024
           
           
           while True:
               sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
               sock.connect(addr)
               data = raw_input(u'>')
               if not data:
                   break
               sock.send(data)
               data = sock.recv(bufsize)
               print data
           
               sock.close()
               sock.close()
          
  2. 網絡http操作,使用urllib、urllib2、requests
    • 一般來說,進行網絡操作時可以使用以上三個模塊任意一種,但是就功能上來說,requests較為強大,對底層模塊進行了封裝,使用更為簡便,我們重點來討論一下requests
    • http請求有幾種類型,最常用的是get與post,get請求向指定的資源請求數據,GET 請求可被緩存,GET 請求保留在瀏覽器歷史記錄中,GET 請求可被收藏為書簽,GET 請求不應在處理敏感數據時使用,GET 請求有長度限制,GET 請求只應當用于取回數據。post請求向指定的資源提交數據,POST 請求不會被緩存,POST 請求不會保留在瀏覽器歷史記錄中,POST 不能被收藏為書簽,POST 請求對數據長度沒有要求。還有一個區別是,使用get請求時,參數直接顯示在url中,安全性不高,而post請求將參數包含在請求體中。
    • 使用requests
      • 發出get與post請求
        In [8]: res = requests.get('http://www.baidu.com')
        In [9]: res2 = requests.post('http://www.baidu.com')
        
      • 設置請求參數,通過params參數設置請求參數,需要傳進一個字典,且值為none的鍵不會出現在url中
        In [10]: para = {'username':'xiaozhi','password':'testpass'}
        In [11]: res3 = requests.get('http://www.baidu.com',params=para)
        In [12]: res3.url
        Out[12]: u'http://www.baidu.com/?username=xiaozhi&password=testpass'
        
      • 為post請求傳遞數據使用data參數
        In [3]: data = {'key':'value'}
        In [4]: res = requests.post('http://httpbin.org/post', data=data)
        
        In [38]: payload = (('key1', 'value1'), ('key1', 'value2'))
        In [39]: r = requests.post('http://httpbin.org/post', data=payload)
        
      • 獲取響應內容
        字符串內容
        In [5]: res.text
        Out[5]: u'{"args":{},"data":"","files":{},"form":{"key":"value"},"headers":{"Accept":"*/*","Accept-Encoding":"gzip, deflate","Connection":"close","Content-Length":"9","Content-Type":"application/x-www-form-urlencoded","Host":"httpbin.org","User-Agent":"python-requests/2.18.4"},"json":null,"origin":"113.140.11.6","url":"http://httpbin.org/post"}\n'
        
        查看與設置內容編碼
        In [8]: res.encoding
        In [9]: res.encoding='utf-8'
        
        使用content屬性可以查看返回內容的字節內容,python會自動為我們解碼gzip壓縮的數據
        In [15]: res.content
        Out[15]: '{"args":{},"data":"","files":{},"form":{"key":"value"},"headers":{"Accept":"*/*","Accept-Encoding":"gzip, deflate","Connection":"close","Content-Length":"9","Content-Type":"application/x-www-form-urlencoded","Host":"httpbin.org","User-Agent":"python-requests/2.18.4"},"json":null,"origin":"113.140.11.6","url":"http://httpbin.org/post"}\n'
        
        json對象
        In [16]: res.json()
        Out[16]: 
        {u'args': {},
         u'data': u'',
         u'files': {},
         u'form': {u'key': u'value'},
         u'headers': {u'Accept': u'*/*',
          u'Accept-Encoding': u'gzip, deflate',
          u'Connection': u'close',
          u'Content-Length': u'9',
          u'Content-Type': u'application/x-www-form-urlencoded',
          u'Host': u'httpbin.org',
          u'User-Agent': u'python-requests/2.18.4'},
         u'json': None,
         u'origin': u'113.140.11.6',
         u'url': u'http://httpbin.org/post'}
        
        查看返回狀態碼
        res.status_code
        
        原始數據
        In [31]: res = requests.get('https://api.github.com/events', stream=True)
        
        In [32]: with open('temp.txt', 'wb') as fd:
            ...:     for chunk in res.iter_content(512):
            ...:         fd.write(chunk)
        
        查看返回的http頭部
        In [44]: r.headers
        Out[44]: {'Content-Length': '351', 'Via': '1.1 vegur', 'Server': 'gunicorn/19.8.1', 'Connection': 'keep-alive', 'Access-Control-Allow-Credentials': 'true', 'Date': 'Thu, 24 May 2018 12:13:11 GMT', 'Access-Control-Allow-Origin': '*', 'Content-Type': 'application/json'}
        
        使用headers參數定制請求頭
        In [33]: headers = {'user-agent':'myapp'}
        In [34]: res = requests.get('http://www.baidu.com', headers=headers)
        
        返回對象的cookies屬性保存了會話cookie,當需要重用cookies時,將cookie對象作為參數傳遞給請求的cookies參數
        res = requests.get(url,cookies=res.cookies)
        
        使用cookie模擬登陸豆瓣網站
        cookies = {}
        
        In [57]: raw_cookies='bid=-aa9Pl9eMB0; _pk_ref.100001.8cb4=%5B%22%22%2C%22%22%2C1527208498%2C%22http
            ...: s%3A%2F%2Fwww.baidu.com%2Flink%3Furl%3DFpVInsn4IT_ak-F56yaoXBUJPtBtueoUd3nVtc4NWZV4QBO8sdnc
            ...: vDJTEYLuefv5%26ck%3D1583.5.192.64.190.324.478.646%26shh%3Dwww.baidu.com%26wd%3D%26eqid%3D89
            ...: b868ea00032e0c000000035b06b157%22%5D; _pk_id.100001.8cb4=83b586dcea10d0e5.1519446169.2.1527
            ...: 209320.1519446169.; __utma=30149280.2141300691.1527208503.1527208503.1527208503.1; __utmz=3
            ...: 0149280.1527208503.1.1.utmcsr=baidu|utmccn=(organic)|utmcmd=organic; ll="118371"; _pk_ses.1
            ...: 00001.8cb4=*; __utmb=30149280.9.10.1527208503; __utmc=30149280; ps=y; push_noty_num=0; push
            ...: _doumail_num=0; __utmv=30149280.13784; ap=1; dbcl2="137847261:LmaeCQEh7Eo"; ck=x-vi; __utmt
            ...: =1'
        
        In [58]: for line in raw_cookies.split(';'):
            ...:     key,value = line.split('=', 1)
            ...:     cookies[key] = value
        In [64]: url = 'https://www.douban.com/people/xiaozhiAXX/'
        
        In [65]: res = requests.get(url,cookies=cookies)
        
        In [66]: res.status_code
        Out[66]: 200
        
        
        使用proxies參數設置代理,訪問google
        In [1]: import requests
        
        In [2]: proxy = {'http':'http://127.0.0.1:8118','https':'https://127.0.0.1:8118'}
        
        In [3]: res = requests.get('https://www.google.com', proxies=proxy)
        
        In [4]: res.status_code
        Out[4]: 200
        
  3. 網絡客戶端
    • 電子郵件
      python發送電子郵件時,使用標準庫中的smtplib和email,smptlib中有一個SMTP類,需要發送郵件時,初始化該類返回smtpserver對象,使用login登陸MUA,使用sendmail方法發送郵件,郵件的正文用email.mime.text.MIMEText對象進行描述
      簡單電子郵件發送程序
      from email.mime.text import MIMEText
      msg = MIMEText('hello message','plain', 'utf-8')
      from_addr = 'yourPhone@163.com'
      to_addr = 'yourQQ@qq.com'
      sub_msg = 'hello'
      smtp_server = 'smtp.163.com'
      import smtplib
      # 初始化smtp對象,傳入服務器地址與端口號
      server = smtplib.SMTP(smtp_server,25)
      # 設置調試模式可以讓我們看到發送郵件過程中的信息
      server.set_debuglevel(1)
      # 登陸MUA,使用賬戶與授權碼登陸
      server.login(from_addr, 'yourpassword')
      msg['From'] = from_addr
      msg['To'] = to_addr
      msg['Subject'] = 'important message'
      server.sendmail(from_addr, [to_addr], msg.as_string())
      

      郵件被放入垃圾郵件中,如下



      發送帶附件的電子郵件

       from email.mime.text import MIMEText
       from smtplib import SMTP
       from email.mime.multipart import MIMEMultipart
       
       
       from_addr = '18392136027@163.com'
       to_addr = '1786614260@qq.com'
       smtp_server = 'smtp.163.com'
       smtp_port = 25
       subject_msg = 'subject'
      
       mul_msg = MIMEMultipart()
       mul_msg['From'] = from_addr
       mul_msg['To'] = to_addr
       mul_msg['Subject'] = subject_msg
      
       msg = MIMEText('\n\rimportant message\n\r', 'plain', 'utf-8')
       mul_msg.attach(msg)
      
       att1 = MIMEText(open('program.txt','rb').read(), 'base64', 'utf-8')
       att1['Content-Type'] = 'application/octet-stream'
       att1["Content-Disposition"] = 'attachment;filename="program.txt"'
       mul_msg.attach(att1)
      
       smtp = SMTP(smtp_server, smtp_port)
       smtp.login(from_addr, 'youpass')
       smtp.set_debuglevel(1)
       smtp.sendmail(from_addr, to_addr, mul_msg.as_string())
       smtp.close()
      

      使用第三方開源庫yagmail發送電子郵件

      import yagmail
      yag = yagmail.SMTP(user='youQQ@qq.com', password='you pass', host='smtp.qq.com', port=25)
      contents = ['import message','program.txt']
      yag.send(to='dest', subject='subject', contents=contents)
      
      使用pop3協議用網易郵箱發送郵件時,容易被網易識別為垃圾郵件,可以使用qq郵箱
最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 227,572評論 6 531
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,071評論 3 414
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 175,409評論 0 373
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 62,569評論 1 307
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,360評論 6 404
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 54,895評論 1 321
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 42,979評論 3 440
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,123評論 0 286
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 48,643評論 1 333
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,559評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 42,742評論 1 369
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,250評論 5 356
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 43,981評論 3 346
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,363評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,622評論 1 280
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,354評論 3 390
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 47,707評論 2 370

推薦閱讀更多精彩內容