前言
這段時間在學(xué)習(xí)python,接觸到了網(wǎng)絡(luò)編程中的socket這塊,加上自己在用的Linux服務(wù)器都是原生支持python的,于是乎有了個做文件傳輸功能程序的想法。畢竟python語言中,有下載功能的框架一抓一大把,但是主機(jī)與主機(jī)間快速搭建文件(夾)傳輸通道的程序似乎不常見,因為我剛接觸python不久,有但是我不知道也不奇怪,總得來說,自己做一個練手,成就感滿滿。
項目地址
https://github.com/Ccapton/python-stuff/tree/master/filetransporter
實操預(yù)覽
思維導(dǎo)圖
以上思維導(dǎo)圖僅供參考,畢竟表達(dá)能力有限,具體功能要追究到代碼處才能分析其原理。
原理
基于socket的通信,相信會編程的朋友都不陌生,而通過socket來傳輸文件也是很常見的,但是這僅僅是對于單個文件來說很容易實現(xiàn)。如果是多文件呢?我在實現(xiàn)本系統(tǒng)之前嘗試了幾次,用單一socket通道來傳輸多文件不切實際,因為調(diào)用socket.recv()方法的時候,返回的數(shù)據(jù)格式是原始數(shù)據(jù)str類型,要分割不同文件的數(shù)據(jù)有很大難度。
因為涉及到接收、發(fā)送方兩端文件數(shù)據(jù)接收和發(fā)送進(jìn)度的統(tǒng)一性,就要用另外的指令來控制傳輸工作不亂套,于是我想到多開一個socket作為傳輸指令的通道,這樣指令和數(shù)據(jù)就分離了,也就容易控制傳輸工作了!所以有了指令線程
和數(shù)據(jù)線程
之分。
要實現(xiàn)傳輸整個文件夾,首先要遍歷這個文件夾,把在其內(nèi)的所有文件結(jié)構(gòu)準(zhǔn)確無誤的還原出來;因為是通過一個socket通過傳輸數(shù)據(jù),所以傳輸文件只能一個接一個來,這樣,文件的遍歷工作只能等前一個文件傳輸完畢后才能繼續(xù)進(jìn)行,于是又要對遍歷工作設(shè)計一番。經(jīng)過改造,我在文件查找(遍歷)器內(nèi)加入了while循環(huán)體和供外界繼承的回調(diào)類,這樣就能達(dá)到我想要的文件通過socket按順序傳輸?shù)男Ч恕?br> 文件查找器FileFinder(阻塞型)源碼:
import os,time
# 文件、文件夾尋找類 (阻塞型)
# 阻塞的設(shè)計: 為了等待調(diào)用者的耗時操作【否則很快就完成了文件的遍歷任務(wù),調(diào)用者達(dá)不到順序操作文件(夾)的意圖】
class FileFinder:
def __init__(self,finderCallback):
self.finderCallback = finderCallback
# 文件(夾)路徑下所有文件的總大小
self.sum_size = 0
# 調(diào)用者控制的參數(shù),若為False,則遍歷工作繼續(xù)進(jìn)行,若為True,則阻塞任務(wù),等待調(diào)用者完成它的其他耗時操作后在考慮是否改變此值
self.recycle = True
# 調(diào)用者控制的參數(shù),若為False,則正常工作,若為True,則當(dāng)recycle為False時遍歷工作不阻塞快速完成,recycle為True時遍歷工作阻塞
self.off = False
# 文件(夾)找到時的回調(diào)類
class FinderCallback:
# 找到文件夾
def onFindDir(self,dir_path):
pass
# 找到文件
def onFindFile(self,file_path,size):
pass
# 預(yù)留的刷新函數(shù)
def onRefresh(self):
pass
# 查找文件(夾)方法
def list_flie(self,root_dir):
if os.path.isfile(root_dir):
while self.recycle:
time.sleep(0.05)
if self.finderCallback:
self.finderCallback.onFindFile(root_dir,os.path.getsize(root_dir))
self.finderCallback.onRefresh()
if not self.off:
self.recycle = True
else:
dirlist = os.listdir(root_dir) # 列出文件夾下所有的目錄與文件
for dir in dirlist:
path = os.path.join(root_dir, dir)
if os.path.isfile(path):
while self.recycle:
time.sleep(0.05)
if self.finderCallback:
self.finderCallback.onFindFile(path,os.path.getsize(path))
self.finderCallback.onRefresh()
if not self.off:
self.recycle = True
else:
while self.recycle:
time.sleep(0.05)
if self.finderCallback:
self.finderCallback.onFindDir(path)
self.finderCallback.onRefresh()
if not self.off:
self.recycle = True
# 遞歸調(diào)用(當(dāng)遍歷到文件夾時,繼續(xù)遍歷,直到當(dāng)前文件夾下沒有文件夾為止)
self.list_flie(path)
通過繼承FileFinder的回調(diào)類FinderCallback,重寫其 onFindDir(self,dir_path) 和onFindFile(self,file_path,size)方法,在這兩個方法里面發(fā)送相關(guān)指令到接收端。
但最難的就是兩端的指令線程內(nèi)的socket指令信息的處理,這需要深入代碼去具體研究,本人能力有限,也就不細(xì)說了。需要研究一番的朋友,請移步該項目地址 https://github.com/Ccapton/python-stuff/tree/master/filetransporter
注意
運行接收端程序,需要一個能訪問的地址,也即是說最好是局域網(wǎng)內(nèi)進(jìn)行文件傳輸工作,因為局域網(wǎng)本地ip都是可以直接訪問的,若是在公共網(wǎng)絡(luò)傳輸文件,必須知道接收方主機(jī)的公網(wǎng)ip和內(nèi)網(wǎng)ip。
例如我現(xiàn)在用到接收方主機(jī)是騰訊云的主機(jī),內(nèi)網(wǎng)ip是10.135.xxx.xxx,公網(wǎng)ip是111.120.xxx.xxx。該主機(jī)內(nèi),運行接收(服務(wù))端程序
python3 ftserver.py -i 10.135.xxx.xxx -d /home/ubuntu/downloads
而在你的主機(jī)運行發(fā)送(客戶)端程序發(fā)送文件夾bilibili
python3 ftclient.py -i 111.120.xxx.xxx -f /Users/capton/desktop/bilibili
因為騰訊云、阿里云等國內(nèi)虛擬主機(jī)供應(yīng)商是采用NAT地址轉(zhuǎn)換對云主機(jī)進(jìn)行地址分配的,所以按照我上面的步驟來運行兩端程序才能連通。