破解js反爬機制的有道翻譯——制作個人翻譯工具

  • 效果圖

    (界面有點丑,將就看吧。。。)

  • 這類公用資源網站,在你需要翻譯的時候,需要的是進入他們的網站進行操作,大批量的翻譯,同樣的是需要調用他們的接口,收費。。。
  • 這個時候我們想用他們的數據庫來獲得自己的需求,在我進行的分析的時候,有道翻譯問題還是在他們的有些表單數據是進行js加密操作的,不能直接請求數據!
  • 得,直接進入主題吧。

  • 首先我們正常的爬蟲程序,就是在導包后,填入真正的url地址去訪問;
  • 進入有道翻譯網頁按F12進入開發者模式,找到存在真正url地址的包,輸入翻譯詞匯,后如下圖:


    流程1
  • 找到真實url,同時data表單數據也在下面:


    流程2
  • 我們會發現,i其實是我們輸入的翻譯詞匯,這里還有三處數據很關鍵,分別是salt、ts、sign,都是進行加密的數據(難不倒我們,往下看!)
  • 所以我們進行的是post隱式請求!!!
  • 開始逆向js查找數據加密的地方,那我們查找salt,會得到一串js,在進行美化一下:


    流程3
  • 再在這里面搜索salt,會得到很多處都有salt


    流程4
  • 在查找的過程中花費一段時間哈。。。
  • 直接跳了,找到如下圖:


    流程5
  • 在第4處這個地方!
  • 就可以清楚的看到加密數據是怎么傳遞生成的,分別是salt、ts、sign!
  • 到這里,我們獲得了url、headers、表單數據及其中的加密數據!
  • 同時,我們對程序進行GUI界面化,更加直觀,再打包!

代碼

import requests,time,random,hashlib,json
from tkinter import *
from tkinter import messagebox

# 界面控制
def fanyi():
    text = entry.get()
    text = text.strip()
    print(text)
    if text == '':
        messagebox.showinfo('提示:','請輸入')
    else:
        result,result_detail = parse(text)
        # 進行界面排版
        theLabel = Label(room, text='翻譯:'+'\n'+result+'\n'+'\n'+'詳細翻譯:'+'\n'+result_detail, font= ('黑體',15), fg='red')
        theLabel.grid(row=1, column=1)

# 翻譯結果返回
def parse(text):

    # 網址
    url = 'http://fanyi.youdao.com/translate_o?smartresult=dict&smartresult=rule'

    # 逆向js解析表單數據
    ts = str(int(time.time()*1000))
    salt = ts + str(random.randint(0, 10))
    # md5加密
    md5 = hashlib.md5()
    encryption = 'fanyideskweb' + text + salt + "n%A-rKaT5fb[Gy?;N5@Tj"
    md5.update(encryption.encode("utf-8"))
    sign = md5.hexdigest()

    # 表單
    data = {
        'i': text,
        'from': 'AUTO',
        'to': 'AUTO',
        'smartresult': 'dict',
        'client': 'fanyideskweb',
        'salt': salt,
        'sign': sign,
        'ts': ts,
        'bv': '7e3150ecbdf9de52dc355751b074cf60',
        'doctype': 'json',
        'version': '2.1',
        'keyfrom': 'fanyi.web',
        'action': 'FY_BY_CLICKBUTTION'
    }

    # 請求headers
    headers = {
        'Accept': 'application/json, text/javascript, */*; q=0.01',
        'Accept-Encoding': 'gzip, deflate',
        'Accept-Language': 'zh-CN,zh;q=0.9,en;q=0.8,zh-HK;q=0.7,zh-TW;q=0.6',
        'Connection': 'keep-alive',
        'Content-Length': '242',
        'Content-Type': 'application/x-www-form-urlencoded; charset=UTF-8',
        'Cookie': 'OUTFOX_SEARCH_USER_ID_NCOO=101631173.1664094; OUTFOX_SEARCH_USER_ID="1817802748@10.169.0.84"; _ntes_nnid=c5aaa2bceb9489aff9a93944a0e70db5,1564971812601; JSESSIONID=aaaXCWGeXbuZff2fbSgZw; ___rl__test__cookies=1566701790595',
        'Host': 'fanyi.youdao.com',
        'Origin': 'http://fanyi.youdao.com',
        'Referer': 'http://fanyi.youdao.com/',
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.100 Safari/537.36',
        'X-Requested-With': 'XMLHttpRequest',
    }

    request = requests.post(url=url,data=data,headers=headers)
    details = request.text
    '''
    # json字符串
    <class 'str'>
    {"translateResult":[[{"tgt":"你好","src":"hello"}]],"errorCode":0,"type":"en2zh-CHS",
        "smartResult":{"entries":["","n. 表示問候, 驚奇或喚起注意時的用語\r\n","int. 喂;哈羅\r\n","n. (Hello)人名;(法)埃洛\r\n"],"type":1}}
    '''
    translateResult = json.loads(details)
    result = translateResult["translateResult"][0][0]['tgt']
    # print('翻譯:', translateResult["translateResult"][0][0]['tgt'])
    # print('詳細翻譯:',''.join(translateResult["smartResult"]["entries"]))
    try:
        result_detail = ''.join(translateResult["smartResult"]["entries"])
    except:
        result_detail = '無詳細翻譯!'
    return result,result_detail


room = Tk()

room.title("翻譯")

room.geometry('800x300+500+300')

label = Label(room, text = '輸入', font= ('黑體',25), fg='black')

label.grid()

entry = Entry(room, font = ('微軟雅黑',20))
entry.grid(row= 0, column=1)
button = Button(room,text = '進行翻譯', font=('微軟雅黑',20), command= fanyi)
button.grid(row= 0, column=2)

room.mainloop()
#打包命令:pyinstaller -F -i gg.ico youdao.py
  • 打包成exe可執行文件命令:pyinstaller -F -i gg.ico youdao.py
注意
  • 最后返回來的數據是json字符串。。。

不要溫順的走進那良夜
最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 227,663評論 6 531
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,125評論 3 414
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 175,506評論 0 373
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 62,614評論 1 307
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,402評論 6 404
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 54,934評論 1 321
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,021評論 3 440
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,168評論 0 287
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 48,690評論 1 333
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,596評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 42,784評論 1 369
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,288評論 5 357
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,027評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,404評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,662評論 1 280
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,398評論 3 390
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 47,743評論 2 370

推薦閱讀更多精彩內容