如果圖片失效:見【教程&工具】微信同步文章到Bear
在我日常工作中,我會將各種互聯網以及生活中產出的信息匯總到Bear,再通過Bear的云同步使我各個終端的信息保持一致。
以前在使用有道云筆記的時候,有個功能我很喜歡,就是當看到一篇想收藏的文章的話,就可以直接右上角發送到有道云筆記,如下圖:
順便一提:熊掌記是一款優雅、靈活的寫作筆記應用。
回到正題,我現在面臨的需求是能不能在看到喜歡的文章的時候,也通過類似于右上角分享一下
就可以直接將文章同步到我各個終端上的Bear
,最終成果如下:
解決方案
要實現上述的需求,我大概思考了如下的解決方案:
- 準備一個微信號(這里直接稱作小號)專門接收待收藏到Bear的文章
- 編寫一個服務監控小號的消息,比如收到推文類型的消息就進行內容提取
- 監控服務將提取后的內容發送到Bear(這里要求服務運行在Mac OS上)
所以在繼續之前,你需要有以下條件:
- 基本的Python基礎知識(寫小腳本Python真的很方便)
- 一臺裝有Bear的Mac OS
方案調研
上面的解決方案看起來還是挺好實現,第一步不用多說,這年頭誰沒個小號,第二點的話,我印象中Python是有個第三方庫可以直接監聽微信對應賬號的消息。
因為這些第三方庫都是基于Web
版的微信,所以在使用之前我想驗證下此方案是否可行,剛準備登錄網頁版微信,就直接提示:
<error><ret>1203</ret><message>To protect your account, logging in to WeChat via the web has been suspended. Use WeChat for Windows or WeChat for Mac to log in on a computer. Download WeChat for Windows or Mac at http://wechat.com.</message></error>
[圖片上傳失敗...(image-1157a-1571723347291)]
果不其然現在微信準備加強Web
版本的限制了,心里涼涼的,第二步還沒開始就已經被宣判死刑。
只能換個思路了,怎么辦。其實這一步走不通我還是能接受的,因為我一直覺得依賴Web
版總有一天會掛掉,畢竟多了個依賴總是會增加復雜度。
能不能依靠客戶端?
我們知道,微信數據是有同步功能的,開發過客戶端的都知道,這就意味著微信的數據必然保存一份在客戶端本地系統上。
所以對于第二點的解決思路就轉換成了如何獲取微信保存在客戶端本地的數據,找到某個軟件的數據文件夾自然是很簡單的事情,比如微信客戶端的數據就存放在:
# howie6879是我的用戶名,請自行替換
/Users/howie6879/Library/Containers/com.tencent.xinWeChat/Data/Library/Application Support/com.tencent.xinWeChat/2.0b4.0.9
具體有如下目錄:
├── 988eebd1078a0d794bff2b6f5c8d5176
├── Avatar
├── CGI
├── CrashReport
├── KeyValue
├── MMResourceMgr
├── checkVersionFile
├── d41d8cd93400b204e9800998ecf8427e
├── f965739b566114f907dc394322e1e826
├── topinfo.data
├── upgradeHistoryFile
├── whatsNewVersionFile
└── wx.dat
8 directories, 5 files
不知道上面那三個32位的字符串大家看起來熟悉不熟悉:
一想到32
,就是md5
加密,我第一反應就是對于每個登錄賬號的id加密值,我們先不管,直接進去看更深一層的文件夾:
├── Account
├── Avatar
├── Contact
├── Favorites
├── FileStateSync
├── FunctionMsg
├── Group
├── Message
├── RevokeMsg
├── Session
├── Stickers
├── Sync
├── complexSearch
├── mmexpt
└── newabtest
15 directories, 0 files
Message
出來了,這是不是我們想要的呢?再往下看里面的目錄:
├── MessageTemp
├── fts
├── msg_0.db
├── msg_0.db-backup
├── msg_0.db-shm
├── msg_0.db-wal
├── msg_1.db
如果你登錄過該臺電腦并同步過信息,那么不出意外會有挺多*.db
后綴的文件。大膽地猜測一下,這是不是我們想要的聊天數據存放路徑呢?
不要管太多,先看看總不會錯,一般本地存儲的數據庫,咱們程序員第一反應應該就是SQLite
,要不要試試?
sqlite3 Message/msg_0.db
sqlite> .schema
Error: file is not a database
sqlite>
??提示不是數據庫,此時陷入了瓶頸,怎么就不是數據庫了呢。反思一下,是不是打開的姿勢不對。
會不會是加密了?依照這個思路,我了解到有一款基于SQLite
的擴展數據庫[SQLCipher](https://github.com/sqlcipher/sqlcipher,SQLCipher
是一個在SQLite
基礎之上進行擴展的開源數據庫,它主要是在SQLite
的基礎之上增加了數據加密功能。
實踐證明,我猜想的是對的,接下來主要做的怎么打開Message/msg_0.db
這個文件并成功讀取里面的數據。
最后我參考到一份有意思的問答,我就是參考這個問答對數據庫進行解密,這里我復述一下:
- 打開微信,但是先不登錄
- 打開終端,輸入
lldb -p $(pgrep WeChat)
- 會看到進入了
lldb
,然后輸入br set -n sqlite3_key
,按回車 - 在
lldb
中,輸入c
,按回車 - 打開微信并掃碼登錄
- 然后回到
lldb
中,輸入memory read --size 1 --format x --count 32 $rsi
此時就會得到以下類似的輸出:
0x600003888340: 0xd1 0x05 0x29 0x04 0x75 0xc5 0x45 0x05
0x600003888348: 0x92 0x26 0xa1 0x65 0x95 0xe5 0x15 0x3f
0x600003888350: 0xf3 0xc7 0x43 0x85 0x05 0x35 0x45 0x3d
0x600003888358: 0x84 0xc8 0x64 0xe5 0x35 0x65 0x45 0xe2
去掉冒號前面的那一串,后面是四行八列的數據,再去除掉0x
、空格
、\n
等,就會得到一串64位的字符串,舉個例子:
df012f587cc546000025a56599e81530f9cc49800329423d8ec460e1386549e2
這就是我們進入數據庫的鑰匙,接下來,請安裝sqlcipher的相關軟件,如:
brew install sqlcipher
brew cask install db-browser-for-sqlite
讓我們用db-browser-for-sqlite
打開db
后綴的文件看看有什么不一樣吧:
點擊OK
,成功打開!
隨便進入一個表:
很顯然,我們成功獲取了本地的聊天記錄,總算將第二步流程打通了,如今我們可以監控發送收藏文章的微信賬戶的聊天記錄,只要收到此賬號發來的推文消息,此時監控服務可以立馬反應過來并解析發送到Bear。
有個小問題,怎么知道發推文的賬號在哪個庫哪個表呢?可以這樣看,在電腦上登錄發推文的賬號,打開文件userinfo.data
:
cd /Users/howie6879/Library/Containers/com.tencent.xinWeChat/Data/Library/Application Support/com.tencent.xinWeChat/2.0b4.0.9/988eebd1023a0d794bff2b6f5c8d5176/Account
cat userinfo.data
大概輸出如下:
":BHPpx??127417592694754732??wxid_epXXXXXXXfj12? Howie6879?老胡的儲物柜?
這里很明顯我的wxid
就是:wxid_epXXXXXXXfj12
,那么對應需要監控的表名就是:Chat_md5(wxid_epXXXXXXXfj12)
,形式如同這樣
Chat_f965739xxxx114fxxxxc394322exxxx
隨后實現在庫里面找到對應的表即可,我本機發現對應賬戶的表存在于庫 msg_5.db
中。
接下來要做的事情就很簡單了,就是將提取后的內容發送到Bear,這里可以利用X callback url Scheme documentation,比如你在終端輸入:
open 'bear://x-callback-url/create?title=Test%20Bear&text=Hello%20Bear'
立馬就可以看到Bear自動建立了一篇筆記
編碼實現
終于到了編碼階段,好心酸:
第一步,拿到必須要的常量:
- S_ACCOUNT_ID:微信發送賬戶ID,可以在
Account/userinfo.data
下查看 - R_ACCOUNT_ID:微信接收賬戶ID,同上
- RAW_KEY:解密Key,就是上面介紹的64位字符串
- DB_PATH_TEM:定義的是消息DB路徑,比如:"/Users/howie6879/Library/Containers/com.tencent.xinWeChat/Data/Library/Application Support/com.tencent.xinWeChat/2.0b4.0.9/{0}/Message/"
定義這四個常量,接下來的事情就一帆風順了哈,我將項目開源在Github
,地址見w2b,接下來我直接說說怎么用:
git clone https://github.com/howie6879/w2b
cd w2b
# 推薦使用pipenv 你也可以使用自己中意的環境構建方式
pipenv install --python=/Users/howie6879/anaconda3/envs/python36/bin/python3.6 --skip-lock
# 運行前需要填好配置文件
pipenv run python w2b/run.py
隨后,會有日志輸出:
[w2b] pipenv run python w2b/run.py
Loading .env environment variables…
[2019:09:13 09:16:35] INFO w2b 目標表 Chat_f965739b676114fxxxxc394322e1e826 存在于庫 msg_5.db
好,代碼跑起來后,接下來電腦上登錄你的小號(也就是接收微信文章的微信號),然后在手機上登錄發送文章的微信號,最終成功就和文章一開始的動圖一樣了~
搞定收工,有興趣歡迎關注我的公眾號: