Base64

Base64是什么?

個人理解:Base64是一種編碼方式,和ASCll一樣,只是一種編碼方式而已,但是兩者用到的場景不同。
我看到百度百科上的Base64解釋上有這樣一段話:

采用Base64編碼具有不可讀性,需要解碼后才能閱讀

總覺得‘閱讀‘這個詞怪怪的,在我碰到的業務場景中,列如圖片的Base64化傳輸、秘鑰密文的Base64化保存等,其原內容都不是需要人閱讀的,真正的’閱讀‘者都是機器。

思考Base64產生的原因

思考一個場景:對一段文字進行加密,并傳輸給服務端。

我們一般先會將這段文字轉成二進制數據,然后通過調用系統的加密算法,然后得到一串新的二進制數據,那么如何把這段二進制數據傳給服務端呢?

平時我們和服務端傳輸的數據基本都是utf8格式的,那么這段二進制數據能直接轉成utf8格式呢?顯然是不可能的,utf8的每個字節前幾位的bit都是有特殊含義的(具體看utf8的生成規則),但是加密得到的二進制數據肯定輸無序的,所以最好將密文的二進制數據先轉成一種能被utf8編碼的格式,然后就能和服務端進行utf8格式的通信了

我們來看看平時常常提到的幾種編碼格式。

先看看utf16utf32,其實他們和utf8一樣,都是對Unicode碼的一種編碼。我們從電腦屏幕上看到的每一個字,每一個符號,甚至有些表情都對應一個Unicode碼,那么可以用Unicode碼編碼密文二進制數據么?答案是不可以。拿utf32舉例,它其實就是用4個字節表示一個Unicode碼,但4個字節有多少種組合呢?2^{(4*8)}種,Unicode碼的個數只是其中的一部分,但是Unicode碼并不是固定的,它每年還在增加。如果密文數據正好落在Unicode碼沒有的地方,系統就展示不出來了。而且如果真有一段密文用utf16展示,里面出現了英文、中文、韓文、數學符號、表情等,你會不會瘋掉(手動滑稽)

ASCll碼表示,似乎是一個很好的注意,因為ASCll碼已經排滿,能做到二進制和符號一一對應的關系。但為什么不可以呢,或者說有什么不方便呢?一方面ASCll碼中有許多特殊字符,列如'"\等等,在展示的時候,有些地方需要加轉義符,有些地方不需要添加,會比較混亂。另一方面ASCll碼排在前面的一些位置并不是符號能展示出來,列如7號位的響鈴。

其實到這里離Base64的產生已經很接近了。如果我們把ASCll碼中那些不能展示出來的位置,和一些特殊字符的位置去掉,形成一種新的編碼,那就能很好的展示出密文內容了。基礎的ASCll碼占7個bit位,如果去掉一些,那新的編碼格式就用6個bit位好了,2^6 = 64Base64就應運而生了。

當然,上面都是我個人的理解。Base64算法主要最早用于解決電子郵件傳輸問題。在早期,由于歷史問題,電子郵件只允許傳輸ASCII碼字符。當傳輸非ASCII碼時,網關很可能將非ASCII碼的二進制位調整,即將非ASCII碼的8位二進制的最高位設為0。當用戶收到郵件時,可想而知,收到的就是 一份亂碼的郵件。

Base64的規則

所謂的Base64,就是64個符號來表示6個bit位的二進制流。這64個符號分別為a-z,A-Z,0-9及+/。這里有張對照表

索引 符號 索引 符號 索引 符號 索引 符號
0 A 16 Q 32 g 48 w
1 B 17 R 33 h 49 x
2 C 18 S 34 i 50 y
3 D 19 T 35 j 51 z
4 E 20 U 36 k 52 0
5 F 21 V 37 l 53 1
6 G 22 W 38 m 54 2
7 H 23 X 39 n 55 3
8 I 24 Y 40 o 56 4
9 J 25 Z 41 p 57 5
10 K 26 a 42 q 58 6
11 L 27 b 43 r 59 7
12 M 28 c 44 s 60 8
13 N 29 d 45 t 61 9
14 O 30 e 46 u 62 +
15 P 31 f 47 v 63 /

具體來說,轉換方式可以分為四步。

  • 第一步,將每三個字節作為一組,一共是24個二進制位。
  • 第二步,將這24個二進制位分為四組,每個組有6個二進制位。
  • 第三步,在每組前面加兩個00,擴展成32個二進制位,即四個字節。
  • 第四步,根據下表,得到擴展后的每個字節的對應符號,這就是Base64的編碼值。

舉一個具體的實例,演示英語單詞Man如何轉成Base64編碼。


image.png
  • 第一步,"M"、"a"、"n"的ASCII值分別是77、97、110,對應的二進制值是01001101、01100001、01101110,將它們連成一個24位的二進制字符串010011010110000101101110。
  • 第二步,將這個24位的二進制字符串分成4組,每組6個二進制位:010011、010110、000101、101110。
  • 第三步,在每組前面加兩個00,擴展成32個二進制位,即四個字節:00010011、00010110、00000101、00101110。它們的十進制值分別是19、22、5、46。
  • 第四步,根據上表,得到每個值對應Base64編碼,即T、W、F、u。

因此,Man的Base64編碼就是TWFu。

如果字節數不足三,則這樣處理:

  • 二個字節的情況:將這二個字節的一共16個二進制位,按照上面的規則,轉成三組,最后一組除了前面加兩個0以外,后面也要加兩個0。這樣得到一個三位的Base64編碼,再在末尾補上一個"="號。
    比如,"Ma"這個字符串是兩個字節,可以轉化成三組00010011、00010110、00010000以后,對應Base64值分別為T、W、E,再補上一個"="號,因此"Ma"的Base64編碼就是TWE=。
  • 一個字節的情況:將這一個字節的8個二進制位,按照上面的規則轉成二組,最后一組除了前面加二個0以外,后面再加4個0。這樣得到一個二位的Base64編碼,再在末尾補上兩個"="號。
    比如,"M"這個字母是一個字節,可以轉化為二組00010011、00010000,對應的Base64值分別為T、Q,再補上二個"="號,因此"M"的Base64編碼就是TQ==。
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 228,119評論 6 531
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,382評論 3 415
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 176,038評論 0 373
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 62,853評論 1 309
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,616評論 6 408
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 55,112評論 1 323
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,192評論 3 441
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,355評論 0 288
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 48,869評論 1 334
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,727評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 42,928評論 1 369
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,467評論 5 358
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,165評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,570評論 0 26
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,813評論 1 282
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,585評論 3 390
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 47,892評論 2 372