python電子郵件系列(一)之MIME及電子郵件基本結(jié)構(gòu)

MIME及電子郵件基本結(jié)構(gòu)

MIME

MIME(Multiplepurpose Internet Mail Extensions),中譯為“多用途互聯(lián)網(wǎng)郵件擴(kuò)展”,顧名思義,這是對傳統(tǒng)互聯(lián)網(wǎng)郵件的擴(kuò)展,現(xiàn)已稱為實(shí)際的互聯(lián)網(wǎng)郵件標(biāo)準(zhǔn)。

指的是一系列電子郵件的技術(shù)規(guī)范,主要包括:RFC 2045、RFC 2047、RFC 4288、RFC 4289、RFC 2077

傳統(tǒng)的電子郵件是1982年定下的,即:RFC 822

它有一個重要的特點(diǎn)就是電子郵件只能使用ASCII字符。這導(dǎo)致了三個結(jié)果:1)非ASCII字符如中文非英語字符都不能出現(xiàn)在郵件中。2)電子郵件中不能插入二進(jìn)制文件(如圖片)3)電子郵件不能有附件

這實(shí)際上是無法接受的,因此到了1992年,工程師決定擴(kuò)展電子郵件的技術(shù)規(guī)范,提出一系列補(bǔ)充規(guī)范,這就是MIME的由來。

電子郵件基本結(jié)構(gòu)

下面是一封傳統(tǒng)的電子郵件:

From: "Tommy Lee" <lee@example.com>
To: "Jack Zhang" <zhang@example.com>
Subject: Test
Date: Wed, 17 May 2000 19:08:29 -0400
Message-ID: <NDBBIAKOPKHFGPLCODIGIEKBCHAA.lee@example.com>

Hello World.

從上面可以看出發(fā)件人的姓名,地址,收件人的姓名,地址,郵件主題,發(fā)信日期。

結(jié)構(gòu)上,這封信分為三個部分:首先是信件頭,然后是一個空行,最后是新建內(nèi)容。收件人的客戶端只會顯示最后一部分,要查看全信,必須“查看原始郵件”功能。

MIME對傳統(tǒng)郵件的擴(kuò)展主要便現(xiàn)在它在信頭部分添加了幾條語句,主要有三條:

MIME-Version: 1.0

這條語句是必須的,而且這個1.0是不變的,即使MIME已經(jīng)升級了好幾個版本

Content-Type: text/html; charset="UTF-8"

Content-Type表明信息類型,缺省值為“Text/plain”。它包含了主要類型/次要類型(maintype/subtype),主要類型有九中,分別是application、audio、example、image、message、model、multiple、text、video。

每一種主要類型下面又有許多次要類型,常見的有:

text/plain:純文本,文件擴(kuò)展名為.txt
text/html:HTML文本,文件擴(kuò)展名為.html和.htm
image/jpeg:jpeg格式的圖片,文件擴(kuò)展名.jpg
image/gif:GIF格式的圖片,文件擴(kuò)展名為.gif
audio/x-wave:WAVE格式的文件,文件擴(kuò)展名為.wav
audio/mpeg:MP3格式的音頻,文件擴(kuò)展名.mp3
video/mpeg:MPEG格式的視頻,文件擴(kuò)展名.mpg
application/zip:PK-ZIP格式的壓縮文件,文件擴(kuò)展名.zip

如果信息類型是Text/plain,那么還必須指明編碼類型“charset”,缺省值是ASCII,其他可能值有ISO-8859-1,UTF-8,GB2312等等

整個Content-Type這一行,不僅使用在電子郵件,后來也被移植到了HTTP協(xié)議中,所以現(xiàn)在只要是在網(wǎng)上傳播的HTTP信息,都帶有Content-Type頭,以表明信息類型

前面已經(jīng)說過,電子郵件的傳統(tǒng)格式不支持非ASCII字符和二進(jìn)制,因此MIME添加了第三條語句:

Content-transfer-encoding: base64

為了使非ASCII字符轉(zhuǎn)化為ASCII,這條語句指明了編碼轉(zhuǎn)化的方式,正常我們將中文等字符按照utf-8gbk等編碼方式編碼為二進(jìn)制后,因?yàn)槭欠茿SCII字符,所以需要再將這些非ASCII字符的二進(jìn)制轉(zhuǎn)化為ASCII字符的二進(jìn)制,base64就可以起到這樣的作用。在之前的有一篇博客詳細(xì)介紹過此種編碼轉(zhuǎn)化。

Content-transfer-encoding的值有5種----7bit、8bit、binary、quoted-printablebase64----其中7bit是缺省值,即不用轉(zhuǎn)化的ASCII字符。

base64之外,常用的就是quoted-printable,它主要用于ACSII文本中夾雜少量非ASCII碼字符的情況,不適合于轉(zhuǎn)換純二進(jìn)制文件。

以下是一封郵件的源碼:

Date: Wed, 18 Jun 2008 18:07:51 +0800 (CST)
From: xxx <xxx@163.com>
To: yifeng.ruan@gmail.com
Message-ID: <14410503.1073611213783671983.JavaMail.coremail@bj163app54.163.com>
Subject: =?gbk?B?xOO6ww==?=
MIME-Version: 1.0
Content-Type: multipart/alternative; 
boundary=&quot;----=_Part_287491_22998031.1213783671982&quot;

------=_Part_287491_22998031.1213783671982
Content-Type: text/plain; charset=gbk
Content-Transfer-Encoding: base64

IAq4+b7dsr+209PQudi55raoo6yyu7XD1Nq12Le9yM66zs341b7Jz7nSz+DTprXEtqvO96Osx+vE
49TaxOO1xLKpv83W0AogIArW0Ln6yr2x6tPvIC0gyO7Su7fltcTN+MLnyNXWvgoKtcS12jEy1cXN
vMasyb6z/aOst/HU8s7Sw8fXt76/xOO1xM/gudjU8MjOoaPQu9C7us/X96OhtMvNvMas1Nq4vbz+
wO/D5g==
------=_Part_287491_22998031.1213783671982
Content-Type: text/html; charset=gbk
Content-Transfer-Encoding: quoted-printable

<DIV>&amp;nbsp;</DIV>
<DIV>=B8=F9=BE=DD=B2=BF=B6=D3=D3=D0=B9=D8=B9=E6=B6=A8=A3=AC=B2=BB=B5=C3=D4=
=DA=B5=D8=B7=BD=C8=CE=BA=CE=CD=F8=D5=BE=C9=CF=B9=D2=CF=E0=D3=A6=B5=C4=B6=AB=
=CE=F7=A3=AC=C7=EB=C4=E3=D4=DA=C4=E3=B5=C4=B2=A9=BF=CD=D6=D0</DIV>
<DIV>&amp;nbsp;
......

其中的MIME語句是:

MIME-Version: 1.0
Content-Type: multipart/alternative; 
boundary=&quot;----=_Part_287491_22998031.1213783671982&quot;

Content-Type: multipart/alternative表明這封信的內(nèi)容是純文本與HTML文本的混合。該項(xiàng)還有其他兩個可能的值,分別是“multiple/mixed”,“multiple/related”,前者表示信件內(nèi)容含有二進(jìn)制內(nèi)容(比如文中插入圖片),后者表示含有附件。

boundary=&quot;----=_Part_287491_22998031.1213783671982&quot boundary后的內(nèi)容----=_Part_287491_22998031.1213783671982是信件不同部分的分割線,它通常是一個很長的隨機(jī)字符串。

信件內(nèi)容又有兩個子信件頭:

Content-Type: text/plain; charset=gbk
Content-Transfer-Encoding: base64
Content-Type: text/html; charset=gbk
Content-Transfer-Encoding: quoted-printable

表明信件的第一部分是gbk編碼的純文本,其編碼轉(zhuǎn)換方式是:base64

第二部分是gbk編碼的HTML文本,其編碼轉(zhuǎn)換方式是:quoted-printable

郵件里所有的內(nèi)容都要經(jīng)過編碼為二進(jìn)制,再將二進(jìn)制通過base64QP編碼為ASCII字符在網(wǎng)絡(luò)上傳輸。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 228,030評論 6 531
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 98,310評論 3 415
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 175,951評論 0 373
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經(jīng)常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 62,796評論 1 309
  • 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 71,566評論 6 407
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 55,055評論 1 322
  • 那天,我揣著相機(jī)與錄音,去河邊找鬼。 笑死,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,142評論 3 440
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 42,303評論 0 288
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 48,799評論 1 333
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 40,683評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 42,899評論 1 369
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,409評論 5 358
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 44,135評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,520評論 0 26
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,757評論 1 282
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,528評論 3 390
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 47,844評論 2 372

推薦閱讀更多精彩內(nèi)容