Python進階1 - 正則表達式: 轉義字符與原始字符串詳解

這邊文章默認使用了富文本編輯器,請到另一篇相同內容的MarkDown編輯過的內容中查看,連接如下

小馬哥在使用正則表達式面對轉義字符的時候,發現字符串的轉義與正則的轉義有沖突的時候,總是有些不難,但是讓人感覺沒規律的地方,于是就專門研究了一下,首先捋一下知識點,約定一個前提概念:

轉義字符: 屬于字符串的概念,作用于打印. 例如,要完成一個退格,一個制表符,一個換行,這個用字符串如何表示?

? ? 簡單,"\b,\t,\n",不過是用"\"來轉義一下普通字符嘛,是的,因為b,t,n是普通字符,如果直接輸出,當然就是字符,于是加上"\",打印的時候就是另一種意思了,這個打印,可以是輸出到屏幕,也可以是其它輸出

正則表達式中的轉義: 看到這里,你會想起,正則里面好像也有轉義的概念,例如,"."代表匹配字符串里面的任意字符(換行符除外),如果需要匹配真正的"."這個字符怎么辦?于是我們用轉義字符"\."就代表匹配字符串中的"."了.

你有沒有想過這個問題,字符串中的轉義和正則中的轉義不是一套概念體系,如果兩者沒有表達上的沖突,那么相安無事,可是狀況恰恰是有沖突的,"\b"在字符串中表示轉義后的結果: 退格;而在正則中代表匹配目標字符串的邊界. 于是就要想辦法解決沖突: 定義了原始字符串來屏蔽掉沖突.

只看說明,你還是一頭蒙的,那么看例子來闡述一遍上面所有的問題:

```python

# 字符串中的轉義: 斜杠\代表轉義字符,\b代表轉義之后的字符串,是退格

data = '123\b456'

# 顯示一下結果

print(data)? ? #發現被轉義后: 12456

data = '123\n456'

print(data)? ? #換行: 就是通過轉義符把n進行轉義表示回車

```

? ? 123456

? ? 123

? ? 456

如上還有\t制表符也是同樣的意思,這些,都是來自于ASCII對字符的規定,記住: 這些屬于字符串中的轉義

下面看看正則的轉義

```python

import re

print('第一次試驗')

data = 'hello1 python,hello2 java'

pattern = '\bhello.'

result = re.findall(pattern,data)

print(result)

'''

分析:

這個時候的正則表達式模式,沒有匹配到期望的hello1與hello2,因為\b這里代表的不是正則的邊界

1,pattern = '\bhello.',首先是一個字符串,就要接受字符串的處理,

? ? 根據ASCII表,\b是退格,是一個看不到的字符,所以'\b'是一個字符,hello是另外的字符,

2,我們期望的正則模式是: '邊界hello.',這個"邊界"的表示方法和字符的ASCII碼沖突,沒有體現出來

于是,清楚了原因,我們應該設計一個模式,在經歷字符串ASCII解析后,再傳遞給正則引擎之后是\bhello

應該這樣寫: '\\bhello'

'''

print('第二次試驗')

data = 'hello1 python,hello2 java'

pattern = '\\bhello.'? #這時,經過字符的ASCII表解析后,得到的字符串是'\bhello'

result = re.findall(pattern,data)

print(result)

'''

到此,你心里應該有了一個: 計算機內部針對字符 - ->模式的過程

不是你寫了一個字符串,它就是正則的模式了,而是計算機內部要根據ASCII碼進行了解析,解析的結果,拿給了正則引擎去用來搜索目標文本,

而ASCII碼解析后的結果,和你期望的正則的模式發生變化了,所以正則表達式解析來的結果,不如我們期望的

'''

```

? ? 第一次試驗

? ? []

? ? 第二次試驗

? ? ['hello1', 'hello2']

如果通過上面的例子,你懂了ASCII碼在暗中干了一件'見不得人'的事,如果你的腦力還夠用,那么咱們再來看一個它的更有意思的事情

需求: 'python\java\go\c',解析出里面的"\",在字符概念領域,它是轉義字符,在正則領域,它也是轉義字符,如何操作呢?

上面,我們主要目的:讓你知道,ASCII碼和正則,針對轉義是不同的,有沖突的,例如,\b在兩者概念體系中就沖突了,

```python

import re

data = 'python\java\go\c'

'''

pattern1

這個都不用試驗,肯定是錯的,語法錯誤,解析都通不過,相當于,你想打印" ' "單引號,但是字符串的定義就是用單引號或者雙引號來表示

\'相當于失去了字符串"'"的定義作用,而把"'"看做普通字符,那么這樣,字符串的pattern1,就沒有了字符串的結尾符了,必然錯誤

'''

# pattern1 = '\'? #必須注釋了,語法都通不過檢查

'''

pattern2

用上一個例子中分析的結果,我們用轉義字符把斜杠處理過,得到就是ASCII處理后的"\",再拿去交給正則引擎,這個時候正則我們應該沒問題了

的確,這里經過ASCII碼處理,最終交給正則的是"\",這個時候就該正則引擎起作用了,對于它"\"也是一個轉義符,可只要\這是一個不完整的轉義

于是拋出error: bad escape (end of pattern) at position 0

'''

try:

? ? pattern2 = '\\'? ?

? ? print(pattern2)

? ? result2 = re.findall(pattern2,data)

? ? print(result2)

except Exception as e:

? ? print("Error: ",e)

'''

pattern3

我們應該傳遞給正則解析引擎一個"\\",經過正則處理,它會得到"\"這個僅僅代表字符的模式,拿著去和目標文本比對,搜索目標"\"

'\\\\'經過ASCII碼處理,得到"\\",正則引擎處理'\\',得到'\'

'''

pattern3 = '\\\\'

result3 = re.findall(pattern3,data)

print(result3)

```

? ? \

? ? Error:? bad escape (end of pattern) at position 0

? ? ['\\', '\\', '\\']

經過上面兩個例子:

例一,你應該明白了,一個字符串能作為正則的模式,中間是經過ASCII碼轉換的,但是為什么"\d","\w"等就相安無事呢?因為ASCII碼沒"整"它們;

例二,對于"\"這種比較特殊的東東,經過ASCII和正則的兩次轉義,語法都要正確,才能去匹配目標文本中的目標字符

有沒有一種方式,不用這么麻煩,于是出現了原始字符串.

看例三,原始字符串的用法

```python

import re

data = 'python\java\go\c'

pattern = r'\\'? ? ? #這里為什么還要是兩個斜杠呢? 畢竟這里是字符串的定義

print(pattern)

result = re.findall(pattern,data)

print(result)

data = 'hello1 java,hello2 python'

pattern = r'\bhello.'? ? #這里就去掉了\b的退格作用

print(pattern)

result = re.findall(pattern,data)

print(result)

```

? ? \\

? ? ['\\', '\\', '\\']

? ? \bhello.

? ? ['hello1', 'hello2']

可能有的同學有疑問: 為什么上面打印的result關于findall結果的地方,result列表里面都是'\\',其實'\\'代表的是一個字符'\\',print()打印這個動作就變成'\'了.不信去試試.

這邊文章默認使用了富文本編輯器,請到另一篇相同內容的MarkDown編輯過的內容中查看,連接如下

Python中的轉義字符與原始字符串詳解

最后編輯于：2019.06.12 23:15:10

?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明：文章內容（如有圖片或視頻亦包括在內）由作者上傳并發布，文章內容僅代表作者本人觀點，簡書系信息發布平臺，僅提供信息存儲服務。

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市，隨后出現的幾起案子，更是在濱河造成了極大的恐慌，老刑警劉巖，帶你破解...
沈念sama閱讀 228,119評論 6贊 531
死咒
序言：濱河連續發生了三起死亡事件，死亡現場離奇詭異，居然都是意外死亡，警方通過查閱死者的電腦和手機，發現死者居然都...
沈念sama閱讀 98,382評論 3贊 415
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人，你說我怎么就攤上這事。” “怎么了？”我有些...
開封第一講書人閱讀 176,038評論 0贊 373
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長。經常有香客問我，道長，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 62,853評論 1贊 309
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮，結果婚禮上，老公的妹妹穿的比我還像新娘。我一直安慰自己，他們只是感情好，可當我...
茶點故事閱讀 71,616評論 6贊 408
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著，像睡著了一般。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發上，一...
開封第一講書人閱讀 55,112評論 1贊 323
城市分裂傳說
那天，我揣著相機與錄音，去河邊找鬼。笑死，一個胖子當著我的面吹牛，可吹牛的內容都是我干的。我是一名探鬼主播，決...
沈念sama閱讀 43,192評論 3贊 441
雙鴛鴦連環套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了？” 一聲冷哼從身側響起，我...
開封第一講書人閱讀 42,355評論 0贊 288
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后，有當地人在樹林里發現了一具尸體，經...
沈念sama閱讀 48,869評論 1贊 334
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內容為張勛視角年9月15日...
茶點故事閱讀 40,727評論 3贊 354
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發現自己被綠了。大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 42,928評論 1贊 369
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖，靈堂內的尸體忽然破棺而出，到底是詐尸還是另有隱情，我是刑警寧澤，帶...
沈念sama閱讀 38,467評論 5贊 358
?日本核電站爆炸內幕
正文年R本政府宣布，位于F島的核電站，受9級特大地震影響，放射性物質發生泄漏。R本人自食惡果不足惜，卻給世界環境...
茶點故事閱讀 44,165評論 3贊 347
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧，春花似錦、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 34,570評論 0贊 26
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至，卻和暖如春，著一層夾襖步出監牢的瞬間，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 35,813評論 1贊 282
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人。一個月前我還...
沈念sama閱讀 51,585評論 3贊 390
代替公主和親
正文我出身青樓，卻偏偏與公主長得像，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當晚...
茶點故事閱讀 47,892評論 2贊 372

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频

Python進階1 - 正則表達式: 轉義字符與原始字符串詳解

Python進階1 - 正則表達式: 轉義字符與原始字符串詳解

推薦閱讀更多精彩內容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美 国产 综合 欧美 视频

Python進階1 - 正則表達式: 轉義字符與原始字符串詳解

推薦閱讀更多精彩內容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频