必知必會-第九章

本章主要講解,如何在where子句中使用正則表達式從而精確篩選數據。

正則表達式干啥的?

用來匹配文本的特殊串,比如從一段文本中提取郵箱和電話號碼,再比如查找指定規則的文件名,再再比如將頁面的URL替換為實際的HTML鏈接等等。

Mysql中正則表達式

mysql用where子句對正則表達式提供了初級支持,允許用你指定的正則表達式過濾select出來的數據。

幾個簡單的例子

找出address字段所有包含‘47’的行。


image.png

從上圖可以看出,REGEXP和LIKE的用法很是相似。但是并沒發現它的優勢,繼續看。

找出address字段所有‘102’的行,可以是任何字符。

image.png

‘.’字符可以匹配任何一個字符,所以匹配出來的結果中有‘1027’,‘1029’,‘102 ’(102空格)。
當然這個功能用LIKE和通配符依然可以完成,那么我還用正則干什么呢?

LIKE和REGEXP的區別

LIKE只有在完全匹配的情況下才會返回值,而REGEXP是包含的情況下就能返回值。我看根據結果可以對比一下。


image.png

image.png

image.png

聰明的你,也許看完這三張圖就都明白了。

前面說過mysql在匹配結果時是忽略大小寫的

但是使用正則表達式就可以區分大小寫,而不必修改mysql的配置,畢竟不是所有人都是DBA。
為了區分大小寫,可以使用BINARY關鍵字,比如where address REGEXP BINARY 'Beijing .000'。

OR匹配
image.png

匹配address中所有包含‘47’或者‘35’的行。
在邏輯表達中,‘|’表示或者,多個“或者”條件放在一起時,只要滿足其中一個就返回值,所以,返回的數據集合應該是滿足任何一個條件的合集。

匹配特定的字符

如果你想匹配特定的字符,需要給特定的字符設置一個字符集,用中括號[]表示,有點像我們編程時用的數組。


image.png

上圖是想匹配,包含‘10’,‘11,‘12’,‘13’的address字段的值。
其實這種方式也是一種OR,我們還可以這么寫,REGEXP '10|11|12|13'。
個人覺得分組看起來更清晰,而且隨著匹配規則的愈加復雜,|會干擾邏輯運算,稍不注意就會影響我們篩選數據的結果。

匹配范圍

仍然用到剛才的分組,比如你想匹配0-9的數字,[0-9].
比如我想比配字符a,b,c,...,x,y,z,[a-z]。
如果你想匹配0-3,6-9的范圍,[0-36-9]。字符也是同理,這樣進行范圍匹配就很方便編寫正則表達式了。
例如我們常見的電話號碼,QQ號,郵箱賬號等等,都會用到。

正則表達式中,特殊符號要轉義

我們知道.在正則表達式中,表示匹配任意一個字符,但是在字段的值中也很有可能出現,我想匹配值中的‘.’時,就需要轉義。
轉義很簡單,在‘.’前面加個'\'就行。
其他需要轉義的常見字符還有, . \ | [],以及下面這些元字符


image.png
轉義時咋是兩個斜杠?

我們剛學C語言時,也聽過或者用過轉義,一般用一個\就搞定了,為什么mysql中需要兩個?
因為,這是mysql官方要求,其中一個\由mysql負責解析,另一個由正則表達式庫來解析。
大致原因如此,原理不詳。

mysql幫你定義好了的字符類

下面是預定義的字符集,使用時可以參考下表


image.png
匹配多個實例

之前的例子都是匹配單次出現,但是實際工作中會匹配多次出現的情況,所以我們要學會對出現次數的控制來強化我們的正則表達式。
上一張書上的配圖


image.png

要注意放置的次序,一般放在[]后面,字符串后面。

比如,我想在city表中查找city字段中帶(),并且括號中的英文字符數至少有8個的行。聽起來有點拗口是吧?


image.png

然后我們解讀一下REGEXP后面的內容吧,首先轉義(,就是\(。
然后用[]分組,確定英文字符的范圍,小寫a-z以及大寫A-Z,就是[a-zA-Z]。
然后用{}來控制字符出現的次數,{8,},表示出現8次或者8次以上。
最后,再次轉義,\)。

這些正則還算是簡單的,當你看到了更加復雜的正則表達式時,一定要慢慢看,逐字分析,不然心態很容易爆炸,尤其是和我一樣的菜鳥,切記。

匹配特定位置的文本

之前我們學習的都是匹配任意位置的文本,現在我們要學習匹配特定位置的文本,比如以xxx開頭,或者以xxx結尾,再或者以xxx開頭中間包含ss,又以yy結尾的。
匹配特定位置的文本的話,需要使用定位符,那么我們得知道都有什么定位符


image.png

那我們看一個簡單的例子,找出以數字開頭,并包含‘Drive’的行。
我作了一個錯誤的示范,不要犯同樣的錯誤哦。
我把2個條件都寫在了一個正則表達式里了,然后根本查不出數據來,如圖:


image.png

然后仔細一讀正則,發現了問題,圖中的正則表示找出以數字drive開頭的數據,當然,數據庫中并不存在這樣的數據。
我想要的是包含drive,而不是從頭匹配drive。這是兩個條件,所以我們應該分開寫,把regexp寫在兩個where子句中。


image.png

這樣一來,我們想要篩選的數據就出來了。
注意 ^

^有兩種用途,第一種,表示從頭匹配字符串。
另一種,否定集合內容。[^1-5],表示,除了1-5的字符之外的字符,可以是6,7,8,a,b,c等等。

好啦,第九章,搞定。

?著作權歸作者所有,轉載或內容合作請聯系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 227,572評論 6 531
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,071評論 3 414
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 175,409評論 0 373
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 62,569評論 1 307
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,360評論 6 404
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 54,895評論 1 321
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 42,979評論 3 440
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,123評論 0 286
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 48,643評論 1 333
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,559評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 42,742評論 1 369
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,250評論 5 356
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 43,981評論 3 346
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,363評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,622評論 1 280
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,354評論 3 390
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 47,707評論 2 370

推薦閱讀更多精彩內容