學習正則表達式

寫在最前面的話

最近在瀏覽Github Star榜時發現了關于學習正則表達式的介紹，感覺非常不錯，可以邊看邊學邊練習，所以Fork過來學習分享。作為字符匹配的神器，學會使用正則表達式無疑可以幫助我們方便進行各種文本處理。

因為文章中的例子采用的是html格式，簡書的md編輯器解析不了，我就全部刪除掉了。如果你想要查看原文的話，點擊https://github.com/ShixiangWang/learn-regex/blob/master/README-cn.md。

什么是正則表達式?

正則表達式是一組由字母和符號組成的特殊文本, 它可以用來從文本中找出滿足你想要的格式的句子.

一個正則表達式是在一個主體字符串中從左到右匹配字符串時的一種樣式.
"Regular expression"這個詞比較拗口, 我們常使用縮寫的術語"regex"或"regexp".
正則表達式可以從一個基礎字符串中根據一定的匹配模式替換文本中的字符串、驗證表單、提取字符串等等.

想象你正在寫一個應用, 然后你想設定一個用戶命名的規則, 讓用戶名包含字符,數字,下劃線和連字符,以及限制字符的個數,好讓名字看起來沒那么丑.
我們使用以下正則表達式來驗證一個用戶名:

以上的正則表達式可以接受 john_doe, jo-hn_doe, john12_as.
但不匹配Jo, 因為它包含了大寫的字母而且太短了.

元字符	描述
.	句號匹配任意單個字符除了換行符.
[ ]	字符種類. 匹配方括號內的任意字符.
[^ ]	否定的字符種類. 匹配除了方括號里的任意字符
*	匹配>=0個重復的在*號之前的字符.
+	匹配>=1個重復的+號前的字符.
?	標記?之前的字符為可選.
{n,m}	匹配num個中括號之前的字符 (n <= num <= m).
(xyz)	字符集, 匹配與 xyz 完全相等的字符串.
\|	或運算符,匹配符號前或后的字符.
\	轉義字符,用于匹配一些保留的字符 <code>[ ] ( ) { } . * + ? ^ $ \ \|</code>
^	從開始行開始匹配.
$	從末端開始匹配.

2.1 點運算符 `.`

.是元字符中最簡單的例子.
.匹配任意單個字符, 但不匹配換行符.

簡寫	描述
.	除換行符外的所有字符
\w	匹配所有字母數字, 等同于 `[a-zA-Z0-9_]`
\W	匹配所有非字母數字, 即符號, 等同于: `[^\w]`
\d	匹配數字: `[0-9]`
\D	匹配非數字: `[^\d]`
\s	匹配所有空格字符, 等同于: `[\t\n\f\r\p{Z}]`
\S	匹配所有非空格字符: `[^\s]`
\f	匹配一個換頁符
\n	匹配一個換行符
\r	匹配一個回車符
\t	匹配一個制表符
\v	匹配一個垂直制表符
\p	匹配 CR/LF (等同于 `\r\n`)，用來匹配 DOS 行終止符

符號	描述
?=	前置約束-存在
?!	前置約束-排除
?<=	后置約束-存在
?<!	后置約束-排除

標志	描述
i	忽略大小寫.
g	全局搜索.
m	多行的: 錨點元字符 `^` `$` 工作范圍在每行的起始.

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美 国产 综合 欧美 视频

學習正則表達式

寫在最前面的話

什么是正則表達式?

目錄

1. 基本匹配

2. 元字符

2.1 點運算符 .

2.2 字符集

2.2.1 否定字符集

2.3 重復次數

2.3.1 * 號

2.3.2 + 號

2.3.3 ? 號

2.4 {} 號

2.5 (...) 特征標群

2.6 | 或運算符

2.7 轉碼特殊字符

2.8 錨點

2.8.1 ^ 號

2.8.2 $ 號

3. 簡寫字符集

4. 前后關聯約束(前后預查)

4.1 ?=... 前置約束(存在)

4.2 ?!... 前置約束-排除

4.3 ?<= ... 后置約束-存在

4.4 ?<!... 后置約束-排除

5. 標志

5.1 忽略大小寫 (Case Insensitive)

5.2 全局搜索 (Global search)

5.3 多行修飾符 (Multiline)

貢獻

許可證

推薦閱讀更多精彩內容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频

2.1 點運算符 `.`

2.3.1 `*` 號

2.3.2 `+` 號

2.3.3 `?` 號

2.4 `{}` 號

2.5 `(...)` 特征標群

2.6 `|` 或運算符

2.8.1 `^` 號

2.8.2 `$` 號

4.1 `?=...` 前置約束(存在)

4.2 `?!...` 前置約束-排除

4.3 `?<= ...` 后置約束-存在

4.4 `?<!...` 后置約束-排除