正則表達式是用于匹配字符串中字符組合的模式。在js中正則表達式也是對象。
- 創建正則表達式
使用一個正則表達式字面量,其由包含在斜杠之間的模式組成,如下:
const regex = /abc/;
在加載腳本后,正則表達式字面值提供正則表達式的編譯。當正則表達式保持不變時,使用此方法可以獲得更好的性能。
或者調用Regexp
對象的構造函數,如下:
const regexp = new Regexp('abc');
- 正則表達式概述
const example = /pattern/flags;
模式(pattern)部分可以是任何簡單的或復雜的正則表達式,可以包含字符類、限定符、分組、向前查找以及反向引用。
每個正則表達式都可帶有一個或多個標志(flags),泳衣標明正則表達式的行為。正則表達式支持下列三個標志:
- g:表示全局(global)模式,即模式將被用于所有字符串,而非在發現第一個匹配項時立即停止。
- i:表示不區分大小寫模式,即在確定匹配項時忽略模式與字符串的大小寫。
- m:表示多行模式,即在到達一行文本末尾時還會繼續查找下一行中是否存在于模式匹配的項。
如果多個標志同時使用時,則寫成:gmi。
- () [] {} 的區別
()的作用是提取匹配的字符串。表達式中有幾個()就會得到幾個相應的匹配字符串。比如(\s+)表示連續空格的字符串。
[]是定義匹配的字符串范圍。比如[a-zA-Z0-9]表示字符文本要匹配英文字符和數字。
{}一般用來表示匹配的長度。比如\d{3}表示匹配三個數字,\d{1,3}表示匹配1~3個數字,\d{3,}表示匹配3個以上數字。 - ^與$
^ 匹配一個字符串的開頭,比如(^a)就是匹配以字母a開頭的字符串
$ 匹配一個字符串的結尾,比如(b$)就是匹配以字母b結尾的字符串
^ 還有另一個作用就是取反,比如[^xyz]表示匹配的字符串不包含xyz
. (小數點)匹配除換行符之外的任何單個字符
注意問題:
- 如果^出現在[]中一般表示取反,而出現在其他地方則是匹配字符串的開頭
2.^ 和 $ 配合可以有效匹配完整字符串
- \d \s \w .
\d 匹配一個非負整數,等價于[0-9]
\s 匹配一個空白字符串
\w 匹配一個英文字母或數字,等價于[0-9a-zA-Z]
. 匹配除換行符以外的任意字符,等價于[^\n] - ? + *
- 用 * 表示匹配前面元素0次或多次,比如(\s*)就是匹配0個或多個空格
- 用 + 表示匹配前面元素1次或多次,比如(\d+)就是匹配由至少一個整數組成的字符串
- 用 ? 表示匹配前面元素0次或一次,相當于{0,1},比如(\w?)就是匹配最多由一個字母或數字組成的字符串
- $1與\1
$1-$9存放著正則表達式中最近的9個正則表達式提取的結果,這些結果按照子匹配的出現順序依次排列。基本語法是RegExp.$n,這些屬性是靜態的,除了replace中的第二個參數可以省略RegExp之外,其他地方都要使用RegExp。
// 使用RegExp訪問
/(\d+)-(\d+)-(\d+)/.test("2018-02-01");
RegExp.$1 // 2018
RegExp.$2 //02
RegExp.$3 //01
// 在replace中使用
"2018-02-01".replace(/(\d+)-(\d+)-(\d+)/,"$1年$2月$3日");
// 2018年02月03日
\1表示后向引用,是指在正則表達式中從左往右數,第一個()中的內容,以此類推,\2表示第二個(),\0表示整個表達式
// 匹配日期格式,表達式中的\1代表重復(\-|\/|.)
const rgx = /\d{4}(\-|\/|.)\d{1,2}\1\d{1,2}/
rgx.test("2018-02-01"); // true
rgx.test("2018-02.01"); // false
rgx.test("2018/02/01"); // true
rgx.test("2018.02.01"); // true
兩者的區別是:\n只能用在表達式之中,而$n只能用在表達式之外的地方。
- test與match
test是用來檢測字符串是否匹配某一個正則表達式,如果匹配就返回true,反之則返回false。
match是獲取正則表達式匹配到的結果,以數組的形式返回。 - replace 本身是js字符串對象的一個方法,它允許接受兩個參數:
replace([RegExp|String],[String|Function])
第一個參數可以是一個普通的字符串或是一個正則表達式
第二個參數可以是一個普通的字符串或是一個回調函數
如果第一個參數是RegExp,JS會先提取RegExp匹配出的結果,然后用第二個參數逐一替換匹配出的結果。
如果第二個參數是回調函數,每匹配到一個結果就回調一次