JavaScript正則表達式

本文參考自:慕課網 JavaScript正則表達式 http://www.imooc.com/learn/706 是自己看完視頻后總結整理的筆記。

1.什么是正則表達式

Regular Expression使用單個字符串來描述、匹配一系列某個句法規則
的字符串---按照某種規則去匹配符合條件的字符串

正則表達式應用場景
 1.在IDE中使用正則表達式處理規則復雜的字符串查找、替換需求
 2.在JavaScript程序設計中使用正則表達式處理字符串
 3.在其他語言中
 **推薦一個可視化正則表達式網站:http://regexper.com**

2.Regexp對象

JavaScript通過內置對象RegExp支持正則表達式
有兩種方法實例化RegExp對象:

2.1 字面量

    var reg = /\bis\b/g;
    var str = 'He is a boy.This is a dog. Where is she?';
    console.info(str.replace(reg,'IS'));

2.2 構造函數

    //這里和字面量定義不一樣,因為js中\斜線是特殊字符,需要進行轉義,
    所以需要在\斜線前面加多一個\代表轉義
    var reg = new RegExp('\\bis\\b','g');
    console.info('He is a boy. Is he?'.replace(/\bis\b/g,'IS'));
    console.info('He is a boy. Is he?'.replace(/\bis\b/g,'IS'));

2.3 匹配模式:

g (global): 全文搜索,不添加g,搜索到第一個匹配停止;
i (ignore case) : 忽略大小寫,不添加則默認為大小寫敏感;
m ( multiple lines):多行搜索

3.元字符

正則表達式由兩種基本字符類型組成
1.原義文本字符:代表它原來含義的字符 例如:abc、123
2.元字符:在正則表達式中有特殊意義的非字母字符 例如:
\b表示匹配單詞邊界,而非\b
在正則表達式中具體特殊含義的字符:* + ? $ ^ . \ () {} []
元字符:

 \t:水平制表符;
 \v:垂直制表符;
 \n:換行符;
 \r:回車符;
 \0:空字符;
 \f:換頁符;
 \cX:與X對應的控制字符(ctrl + x)

4.類

可以使用元字符[]來構建一個簡單的類,所謂類是指符合某些特征的對象,一個泛指,而不是特指某個字符

4.1 字符類

一般情況下正則表達式一個字符對應字符串一個字符
表達式 ab\t 的含義是: 一個字母a一個字母b加一個水平制表符

console.info('a1b2c3d4'.replace(/[abc]/g,'X'));
console.info('xw中文123中文cv'.replace(/[\u4e00-\u9fa5]/g,'#'));

4.2 反向類

使用元字符 ^ 創建 反向類/負向類,反向類的意思是:不屬于某類的內容
表達式 [^abc] 表示 不是字符a或b或c 的內容

'a1b2c3d4'.replace(/[^abc]/g,'字符');//"a字符b字符c字符字符字符"

4.3 范圍類

正則表達式提供了范圍類
使用字符類匹配數字 [0123456789]可以簡寫[0-9]
可以使用 [a-z] 來連接兩個字符表示 從a到z的任意字符,閉區間,包含a和z本身,如:

  'a1b2c3zx4z9'.replace(/[a-z]/g,'Q');

[0-9]表示0到9的值
[a-z]表示小寫字母a到z
[a-zA-Z]表示小寫和大寫字母a到z
注意:a-z中間的-并不是代表字符哦 而是范圍
如果要包括字符-的話,則加在后面,如[a-z-]
橫線在之內是表示范圍,之外是表示橫線

4.4 預定義類

正則表達式預定義類:

.:出了回車符和換行符之外的所有字符,等價于[^\r\n]
\d:數字字符,等價于[0-9]    digit
\D:非數字字符,等價于[^0-9]
\s:空白符,等價于[\t\n\x0B\f\r]   space
\S:非空白符,等價于[^\t\b\x0B\f\r]
\w:單詞字符(字母,數字,下劃線),等價于[a-zA-Z_0-9]    word
\W:菲單詞字符,等價于[^a-zA-Z_0-9]

提示:大寫的表示取反
例子:
匹配一個 ab+數字+任意字符 的字符串
使用范圍類:ab[0-9][^\r\n] 使用預定義類:ab\d.
常見的邊界匹配字符:
^ 以XXX開始
$ 以XXX結束
\b 單詞邊界
\B非單詞邊界
例子:

'@123@abc@'.replace(/^@./g,'Q');//Q23@abc@
'@123@abc@'.replace(/.@$/g,'Q');//@123@abQ
'@123@abc@'.replace(/.@/g,'Q');//@12QabQ

5. 量詞

?出現0或1次(最多一次)
+出現1或多次(至少一次)
*出現0或多次(任意次)
{n}出現n次
{n,m}出現n到m次
{n,}至少出現n次

例子:

  /\d{20}\w\d?\w+\d*\d{3}\w{3,5}\d{3,}/

正則中的量詞。正則中的量詞作用是緊挨著他的字符(如果沒有使用分組的話);使用分組則會匹配分組。

6. 貪婪模式

貪婪模式 {3,5}盡量多的匹配5個,正則表達式在匹配時,盡可能多的匹配,直到匹配失敗
非貪婪模式 {3,5}?盡可能少的匹配3個,正則表達式盡可能少的匹配,即一旦成功匹配就不再繼續匹配
貪婪模式:JS正則表達式模式為貪婪模式,在數字常量后面加上?就可以使用非貪婪模式。
'123456789'.replace(/\d{3,5}/g,'A')
"AA"
'123456'.replace(/\d{3,5}/g,'A')
"A6"

7. 分組

1.  匹配字符串 Byron 連續出現 3 次的場景
使用()可以達到分組的功能,使量詞作用于分組 (Byron){3},如果直接Byron{3}則匹配到的是Byronnn
例子:小寫字母連續出現3次
'a1b2c3d4'.replace(/[a-z]\d{3}/g,'Q');
"a1b2c3d4"
'a1b2c3d4'.replace(/([a-z]\d){3}/g,'Q');
"Qd4"

分組引用
在分組的基礎上,分組取值使用'$1 $2....'代表捕獲分組內容
實現:
2015-12-25 => 12/25/2015
'2015-12-25'.replace(/(\d{4})-(\d{2})-(\d{2})/g,'$2/$3/$1');
"12/25/2015"

忽略分組
不希望捕獲某些分組,只需要在分組內加上 ?:即可
'2015-07-09'.replace(/(?:\d{4})-(\d{2})-(\d{2})/g,'$2/$3/$1');
"09/$3/07"

2.  使用|將正則表達式分成前后兩部分,可以達到 或 的效果
例子:
'ByronCasper'.replace(/Byron|Casper/g,'Q');
"QQ"
'ByrCasperByronsper'.replace(/Byr(on|Ca)sper/g,'Q');
"QQ"

8. 前瞻

 正則表達式從文本頭部向尾部開始解析,文本尾部方向,成為“前”
  前瞻 就是在正則表達式匹配到規則的時候,向前檢查是否符合斷言。比如找到兒子為張三,還得看看他的父親是否是李四
 后顧/后瞻方向相反
 注意:JavaScript不支持后顧
 符合特定斷言稱為 肯定/正向 匹配
 不符合特定斷言稱為 否定/負向 匹配
 正向前瞻 exp(?=assert) 先判斷是否符合正則,再符合正則的基礎上判斷是否符合斷言
 負向前瞻 exp(?!asseret)
 正向后顧 exp(?<=assert) js不支持
 負向后顧 exp(?<!assert) js不支持
 
   例子:\w(?=\d)  正向前瞻 符合斷言 匹配單詞字符,要求首先是一個單詞,并且這個單詞符合斷言,后跟一個數字
  'a2*3'.replace(/\w(?=\d)/g,'A')   "A2*3"
  'a2*3bb'.replace(/\w(?=\d)/g,'A')   "A2*3bb"
  斷言不參與規則部分,所以不會被替換

9. javascript regex對象

9.1 對象屬性

  global:是否全文搜索,默認false
  ignoreCase:是否大小寫敏感,默認是false
  multiline:多行搜索,默認值是false
  lastIndex:是當前表達式匹配內容的最后一個字符的下一個位置
  source:正則表達式的文本字符串

9.2 regex對象方法

9.2.1. RegExp.prototype.test(str)
    用于測試字符串參數中是否存在匹配正則表達式模式的字符串,如果存在則返回true,否則返回false
lastIndex 記錄當前匹配結果的、最后一個字符的、下一個字符的位置
    注意:test()方法在匹配的時候當匹配到一個結果時,會從lastIndex位置開始匹配下一個結果,直到不存在的時候才置為0。因此,當使用全局g屬性標識時,當匹配到最后一個結果時,lastIndex值指向不存在的位置,此時再執行test()會返回false。
      例子:多次執行test()方法,會在true、false之間循環
 (/\w/g).test('a')每次執行都是正確的,但是通過實例化對象,需要很大的開銷
  test()方法:原意就是測試有沒有、能不能匹配上,當使用test原意時,沒必要加g
9.2.1. RegExp.prototype.exec(str)
    使用正則表達式模式對字符串執行搜索,并將更新全局RegExp對象的屬性一反映匹配結果
如果沒有匹配的文本則返回 null,否則返回一個結果數組:
     - index 聲明匹配文本的第一個字符位置
     - input 存放被檢索的字符串 string

非全局調用
  調用非全局的RegExp對象的 exec()時,返回數組
   第一個元素是與正則表達式相匹配的文本
   第二個元素是與RegExpObject的第一個子表達式相匹配的文本(如果有的話)
   第三個元素是與RegExp對象的第二個子表達式相匹配的文本(如果有的話),以此類推
   
   例子:
    var reg3 = /\d(\w)(\w)\d/;
    var reg4 = /\d(\w)(\w)\d/g;
    var ts = '$1az2bb3cy4dd5ee';

    var ret1 = reg3.exec(ts);
    //0  1 1az2,a,z
    console.log(reg3.lastIndex + '\t' + ret1.index + '\t' + ret1.toString()); 
    var ret2 = null;
    while (ret2 = reg4.exec(ts)) {
        console.log(reg4.lastIndex + '\t' + ret2.index + '\t' + ret2.toString()); 
        //5  1 1az2,a,z
        //11 7 3cy4,c,y
    }

9.3 String方法的正則表達式應用

9.3.1 String.prototype.search(reg)
用于檢索字符串中指定的子字符串,或檢索與正則表達式相匹配的子字符串,方法返回第一個匹配結果的index,查找不到返回-1;
search()方法不執行全局匹配,它將忽略標志g,并且總是從字符串的開始進行檢索。
    例子:
    'A11B2C3D4'.search(/\d/)   //1
9.3.2 String.prototype.match(reg)
match()方法將檢索字符串,以找到一個或多個與RegExp匹配的文本
  RegExp是否具有標志 g 對結果影響跟大
  非全局調用,即沒有 g
    如果RegExp沒有標志 g,那么 match()方法就只能在字符串中執行一次匹配
    如果沒有找到任何匹配的文本,將返回null
    否則它將返回一個數組,其中存放了與它找到的匹配文本有關的信息
    返回數組的第一個元素存放的是匹配文本,而其余的元素存放的是與正則表達式的子表達式匹配的文本
    除了常規的數組元素之外,返回的數組還含有2個對象屬性
       index 聲明匹配文本的起始字符在字符串的位置
       input 聲明對 stringObject的引用
全局調用
  如果RegExp具有標志 g,則match()方法將執行全局檢索,找到字符串中的所有匹配子字符串
    沒有找到任何匹配的子串,則返回null
    如果找到了一個或多個匹配的子串,則返回一個數組
 數組元素中存放地字符串中所有的匹配子串,而且也沒有index 屬性或input屬性
     例子:
    var reg3 = /\d(\w)\d/;
    var reg4 = /\d(\w)\d/g;
    var ts = '$1a2b3c4d5e';
    var ret1 = ts.match(reg3);
    console.info(ret1);//[ '1a2', 'a', index: 1, input: '$1a2b3c4d5e' ]
    console.info(ret1.index + '\t' + reg3.lastIndex);//1  0
    
    var ret2 = ts.match(reg4);
    console.info(ret2);//[ '1a2', '3c4' ]
    console.info(ret2.index + '\t' + reg4.lastIndex);//undefined  0
9.3.3 String.prototype.replace
replace方法比較強大,除了常規的 String.prototype.replace(str,replaceStr)和  String.prototype.replace(reg,replaceStr)之外,
還有String.prototype.replace(reg,function)

function參數含義
  function會在每次匹配替換的時候調用,有四個參數
    match:匹配字符串
    group...:正則表達式分組內容,沒有分組則沒有該參數
    index:匹配項在字符串中 index
    origin:原字符串

    例子:
    console.info('a1b2c3d4e5'.replace(/\d/g, function(match, index, origin) {
    //console.info(match);
    console.info(index);
    //console.info(origin);
    return parseInt(match) + 1;
}));//a2b3c4d5e6

    console.info('a1b2c3d4e5'.replace(/(\d)(\w)(\d)/g, function(match, group1, group2, group3, index, origin) {
    console.info(match);
    return group1 + group3;
})); //a12c34e5
9.3.4 String.prototype.split(reg)
 我們經常使用split方法把字符串分割為字符數組
 'a,b,c,d'.split(',');//[ 'a', 'b', 'c', 'd' ]
 在一些復雜的分割情況下我們可以使用正則表達式解決
 'a1b2c3d'.split(/\d/);//[ 'a', 'b', 'c', 'd' ]
?著作權歸作者所有,轉載或內容合作請聯系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 227,572評論 6 531
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,071評論 3 414
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 175,409評論 0 373
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 62,569評論 1 307
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,360評論 6 404
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 54,895評論 1 321
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 42,979評論 3 440
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,123評論 0 286
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 48,643評論 1 333
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,559評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 42,742評論 1 369
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,250評論 5 356
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 43,981評論 3 346
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,363評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,622評論 1 280
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,354評論 3 390
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 47,707評論 2 370

推薦閱讀更多精彩內容