javascript 正則表達(dá)式使用說(shuō)明詳細(xì)教程

1,正則表達(dá)式的作用:匹配一個(gè)字符串中的一些內(nèi)容

2,聲明和使用:

1)構(gòu)造函數(shù) var reg=new RegExp(/表達(dá)式/)
2)字面量 var reg=/表達(dá)式/ 推薦使用
eg: var reg=/abc/ 表示匹配含有abc 的字符串
常用方法:reg.test("要檢測(cè)的字符串") 返回布爾值

3,最簡(jiǎn)單開(kāi)始

1)簡(jiǎn)單類(lèi) 只要含有正則中的內(nèi)容即可
var reg=/abc/

  1. 字符類(lèi):在正則中使用[]整體表示一位字符,字符串的某一個(gè)字符滿足中括號(hào)中內(nèi)容的其中一個(gè)即可
    var reg = /[abc]/;
    console.log(reg.test("qwewtetwte"));//false
    console.log(reg.test("qwewtaetwte"));//true

  2. 反向類(lèi):在字符類(lèi)中括號(hào)內(nèi)部最開(kāi)始寫(xiě)一個(gè)^,表示反向
    var reg = /[^abc]/; // 字符串中含有除了abc以外的任意字符即可返回true
    console.log(reg.test("abc"));//false
    4)范圍類(lèi)
    var reg = /[abcdefghigklmnopqrst]/;
    var reg = /[a-t]/;//可以匹配到a到t之間的任意一個(gè)字符
    console.log(reg.test("uwy"));//false
    console.log(reg.test("guwy"));//true
    想要匹配所有的小寫(xiě)字母 //var reg = /[a-z]/;
    想要匹配所有的大寫(xiě)字母 var reg = /[A-Z]/;
    想要匹配所有的數(shù)字 var reg = /[0-9]/

  3. 組合類(lèi)
    //匹配數(shù)字和小寫(xiě)字母
    var reg = /[0-9a-z]/;
    console.log(reg.test("AAAAAAAAAA"));//false
    console.log(reg.test("AAAAA0AAAAA"));//true
    console.log(reg.test("AAAAAaAAAAA"));//true

var reg = /[A-Z0-9a-z]/;
console.log(reg.test("AAAAAAAAAA"));//true
console.log(reg.test("012323"));//true
console.log(reg.test("aaaaaa"));//true

6)預(yù)定義類(lèi)
var reg = /\d/;// /[0-9]/;
. 匹配除換行符以外的任意字符
\w 單詞字符(所有的字母數(shù)字和) word
\W [^a-zA-Z0-9
] 非單詞字符
\s 匹配任意的空白符 space
\S [^\f\r\n\t\v] 可見(jiàn)字符
\d 匹配數(shù)字 digit
\D [^0-9] 非數(shù)字字符
\b 匹配單詞的開(kāi)始或結(jié)束

console.log(reg.test("abca1d"));
7)字符轉(zhuǎn)義:(常用的)
如果使用元字符本身,需轉(zhuǎn)義如. *
. * \
8)補(bǔ)充
或者|
括號(hào) () 提升優(yōu)先級(jí),先計(jì)算
var reg = /abc|bcd/;
console.log(reg.test("ab"));//false
console.log(reg.test("abc"));//true
console.log(reg.test("bcd"));//true
var reg = /a|b|c|d/;//如果使用單個(gè)字符,與后面的作用相同 [abcd]

9) ^ 匹配字符串的開(kāi)始
$ 匹配字符串的結(jié)束

^ 在中括號(hào)外使用,寫(xiě)在正則最前面時(shí),表示匹配開(kāi)頭,一個(gè)正則中只能使用一次
var reg = /^abc/;
console.log(reg.test("abcdefg")); //true
console.log(reg.test("aabcdefg"));//false

$ 寫(xiě)在正則最后位置,表示以xxx結(jié)束
var reg = /abc$/;
console.log(reg.test("ddddabc"));//true
console.log(reg.test("ddddaabbc"));//false

^和$同時(shí)使用 嚴(yán)格匹配-必須跟書(shū)寫(xiě)的正則內(nèi)容完全相同
var reg = /^abc$/;
console.log(reg.test("abc"));//true
console.log(reg.test("abcabc"));//false

10)量詞

//使用量詞,表示數(shù)量
大括號(hào)中書(shū)寫(xiě)一個(gè)數(shù)值。表示出現(xiàn)的次數(shù)
var reg = /^a{3}$/;
console.log(reg.test("aa"));//false
console.log(reg.test("aaa"));//true
console.log(reg.test("aaaa"));//false

匹配2-5個(gè)
var reg = /^a{2,5}$/;
console.log(reg.test("a"));//false
console.log(reg.test("aa"));//true
console.log(reg.test("aaaaaa"));//false

匹配至少3個(gè)
var reg = /^a{3,}$/;
console.log(reg.test("aa"));//false
console.log(reg.test("aaa"));//true
console.log(reg.test("aaaa"));//true

  • 匹配0-多個(gè) 當(dāng)字符串中某一個(gè)部分可選時(shí),使用*
    var reg = /^a*$/;
    console.log(reg.test(""));//true
    console.log(reg.test("a"));//true
    console.log(reg.test("aaaa"));//true
  • 匹配1個(gè)到多個(gè)
    var reg = /^a+$/;
    console.log(reg.test(""));//false
    console.log(reg.test("a"));//true
    console.log(reg.test("aaaa"));//true

? 匹配0個(gè)或1個(gè)
var reg = /^a?$/;
console.log(reg.test(""));//true
console.log(reg.test("a"));//true
console.log(reg.test("aaaa"));//false

4,replace 和匹配模式
var str = "abca";
//第一個(gè)參數(shù)可以使用字符串,同樣可以使用正則表達(dá)式
console.log(str.replace("a", "z")); //zbca

匹配模式
g - global 全局匹配
i - ignoreCase 忽略大小寫(xiě)
console.log(str.replace(/a/ig, "z"));//zbcz

//trim是字符串方法
var str = " a a ";
console.log(str.trim());

var str = " a a ";
// \s 不可見(jiàn)字符
console.log(str.replace(/\s/g, ""));//替換掉所有的空格aa
console.log(str.replace(/^\s+|\s+$/g, ""));//替換掉兩端的空格a a
// 自己的trim方法
function Trim(str) {
return str.replace(/^\s+|\s+$/g, "");
}

5,正則提取 match

1) 字符串方法 match
var str = "aaa123hhh456hhh789aaa";
//提取出字符串中的數(shù)字
console.log(str.match(/\d{3}/)); //提取第一個(gè)匹配到的值["123", index: 3, input: "aaa123hhh456hhh789aaa"]
console.log(str.match(/\d{3}/g)); //提取所有的內(nèi)容時(shí),不會(huì)有index和input屬性字 ["123", "456", "789"]
var str = "http://小明:謝謝大神,我得郵箱是xiaoming@qq.com,哈哈小紅:謝謝大神,我得郵箱是xiaohong@qq.com,哈哈李雷:謝謝大神,我得郵箱是lilei@163.com,哈哈韓梅梅:謝謝大神,我得郵箱是hanmeimei@126.com,哈哈";
console.log(str.match(/\w+@\w+.\w+/g));
解析一下:@ 符號(hào)前面有一個(gè)或多個(gè)單詞,后同理,. 點(diǎn) “.”的轉(zhuǎn)義 點(diǎn)后也是一個(gè)單詞 g 全局匹配

2)exec 分組提取
//正則.exec(字符串);

//正則.exec(字符串);
var reg = /\w+@\w+.\w+/g;
//通過(guò)同一個(gè)正則表達(dá)式多次處理一個(gè)字符串,可以多次提取出匹配到的內(nèi)容以及起始位置索引值
//匹配不到時(shí)返回null
console.log(reg.exec(str));

var result;
while ((result = reg.exec(str)) != null) {
console.log("郵箱是:" + result + ",起始索引值為" + result.index);
}

var reg = /(\w+)@(\w+(?:.\w+)+)/g;
//使用()可以在正則表達(dá)式中進(jìn)行分組,從左往右,第一個(gè)( 表示組1
//如果不想提取出某個(gè)組的內(nèi)容,可以在這個(gè)組開(kāi)始的(貼著的后面加上 ?:
var result;
while ((result = reg.exec(str)) != null) {
console.log("郵箱是:" + result[0]+"用戶名是:"
+result[1]+"域名是:"
+result[2]);
//console.log(result);
}
(?<name>exp) 匹配exp,并捕獲文本到名稱(chēng)為name的組里,也可以寫(xiě)成(?'name'exp)
(?:exp) 匹配exp,不捕獲匹配的文本,也不給此分組分配組號(hào)
零寬斷言 (?=exp) 匹配exp前面的位置
(?<=exp) 匹配exp后面的位置
(?!exp) 匹配后面跟的不是exp的位置
(?<!exp) 匹配前面不是exp的位置
注釋 (?#comment) 這種類(lèi)型的分組不對(duì)正則表達(dá)式的處理產(chǎn)生任何影響,用于提供注釋讓人閱讀

以下是收集于網(wǎng)絡(luò)中的常用正則表達(dá)式:
一、校驗(yàn)數(shù)字的表達(dá)式
1 數(shù)字:^[0-9]$
2 n位的數(shù)字:^\d{n}$
3 至少n位的數(shù)字:^\d{n,}$
4 m-n位的數(shù)字:^\d{m,n}$
5 零和非零開(kāi)頭的數(shù)字:^(0|[1-9][0-9]
)$
6 非零開(kāi)頭的最多帶兩位小數(shù)的數(shù)字:^([1-9][0-9])+(.[0-9]{1,2})?$
7 帶1-2位小數(shù)的正數(shù)或負(fù)數(shù):^(-)?\d+(.\d{1,2})?$
8 正數(shù)、負(fù)數(shù)、和小數(shù):^(-|+)?\d+(.\d+)?$
9 有兩位小數(shù)的正實(shí)數(shù):^[0-9]+(.[0-9]{2})?$
10 有1~3位小數(shù)的正實(shí)數(shù):^[0-9]+(.[0-9]{1,3})?$
11 非零的正整數(shù):^[1-9]\d
$ 或 ^([1-9][0-9]){1,3}$ 或 ^+?[1-9][0-9]$
12 非零的負(fù)整數(shù):^-[1-9][]0-9"$ 或 ^-[1-9]\d$
13 非負(fù)整數(shù):^\d+$ 或 ^[1-9]\d|0$
14 非正整數(shù):^-[1-9]\d
|0$ 或 ^((-\d+)|(0+))$
15 非負(fù)浮點(diǎn)數(shù):^\d+(.\d+)?$ 或 ^[1-9]\d.\d|0.\d[1-9]\d|0?.0+|0$
16 非正浮點(diǎn)數(shù):^((-\d+(.\d+)?)|(0+(.0+)?))$ 或 ^(-([1-9]\d.\d|0.\d[1-9]\d))|0?.0+|0$
17 正浮點(diǎn)數(shù):^[1-9]\d.\d|0.\d[1-9]\d$ 或 ^(([0-9]+.[0-9][1-9][0-9])|([0-9][1-9][0-9].[0-9]+)|([0-9][1-9][0-9]))$
18 負(fù)浮點(diǎn)數(shù):^-([1-9]\d.\d|0.\d[1-9]\d)$ 或 ^(-(([0-9]+.[0-9][1-9][0-9])|([0-9][1-9][0-9].[0-9]+)|([0-9][1-9][0-9])))$
19 浮點(diǎn)數(shù):^(-?\d+)(.\d+)?$ 或 ^-?([1-9]\d.\d|0.\d[1-9]\d|0?.0+|0)$

二、校驗(yàn)字符的表達(dá)式
1 漢字:^[\u4e00-\u9fa5]{0,}$
2 英文和數(shù)字:^[A-Za-z0-9]+$ 或 ^[A-Za-z0-9]{4,40}$
3 長(zhǎng)度為3-20的所有字符:^.{3,20}$
4 由26個(gè)英文字母組成的字符串:^[A-Za-z]+$
5 由26個(gè)大寫(xiě)英文字母組成的字符串:^[A-Z]+$
6 由26個(gè)小寫(xiě)英文字母組成的字符串:^[a-z]+$
7 由數(shù)字和26個(gè)英文字母組成的字符串:^[A-Za-z0-9]+$
8 由數(shù)字、26個(gè)英文字母或者下劃線組成的字符串:^\w+$ 或 ^\w{3,20}$
9 中文、英文、數(shù)字包括下劃線:^[\u4E00-\u9FA5A-Za-z0-9_]+$
10 中文、英文、數(shù)字但不包括下劃線等符號(hào):^[\u4E00-\u9FA5A-Za-z0-9]+$ 或 ^[\u4E00-\u9FA5A-Za-z0-9]{2,20}$
11 可以輸入含有%&',;=?$"等字符:[%&',;=?$\x22]+
12 禁止輸入含有的字符:[^\x22]+

三、特殊需求表達(dá)式
1 Email地址:^\w+([-+.]\w+)@\w+([-.]\w+).\w+([-.]\w+)$
2 域名:[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.?
3 InternetURL:[a-zA-z]+://[^\s]
或 ^http://([\w-]+.)+[\w-]+(/[\w-./?%&=])?$
4 手機(jī)號(hào)碼:^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\d{8}$
5 電話號(hào)碼("XXX-XXXXXXX"、"XXXX-XXXXXXXX"、"XXX-XXXXXXX"、"XXX-XXXXXXXX"、"XXXXXXX"和"XXXXXXXX):^((\d{3,4}-)|\d{3.4}-)?\d{7,8}$
6 國(guó)內(nèi)電話號(hào)碼(0511-4405222、021-87888822):\d{3}-\d{8}|\d{4}-\d{7}
7 身份證號(hào)(15位、18位數(shù)字):^\d{15}|\d{18}$
8 短身份證號(hào)碼(數(shù)字、字母x結(jié)尾):^([0-9]){7,18}(x|X)?$ 或 ^\d{8,18}|[0-9x]{8,18}|[0-9X]{8,18}?$
9 帳號(hào)是否合法(字母開(kāi)頭,允許5-16字節(jié),允許字母數(shù)字下劃線):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
10 密碼(以字母開(kāi)頭,長(zhǎng)度在6~18之間,只能包含字母、數(shù)字和下劃線):^[a-zA-Z]\w{5,17}$
11 強(qiáng)密碼(必須包含大小寫(xiě)字母和數(shù)字的組合,不能使用特殊字符,長(zhǎng)度在8-10之間):^(?=.
\d)(?=.[a-z])(?=.[A-Z]).{8,10}$
12 日期格式:^\d{4}-\d{1,2}-\d{1,2}
13 一年的12個(gè)月(01~09和1~12):^(0?[1-9]|1[0-2])$
14 一個(gè)月的31天(01~09和1~31):^((0?[1-9])|((1|2)[0-9])|30|31)$

15 錢(qián)的輸入格式:
16 1.有四種錢(qián)的表示形式我們可以接受:"10000.00" 和 "10,000.00", 和沒(méi)有 "分" 的 "10000" 和 "10,000":^[1-9][0-9]$
17 2.這表示任意一個(gè)不以0開(kāi)頭的數(shù)字,但是,這也意味著一個(gè)字符"0"不通過(guò),所以我們采用下面的形式:^(0|[1-9][0-9]
)$
18 3.一個(gè)0或者一個(gè)不以0開(kāi)頭的數(shù)字.我們還可以允許開(kāi)頭有一個(gè)負(fù)號(hào):^(0|-?[1-9][0-9])$
19 4.這表示一個(gè)0或者一個(gè)可能為負(fù)的開(kāi)頭不為0的數(shù)字.讓用戶以0開(kāi)頭好了.把負(fù)號(hào)的也去掉,因?yàn)殄X(qián)總不能是負(fù)的吧.下面我們要加的是說(shuō)明可能的小數(shù)部分:^[0-9]+(.[0-9]+)?$
20 5.必須說(shuō)明的是,小數(shù)點(diǎn)后面至少應(yīng)該有1位數(shù),所以"10."是不通過(guò)的,但是 "10" 和 "10.2" 是通過(guò)的:^[0-9]+(.[0-9]{2})?$
21 6.這樣我們規(guī)定小數(shù)點(diǎn)后面必須有兩位,如果你認(rèn)為太苛刻了,可以這樣:^[0-9]+(.[0-9]{1,2})?$
22 7.這樣就允許用戶只寫(xiě)一位小數(shù).下面我們?cè)摽紤]數(shù)字中的逗號(hào)了,我們可以這樣:^[0-9]{1,3}(,[0-9]{3})
(.[0-9]{1,2})?$
23 8.1到3個(gè)數(shù)字,后面跟著任意個(gè) 逗號(hào)+3個(gè)數(shù)字,逗號(hào)成為可選,而不是必須:^([0-9]+|[0-9]{1,3}(,[0-9]{3}))(.[0-9]{1,2})?$
24 備注:這就是最終結(jié)果了,別忘了"+"可以用"
"替代如果你覺(jué)得空字符串也可以接受的話(奇怪,為什么?)最后,別忘了在用函數(shù)時(shí)去掉去掉那個(gè)反斜杠,一般的錯(cuò)誤都在這里
25 xml文件:^([a-zA-Z]+-?)+[a-zA-Z0-9]+\.[x|X][m|M][l|L]$
26 中文字符的正則表達(dá)式:[\u4e00-\u9fa5]
27 雙字節(jié)字符:[^\x00-\xff] (包括漢字在內(nèi),可以用來(lái)計(jì)算字符串的長(zhǎng)度(一個(gè)雙字節(jié)字符長(zhǎng)度計(jì)2,ASCII字符計(jì)1))
28 空白行的正則表達(dá)式:\n\s\r (可以用來(lái)刪除空白行)
29 HTML標(biāo)記的正則表達(dá)式:<(\S
?)[^>]>.?</\1>|<.? /> (網(wǎng)上流傳的版本太糟糕,上面這個(gè)也僅僅能部分,對(duì)于復(fù)雜的嵌套標(biāo)記依舊無(wú)能為力)
30 首尾空白字符的正則表達(dá)式:^\s
|\s$或(^\s)|(\s*$) (可以用來(lái)刪除行首行尾的空白字符(包括空格、制表符、換頁(yè)符等等),非常有用的表達(dá)式)
31 騰訊QQ號(hào):[1-9][0-9]{4,} (騰訊QQ號(hào)從10000開(kāi)始)
32 中國(guó)郵政編碼:[1-9]\d{5}(?!\d) (中國(guó)郵政編碼為6位數(shù)字)
33 IP地址:\d+.\d+.\d+.\d+ (提取IP地址時(shí)有用)
34 IP地址:((?:(?:25[0-5]|2[0-4]\d|[01]?\d?\d)\.){3}(?:25[0-5]|2[0-4]\d|[01]?\d?\d))

1 . 校驗(yàn)密碼強(qiáng)度
密碼的強(qiáng)度必須是包含大小寫(xiě)字母和數(shù)字的組合,不能使用特殊字符,長(zhǎng)度在8-10之間。

^(?=.\d)(?=.[a-z])(?=.*[A-Z]).{8,10}$

  1. 校驗(yàn)中文
    字符串僅能是中文。

^[\u4e00-\u9fa5]{0,}$

  1. 由數(shù)字、26個(gè)英文字母或下劃線組成的字符串
    ^\w+$
  2. 校驗(yàn)E-Mail 地址
    同密碼一樣,下面是E-mail地址合規(guī)性的正則檢查語(yǔ)句。

[\w!#$%&'+/=?^_{|}~-]+(?:\\.[\\w!#$%&'*+/=?^_{|}~-]+)@(?:\w?\.)+\w?

  1. 校驗(yàn)身份證號(hào)碼
    下面是身份證號(hào)碼的正則校驗(yàn)。15 或 18位。

15位:

^[1-9]\d{7}((0\d)|(1[0-2]))(([0|1|2]\d)|3[0-1])\d{3}$
18位:

^[1-9]\d{5}[1-9]\d{3}((0\d)|(1[0-2]))(([0|1|2]\d)|3[0-1])\d{3}([0-9]|X)$

  1. 校驗(yàn)日期
    “yyyy-mm-dd“ 格式的日期校驗(yàn),已考慮平閏年。

^(?:(?!0000)[0-9]{4}-(?:(?:0[1-9]|1[0-2])-(?:0[1-9]|1[0-9]|2[0-8])|(?:0[13-9]|1[0-2])-(?:29|30)|(?:0[13578]|1[02])-31)|(?:[0-9]{2}(?:0[48]|[2468][048]|[13579][26])|(?:0[48]|[2468][048]|[13579][26])00)-02-29)$

  1. 校驗(yàn)金額
    金額校驗(yàn),精確到2位小數(shù)。

^[0-9]+(.[0-9]{2})?$

  1. 校驗(yàn)手機(jī)號(hào)
    下面是國(guó)內(nèi) 13、15、18開(kāi)頭的手機(jī)號(hào)正則表達(dá)式。(可根據(jù)目前國(guó)內(nèi)收集號(hào)擴(kuò)展前兩位開(kāi)頭號(hào)碼)

^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\d{8}$

  1. 判斷IE的版本
    IE目前還沒(méi)被完全取代,很多頁(yè)面還是需要做版本兼容,下面是IE版本檢查的表達(dá)式。

^.MSIE 5-8?(?!.Trident\/[5-9]\.0).*$

  1. 校驗(yàn)IP-v4地址
    IP4 正則語(yǔ)句。

\b(?:(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.){3}(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\b

  1. 校驗(yàn)IP-v6地址
    IP6 正則語(yǔ)句。

(([0-9a-fA-F]{1,4}:){7,7}[0-9a-fA-F]{1,4}|([0-9a-fA-F]{1,4}:){1,7}:|([0-9a-fA-F]{1,4}:){1,6}:[0-9a-fA-F]{1,4}|([0-9a-fA-F]{1,4}:){1,5}(:[0-9a-fA-F]{1,4}){1,2}|([0-9a-fA-F]{1,4}:){1,4}(:[0-9a-fA-F]{1,4}){1,3}|([0-9a-fA-F]{1,4}:){1,3}(:[0-9a-fA-F]{1,4}){1,4}|([0-9a-fA-F]{1,4}:){1,2}(:[0-9a-fA-F]{1,4}){1,5}|[0-9a-fA-F]{1,4}:((:[0-9a-fA-F]{1,4}){1,6})|:((:[0-9a-fA-F]{1,4}){1,7}|:)|fe80:(:[0-9a-fA-F]{0,4}){0,4}%[0-9a-zA-Z]{1,}|::(ffff(:0{1,4}){0,1}:){0,1}((25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])\.){3,3}(25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])|([0-9a-fA-F]{1,4}:){1,4}:((25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])\.){3,3}(25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9]))

  1. 檢查URL的前綴
    應(yīng)用開(kāi)發(fā)中很多時(shí)候需要區(qū)分請(qǐng)求是HTTPS還是HTTP,通過(guò)下面的表達(dá)式可以取出一個(gè)url的前綴然后再邏輯判斷。

if (!s.match(/^[a-zA-Z]+:\/\//))
{
s = 'http://' + s;
}

  1. 提取URL鏈接
    下面的這個(gè)表達(dá)式可以篩選出一段文本中的URL。

^(f|ht){1}(tp|tps):\/\/([\w-]+\.)+[\w-]+(\/[\w- ./?%&=]*)?

  1. 文件路徑及擴(kuò)展名校驗(yàn)
    驗(yàn)證windows下文件路徑和擴(kuò)展名(下面的例子中為.txt文件)

([a-zA-Z]\:|\\)\\([\\]+\\)[^\/:?"<>|]+\.txt(l)?$

  1. 提取Color Hex Codes
    有時(shí)需要抽取網(wǎng)頁(yè)中的顏色代碼,可以使用下面的表達(dá)式。

^#([A-Fa-f0-9]{6}|[A-Fa-f0-9]{3})$

  1. 提取網(wǎng)頁(yè)圖片
    假若你想提取網(wǎng)頁(yè)中所有圖片信息,可以利用下面的表達(dá)式。

\< [img][^\\>][src] *= [\"\']{0,1}([^\"\'\ >])

  1. 提取頁(yè)面超鏈接
    提取html中的超鏈接。

(<a\s(?!.\brel=)[^>])(href="https?:\/\/)((?!(?:(?:www\.)?'.implode('|(?:www\.)?', $follow_list).'))[^"]+)"((?!.\brel=)[>]*)(?:[>]*)>

  1. 查找CSS屬性
    通過(guò)下面的表達(dá)式,可以搜索到相匹配的CSS屬性。

^\s[a-zA-Z\-]+\s[:]{1}\s[a-zA-Z0-9\s.#]+[;]{1}

  1. 抽取注釋
    如果你需要移除HMTL中的注釋?zhuān)梢允褂萌缦碌谋磉_(dá)式。
  1. 匹配HTML標(biāo)簽
    通過(guò)下面的表達(dá)式可以匹配出HTML中的標(biāo)簽屬性。

<\/?\w+((\s+\w+(\s=\s(?:".?"|'.?'|[\^'">\s]+))?)+\s|\s)\/?>

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 227,702評(píng)論 6 531
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 98,143評(píng)論 3 415
  • 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人,你說(shuō)我怎么就攤上這事。” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 175,553評(píng)論 0 373
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我,道長(zhǎng),這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 62,620評(píng)論 1 307
  • 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 71,416評(píng)論 6 405
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 54,940評(píng)論 1 321
  • 那天,我揣著相機(jī)與錄音,去河邊找鬼。 笑死,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,024評(píng)論 3 440
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 42,170評(píng)論 0 287
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 48,709評(píng)論 1 333
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 40,597評(píng)論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 42,784評(píng)論 1 369
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,291評(píng)論 5 357
  • 正文 年R本政府宣布,位于F島的核電站,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 44,029評(píng)論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 34,407評(píng)論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 35,663評(píng)論 1 280
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 51,403評(píng)論 3 390
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 47,746評(píng)論 2 370

推薦閱讀更多精彩內(nèi)容

  • RegExp是正則表達(dá)式的縮寫(xiě)正則表達(dá)式使用單個(gè)字符串來(lái)描述、匹配一系列符合某個(gè)句法規(guī)則的字符串。 正則的定義方法...
    饑人谷_廖珍閱讀 335評(píng)論 0 1
  • 前言 作為一個(gè)程序員,要出去裝逼,手中必備的技能就是正則表達(dá)式。程序員的正則表達(dá)式,醫(yī)生的處方和道士的鬼畫(huà)符,都是...
    Layzimo閱讀 561評(píng)論 0 6
  • www.cnblogs.com/hai-ping/articles/2997538.html /判斷輸入內(nèi)容是否為...
    自話閱讀 1,051評(píng)論 0 1
  • --------------------------正則的作用--------------------------...
    G_whk閱讀 630評(píng)論 1 5
  • 昨天中午忽然感覺(jué)渾身冷,感冒的前兆,幸運(yùn)的是食堂小妹做了熱乎乎的混燉,美味又暖身。 感恩同事把房間讓出供我休息,一...
    LLXYXR閱讀 154評(píng)論 0 0