匹配特定數字,代碼如下:
評注:處理大量數據時有用,具體應用時注意修正
匹配特定字符串,代碼如下:
評注:最基本也是最常用的一些表達式
匹配中文字符的正則表達式:[u4e00-u9fa5],代碼如下:
評注:匹配中文還真是個頭疼的事,有了這個表達式就好辦了
匹配雙字節字符(包括漢字在內):[^x00-xff],代碼如下:
評注:編碼表,雙字節字符編碼范圍 1. GBK (GB2312/GB18030) x00-xff GBK雙字節編碼范圍 x20-x7f ASCII
xa1-xff 中文 gb2312 x80-xff 中文 gbk 2. UTF-8 (Unicode) u4e00-u9fa5 (中文) x3130-x318F (韓文
xAC00-xD7A3 (韓文) u0800-u4e00 (日文)
匹配空白行的正則表達式:ns*r,代碼如下:
評注:可以用來刪除空白行
匹配HTML標記的正則表達式:<(S*?)[^>]*>.*?</1>|<.*? />
評注:網上流傳的版本太糟糕,上面這個也僅僅能匹配部分,對于復雜的嵌套標記依舊無能為力
匹配首尾空白字符的正則表達式:^s*|s*$
評注:可以用來刪除行首行尾的空白字符(包括空格、制表符、換頁符等等),非常有用的表達式
匹配Email地址的正則表達式:w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*
評注:表單驗證時很實用
匹配網址URL的正則表達式:[a-zA-z]+://[^s]*
評注:網上流傳的版本功能很有限,上面這個基本可以滿足需求
匹配帳號是否合法(字母開頭,允許5-16字節,允許字母數字下劃線):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
評注:表單驗證時很實用
匹配國內電話號碼:d{3}-d{8}|d{4}-d{7}
評注:匹配形式如 0511-4405222 或 021-87888822
匹配騰訊QQ號:[1-9][0-9]{4,}
評注:騰訊QQ號從10000開始
匹配中國郵政編碼:[1-9]d{5}(?!d)
評注:中國郵政編碼為6位數字
匹配身份證:d{15}|d{18}
評注:中國的身份證為15位或18位
匹配ip地址:d+.d+.d+.d+
評注:提取ip地址時有用
可能對你有用的與正則表達式有關的內容
一,a-z A-Z_0-9 //最常見的字符
二,(bfw)(sda) //用圓括號包含起來的單元符號,一個括號表示一個整體
三,[sdwe][^mjnb] //用方括號包含起來的原子表,原子表中^代表排除或相反內容
四,轉義字符
d 包含所有的數字[0-9]
D 除所有數字外[^0-9]
w 包含所有英文字符[a-zA-Z_0-9]
W 除所有英文字符外[^a-zA-Z_0-9] -----匹配特殊字符
s 包含空白區域 如回車,換行,分頁等[fnr]
4,正則表達式元字符
* 匹配前一個內容的0次或多次
. 匹配內容的0次或多次,但不包含回車換行
+ 匹配前一個內容的1次或多次
? 匹配前一個內容的0次或1次
| 選擇匹配,類似php中||的用法
^ 匹配字符串首部的內容
$ 匹配字符串尾部內容
b 匹配單詞邊界,邊界可以是空格或者特殊符號
B 匹配除帶單詞邊界的意外內容
{m} 匹配前一個內容的重復次數為m次
{m,} 匹配前一個內容的重復次數大于等于m次
{m,n} 匹配前一個內容的重復次數m次到n次
() 合并整體匹配,并放入內存,可使用12依次獲取調用