php中正則匹配中文漢字
來源:程序員人生 發布時間:2013-12-09 11:59:30 閱讀次數:3729次
在php中如果你想正則來獲取字符串中漢字我們先需要知道頁面編碼,正則匹配中文漢字根據頁面編碼不同而略有區別:GBK/GB2312編碼:[x80-xff>]+ 或 [xa1-xff]+ 而UTF-8編碼:[x{4e00}-x{9fa5}]+/u .
實例代碼如下:
- echo (mb_eregi("[x80-xff].","中d文") ? "有" : "無") ."漢字";
- echo (mb_eregi("^([x80-xff].)+$","中文") ? "全是漢字" : ""); 看一判斷全中文字符串函數
以下以PHP為例進行匹配:
實例代碼如下:
- <?php
- $str = "學習php是一件快樂的事.";
- preg_match_all("/[x80-xff]+/", $str, $match);
-
-
- print_r($match);
- ?>
輸出:
- Array
- (
- [0] => Array
- (
- [0] => 學習
- [1] => 是一件快樂的事.
- )
- )
正則漢字實例代碼如下:
- $str = "請問php中的eregi如何匹配漢字";
- if (preg_match("/^[".chr(0x80)."-".chr(0xff)."]+$/",$str)) {
- echo "這是一個純中文字符串";
- } else{
- echo "這不是一個純中文字串";
- }
- preg_match_all($pat,……)與preg_replace($pat,……)……
- preg_match_all("/(漢字)+/ism","我是漢字,看你把我怎么著!",$m_a);
各個編碼的高位與低位的開始與結束,那么自然就可以寫出正則,而且直接是十六位的,有啥困難?呵呵.不過要注意,在php里面,表示十六位是用的x,我們還可以用該正則表達式來判斷是否是gb2312的漢字
實例代碼如下:
- <?php
- $str = "小小子";
- if(preg_match("/^[xb0-xf7][xa0-xfe]+$/",$str)){
- print($str."確實全是漢字");
- } else {
- print($str."這個真tc不全是漢字");
- }
- ?>
生活不易,碼農辛苦
如果您覺得本網站對您的學習有所幫助,可以手機掃描二維碼進行捐贈