多多色-多人伦交性欧美在线观看-多人伦精品一区二区三区视频-多色视频-免费黄色视屏网站-免费黄色在线

國內最全IT社區平臺 聯系我們 | 收藏本站
阿里云優惠2
您當前位置:首頁 > php開源 > php教程 > PHP采集程序中常用的函數

PHP采集程序中常用的函數

來源:程序員人生   發布時間:2013-10-10 03:46:27 閱讀次數:3307次
函數描述及例子 PHP采集程序中常用的函數 查詢關鍵字 PHP采集程序中常用的函數
  1. //獲得當前的腳本網址   
  2. function get_php_url(){   
  3.         if(!emptyempty($_SERVER["REQUEST_URI"])){   
  4.                 $scriptName = $_SERVER["REQUEST_URI"];   
  5.                 $nowurl = $scriptName;   
  6.         }else{   
  7.                 $scriptName = $_SERVER["PHP_SELF"];   
  8.                 if(emptyempty($_SERVER["QUERY_STRING"])) $nowurl = $scriptName;   
  9.                 else $nowurl = $scriptName."?".$_SERVER["QUERY_STRING"];   
  10.         }   
  11.         return $nowurl;   
  12. }   
  13. //把全角數字轉為半角數字   
  14. function GetAlabNum($fnum){   
  15.         $nums = array("0","1","2","3","4","5","6","7","8","9");   
  16.         $fnums = "0123456789";   
  17.         for($i=0;$i<=9;$i++) $fnum = str_replace($nums[$i],$fnums[$i],$fnum);   
  18.         $fnum = ereg_replace("[^0-9.]|^0{1,}","",$fnum);   
  19.         if($fnum==""$fnum=0;   
  20.         return $fnum;   
  21. }   
  22. //去除HTML標記   
  23. function Text2Html($txt){   
  24.         $txt = str_replace("  "," ",$txt);   
  25.         $txt = str_replace("<","<",$txt);   
  26.         $txt = str_replace(">",">",$txt);   
  27.         $txt = preg_replace("/[]{1,}/isU","  
  28. ",$txt);   
  29.         return $txt;   
  30. }  
  31. //清除HTML標記   
  32. function ClearHtml($str){   
  33.         $str = str_replace('<','<',$str);   
  34.         $str = str_replace('>','>',$str);   
  35.         return $str;   
  36. }   
  37. //相對路徑轉化成絕對路徑   
  38. function relative_to_absolute($content$feed_url) {   
  39.     preg_match('/(http|https|ftp):///'$feed_url$protocol);   
  40.     $server_url = preg_replace("/(http|https|ftp|news):///"""$feed_url);   
  41.     $server_url = preg_replace("//.*/"""$server_url);  
  42.     if ($server_url == '') {   
  43.         return $content;   
  44.     }  
  45.     if (isset($protocol[0])) {   
  46.         $new_content = preg_replace('/href="//''href="'.$protocol[0].$server_url.'/'$content);   
  47.         $new_content = preg_replace('/src="//''src="'.$protocol[0].$server_url.'/'$new_content);   
  48.     } else {   
  49.         $new_content = $content;   
  50.     }   
  51.     return $new_content;   
  52. }   
  53. //取得所有鏈接   
  54. function get_all_url($code){   
  55.         preg_match_all('/<as+href=["|']?([^>"' ]+)["|']?s*[^>]*>([^>]+)</a>/i',$code,$arr);   
  56.         return array('name'=>$arr[2],'url'=>$arr[1]);   
  57. }  
  58. //獲取指定標記中的內容   
  59. function get_tag_data($str$start$end){   
  60.         if ( $start == '' || $end == '' ){   
  61.                return;   
  62.         }   
  63.         $str = explode($start$str);   
  64.         $str = explode($end$str[1]);   
  65.         return $str[0];   
  66. }   
  67. //HTML表格的每行轉為CSV格式數組   
  68. function get_tr_array($table) {   
  69.         $table = preg_replace("'<td[^>]*?>'si",'"',$table);   
  70.         $table = str_replace("",'",',$table);   
  71.         $table = str_replace("","{tr}",$table);   
  72.         //去掉 HTML 標記   
  73.         $table = preg_replace("'<[/!]*?[^<>]*?>'si","",$table);   
  74.         //去掉空白字符   
  75.         $table = preg_replace("'([])[s]+'","",$table);   
  76.         $table = str_replace(" ","",$table);   
  77.         $table = str_replace(" ","",$table);  
  78.         $table = explode(",{tr}",$table);   
  79.         array_pop($table);   
  80.         return $table;   
  81. }  
  82. //將HTML表格的每行每列轉為數組,采集表格數據   
  83. function get_td_array($table) {   
  84.         $table = preg_replace("'<table[^>]*?>'si","",$table);   
  85.         $table = preg_replace("'<tr[^>]*?>'si","",$table);   
  86.         $table = preg_replace("'<td[^>]*?>'si","",$table);   
  87.         $table = str_replace("","{tr}",$table);   
  88.         $table = str_replace("","{td}",$table);   
  89.         //去掉 HTML 標記   
  90.         $table = preg_replace("'<[/!]*?[^<>]*?>'si","",$table);   
  91.         //去掉空白字符   
  92.         $table = preg_replace("'([])[s]+'","",$table);   
  93.         $table = str_replace(" ","",$table);   
  94.         $table = str_replace(" ","",$table);   
  95.           
  96.         $table = explode('{tr}'$table);   
  97.         array_pop($table);   
  98.         foreach ($table as $key=>$tr) {   
  99.                 $td = explode('{td}'$tr);   
  100.                 array_pop($td);   
  101.             $td_array[] = $td;   
  102.         }   
  103.         return $td_array;   
  104. }  
  105. //返回字符串中的所有單詞 $distinct=true 去除重復   
  106. function split_en_str($str,$distinct=true) {   
  107.         preg_match_all('/([a-zA-Z]+)/',$str,$match);   
  108.         if ($distinct == true) {   
  109.                 $match[1] = array_unique($match[1]);   
  110.         }   
  111.         sort($match[1]);   
  112.         return $match[1];   
  113. }  
  114.    
  115. 函數描述及例子  
  116.    
  117. PHP采集程序中常用的函數  
  118.  
  119. 查詢關鍵字  
  120.    
  121. PHP采集程序中常用的函數  
  122. <!--?  
  123. //獲得當前的腳本網址   
  124. function get_php_url(){   
  125.         if(!emptyempty($_SERVER["REQUEST_URI"])){   
  126.                 $scriptName = $_SERVER["REQUEST_URI"];   
  127.                 $nowurl = $scriptName;   
  128.         }else{   
  129.                 $scriptName = $_SERVER["PHP_SELF"];   
  130.                 if(emptyempty($_SERVER["QUERY_STRING"])) $nowurl = $scriptName;   
  131.                 else $nowurl = $scriptName."?".$_SERVER["QUERY_STRING"];   
  132.         }   
  133.         return $nowurl;   
  134. }   
  135. //把全角數字轉為半角數字   
  136. function GetAlabNum($fnum){   
  137.         $nums = array("0","1","2","3","4","5","6","7","8","9");   
  138.         $fnums = "0123456789";   
  139.         for($i=0;$i<=9;$i++) $fnum = str_replace($nums[$i],$fnums[$i],$fnum);   
  140.         $fnum = ereg_replace("[^0-9.]|^0{1,}","",$fnum);   
  141.         if($fnum==""$fnum=0;   
  142.         return $fnum;   
  143. }   
  144. //去除HTML標記   
  145. function Text2Html($txt){   
  146.         $txt = str_replace("  "," ",$txt);   
  147.         $txt = str_replace("<","<",$txt);   
  148.         $txt = str_replace("-->",">",$txt);   
  149.         $txt = preg_replace("/[]{1,}/isU","  
  150. ",$txt);   
  151.         return $txt;   
  152. }  
  153. //清除HTML標記   
  154. function ClearHtml($str){   
  155.         $str = str_replace('<','<',$str);   
  156.         $str = str_replace('>','>',$str);   
  157.         return $str;   
  158. }   
  159. //相對路徑轉化成絕對路徑   
  160. function relative_to_absolute($content$feed_url) {   
  161.     preg_match('/(http|https|ftp):///'$feed_url$protocol);   
  162.     $server_url = preg_replace("/(http|https|ftp|news):///"""$feed_url);   
  163.     $server_url = preg_replace("//.*/"""$server_url);  
  164.     if ($server_url == '') {   
  165.         return $content;   
  166.     }  
  167.     if (isset($protocol[0])) {   
  168.         $new_content = preg_replace('/href="//''href="'.$protocol[0].$server_url.'/'$content);   
  169.         $new_content = preg_replace('/src="//''src="'.$protocol[0].$server_url.'/'$new_content);   
  170.     } else {   
  171.         $new_content = $content;   
  172.     }   
  173.     return $new_content;   
  174. }   
  175. //取得所有鏈接   
  176. function get_all_url($code){   
  177.         preg_match_all('/<as+href=["|']?([^>"' ]+)["|']?s*[^>]*>([^>]+)</a>/i',$code,$arr);   
  178.         return array('name'=>$arr[2],'url'=>$arr[1]);   
  179. }  
  180. //獲取指定標記中的內容   
  181. function get_tag_data($str$start$end){   
  182.         if ( $start == '' || $end == '' ){   
  183.                return;   
  184.         }   
  185.         $str = explode($start$str);   
  186.         $str = explode($end$str[1]);   
  187.         return $str[0];   
  188. }   
  189. //HTML表格的每行轉為CSV格式數組   
  190. function get_tr_array($table) {   
  191.         $table = preg_replace("'<td[^>]*?>'si",'"',$table);   
  192.         $table = str_replace("",'",',$table);   
  193.         $table = str_replace("","{tr}",$table);   
  194.         //去掉 HTML 標記   
  195.         $table = preg_replace("'<[/!]*?[^<>]*?>'si","",$table);   
  196.         //去掉空白字符   
  197.         $table = preg_replace("'([])[s]+'","",$table);   
  198.         $table = str_replace(" ","",$table);   
  199.         $table = str_replace(" ","",$table);  
  200.         $table = explode(",{tr}",$table);   
  201.         array_pop($table);   
  202.         return $table;   
  203. }  
  204. //將HTML表格的每行每列轉為數組,采集表格數據   
  205. function get_td_array($table) {   
  206.         $table = preg_replace("'<table[^>]*?>'si","",$table);   
  207.         $table = preg_replace("'<tr[^>]*?>'si","",$table);   
  208.         $table = preg_replace("'<td[^>]*?>'si","",$table);   
  209.         $table = str_replace("","{tr}",$table);   
  210.         $table = str_replace("","{td}",$table);   
  211.         //去掉 HTML 標記   
  212.         $table = preg_replace("'<[/!]*?[^<>]*?>'si","",$table);   
  213.         //去掉空白字符   
  214.         $table = preg_replace("'([])[s]+'","",$table);   
  215.         $table = str_replace(" ","",$table);   
  216.         $table = str_replace(" ","",$table);   
  217.           
  218.         $table = explode('{tr}'$table);   
  219.         array_pop($table);   
  220.         foreach ($table as $key=>$tr) {   
  221.                 $td = explode('{td}'$tr);   
  222.                 array_pop($td);   
  223.             $td_array[] = $td;   
  224.         }   
  225.         return $td_array;   
  226. }  
  227. //返回字符串中的所有單詞 $distinct=true 去除重復   
  228. function split_en_str($str,$distinct=true) {   
  229.         preg_match_all('/([a-zA-Z]+)/',$str,$match);   
  230.         if ($distinct == true) {   
  231.                 $match[1] = array_unique($match[1]);   
  232.         }   
  233.         sort($match[1]);   
  234.         return $match[1];   
  235. }  
  236.    
  237. </td[^></tr[^></table[^></td[^></as+href=["|']?([^></td[^></tr[^></table[^></td[^></as+href=["|']?([^> 

 

生活不易,碼農辛苦
如果您覺得本網站對您的學習有所幫助,可以手機掃描二維碼進行捐贈
程序員人生
------分隔線----------------------------
分享到:
------分隔線----------------------------
關閉
程序員人生
主站蜘蛛池模板: 亚洲国产片在线观看 | 中文字幕欧美日韩高清 | 欧美亚洲激情视频 | 亚洲成a人片在线观看中文!!! | 国产在线不卡 | 亚洲国产一区二区三区最新 | videos欧美成人| 亚亚洲乱码一二三四区 | 免费看片亚洲 | 性欧美高清精品videos | 国产最新精品视频 | 色交视频 | 高清一级片 | 国产高清在线看免费视频观 | 国产亚洲精品美女久久久久 | 成人区视频 | 狠久久| 久久久免费的精品 | 久久99热成人精品国产 | 中国jizz18免费| 国产香蕉偷在线观看视频 | 成在线人免费视频一区二区三区 | 伊人免费网 | 国内成人乱小说 | 亚洲天堂黄色 | 日韩国产在线观看 | 视频一区二区三区欧美日韩 | 国产女主播一区二区在线观看 | 国产激情久久久久久影院 | 国产美女激情 | www黄色网址 | 女人天堂网在线观看2019 | 久久综合久久精品 | 亚洲黄色三级视频 | α毛片| 亚洲女人天堂 | 欧美高清一级片 | 好吊妞国产欧美日韩视频 | 九色av99久久| 国产一区二区久久 | 久久精品国产亚洲a不卡 |