PHPCMS只能采集絕對路徑的圖片,不能采集相對路徑的圖片,解決方法
方法一
在采集數據過程中,出現的phpcms采集圖片不能顯示
原因:phpcms2008 sp3版本在采集過程中圖片沒有保存到本地,/spider/include/get_remotefiles.func.php 文件get_remotefileurls函數中的src 前的空格導致了圖片在采集內容時采集不了。
解決方法,在以上文件中找到
if (!preg_match_all(“/<(?:a|img).+?(href| src)=(["|']?)([^ "'>]+.($ext))2/i”, $string, $matches))
把它改成
if (!preg_match_all(“/<(?:a|img).+?(href|src)=(["|']?)([^ "'>]+.($ext))2/i”, $string, $matches))
方法二
首先,如果已經寫好采集規則的朋友,自己先備份一下spider文件夾,這個文件夾地址在網站根目錄下(一會我們還要用到里面的東東),沒有寫采集規則的朋友就不用備份了(建議備份,以備恢復);
第二步:下載修改好的spider文件,解壓縮后覆蓋原文件;
第三步:將前期備份的spider文件里面的rules文件夾復制到新spider下,替換原文件(這一步也主要針對前期做好采集規則的朋友,因為rules文件夾下包含了你的采集規則);