PHP 讀取文件亂碼的解決方法
來源:程序員人生 發布時間:2014-05-26 11:11:51 閱讀次數:3020次
php 5的流讀取函數好像默認編碼是UTF-8,以前在php 4里直接file_get_contents()讀取gb2312編碼的正常,到了5就亂碼了。網上的解決辦法說抓取后用iconv()轉碼。看后我就覺 得不對勁:一個是不一定編譯了iconv庫,更大的問題是編碼都跟流轉換的時候有關(如果用了iconv實際上php轉了兩次碼:流 -> UTF-8 -> GB2312):這不是白忙乎了嗎?
仔細看了下php的文檔(不知道大家都是怎么寫代碼的,其實文檔上很清楚啊),上面關于fopen()及file_get_contents()都 提到了“默認是UTF-8,但是用戶可以用stream_default_encoding()或者用戶自定義上下文屬性改變編碼”(If unicode semantics are enabled, the default encoding of the read data is UTF-8. You can specify a different encoding by creating a custom context or by changing the default using stream_default_encoding().)。于是用stream_default_encoding(’gb2312′);測試:但是 faint的是,這個函數不存在?!似乎php 6才支持。不過天無絕人之路,還有“用戶自定義上下文屬性”可以用。
經過更仔細的看文檔,最后解決了這個問題:
//設置流的編碼格式,這是文件流(file),如果是網絡訪問,file改成http
$opts = array('file' => array('encoding' => 'gb2312'));
$ctxt = stream_context_create($opts);
file_get_contents(文件名, FILE_TEXT, $ctxt);
生活不易,碼農辛苦
如果您覺得本網站對您的學習有所幫助,可以手機掃描二維碼進行捐贈