win2003使用preg_match_all導(dǎo)致apache崩潰解決辦法
來源:程序員人生 發(fā)布時間:2014-04-19 07:02:04 閱讀次數(shù):4019次
Apache/2.2.9 (Win32) + PHP/5.2.17,在使用正則表達式 preg_match_all (如 preg_match_all("/ni(.*?)wo/", $html, $matches);)進行分析匹配比較長的字符串 $html 時(大于10萬字節(jié),一般用于分析采集回來的網(wǎng)頁源碼),Apache服務(wù)器會崩潰自動重啟。
在Apache錯誤日志里有這樣的提示:
- [Thu Apr 11 18:31:31 2013] [notice] Parent: child process exited with status 128 -- Restarting.
- [Thu Apr 11 18:31:31 2013] [notice] Apache/2.2.9 (Win32) PHP/5.2.17 configured -- resuming normal operations
- [Thu Apr 11 18:31:31 2013] [notice] Server built: Jun 13 2008 04:04:59
- [Thu Apr 11 18:31:31 2013] [notice] Parent: Created child process 2964
- [Thu Apr 11 18:31:31 2013] [notice] Disabled use of AcceptEx() WinSock2 API
- [Thu Apr 11 18:31:31 2013] [notice] Child 2964: Child process is running
- [Thu Apr 11 18:31:31 2013] [notice] Child 2964: Acquired the start mutex.
- [Thu Apr 11 18:31:31 2013] [notice] Child 2964: Starting 350 worker threads.
- [Thu Apr 11 18:31:31 2013] [notice] Child 2964: Listening on port 80.
經(jīng)過查閱Apache官方以及論壇資料后,發(fā)現(xiàn)win平臺下用正則 preg_match_all 或preg_match 分析比較長的字符串時,導(dǎo)致apache崩潰重啟的原因是windows平臺下默認分配的線程堆棧空間 ThreadStackSize 太小導(dǎo)致的。 win32默認只有256KB,而在 linux下默認值是 8M,這就是為什么同樣的程序在 linux平臺下正常,而在 win平臺下不正常的原因。
根據(jù)PCRE library的官方說明:256 KB 的堆棧空間對應(yīng)的pcre.recursion_limit大小應(yīng)該不超過524。
下面就是一張Stacksize和pcre.recursion_limit對應(yīng)的建議安全值,超過這個數(shù)值就極有可能發(fā)生堆棧溢出,apache crash:
- Stacksize pcre.recursion_limit
- 64 MB 134217
- 32 MB 67108
- 16 MB 33554
- 8 MB 16777
- 4 MB 8388
- 2 MB 4194
- 1 MB 2097
- 512 KB 1048
- 256 KB 524
如果你沒有調(diào)整堆棧大小,就必須在使用正則的PHP頁面最開頭加入:
- <?php
- ini_set("pcre.recursion_limit", "524");
- ?>
查看具體的錯誤可以使用下面的代碼:
- $resultsArray = preg_match_all("/table.*?<a>/isU", $html, $contents);
- if ($resultsArray === 0){
- echo get_pcre_err();
- }
- function get_pcre_err(){
- $pcre_err = preg_last_error();
- if ($pcre_err === PREG_NO_ERROR) {
- $msg = 'Successful non-match.';
- } else {
-
- switch ($pcre_err) {
- case PREG_INTERNAL_ERROR:
- $msg = 'PREG_INTERNAL_ERROR';
- break;
- case PREG_BACKTRACK_LIMIT_ERROR:
- $msg = 'PREG_BACKTRACK_LIMIT_ERROR';
- break;
- case PREG_RECURSION_LIMIT_ERROR:
- $msg = 'PREG_RECURSION_LIMIT_ERROR';
- break;
- case PREG_BAD_UTF8_ERROR:
- $msg = 'PREG_BAD_UTF8_ERROR';
- break;
- case PREG_BAD_UTF8_OFFSET_ERROR:
- $msg = 'PREG_BAD_UTF8_OFFSET_ERROR';
- break;
- default:
- $msg = 'Unrecognized PREG error';
- break;
- }
- }
- return($msg);
- }
對于正則的修飾符 isU 說明:
i: 表示in-casesensitive,即大小寫不敏感
s: PCRE_DOTALL,表示點號可以匹配換行符。
U: 表示PCRE_UNGREEDY,表示非貪婪,相當(dāng)于perl/python語言的.*?,在匹配過程中,對于.*正則,一有匹配立即執(zhí)行,而不是等.*搜索了所有字符再一一返回,在使用正則表達式時,我們應(yīng)該盡量避免遞歸調(diào)用,遞歸容易導(dǎo)致堆棧溢出。比如:
/<table((?!<table).)*?</a>/isU 就會發(fā)生錯誤,而使用 /<table.*?</a>/i 就正常。
那么如何增加win平臺下 ThreadStackSize 的大小呢? 在apache的配置文件 httpd.conf 里啟用 “Include conf/extra/httpd-mpm.conf”(刪除前面的注釋#),然后在 httpd-mpm.conf 文件里的 mpm_winnt_module 配置模塊里設(shè)置 “ThreadStackSize 8400000”即可(大約8M),代碼如下:
- <IfModule mpm_winnt_module>
- ThreadStackSize 8400000
- ThreadsPerChild 200
- MaxRequestsPerChild 10000
- Win32DisableAcceptEx
- </IfModule>
這里需要注意的是,32位的Apache程序只能最多使用大約2GB內(nèi)存空間! 因此,ThreadStackSize 和ThreadsPerChild 的值相乘后(8M * 200)不應(yīng)該超過2G,否則無法啟動apache,出現(xiàn)的錯誤日志如下:
- [Thu Apr 11 20:02:45 2013] [crit] (OS 8)存儲空間不足,無法處理此命令。 : Child 4832: _beginthreadex failed. Unable to create all worker threads. Created 212 of the 220 threads requested with the ThreadsPerChild configuration directive.
通過上面的提示,飄易可以告訴大家的是在我的這臺服務(wù)器上,當(dāng)線程堆棧大小設(shè)為8M時,我可以設(shè)置的線程數(shù)最多是212個。
生活不易,碼農(nóng)辛苦
如果您覺得本網(wǎng)站對您的學(xué)習(xí)有所幫助,可以手機掃描二維碼進行捐贈