深入探討 Nginx 啟用反向代理時(shí)提示 502 Bad Gateway 錯(cuò)誤
當(dāng)前位置:點(diǎn)晴教程→知識(shí)管理交流
→『 技術(shù)文檔交流 』
成功解決502 Bad Gateway錯(cuò)誤 今天登陸博客,顯示502 bad gateway,NGINX最煩人的地方就是經(jīng)常會(huì)出現(xiàn)這個(gè)錯(cuò)誤,由于我并不打算在技術(shù)上花費(fèi)過多的時(shí)間,所以一般是遇到了相關(guān)問題,通過搜索引擎解決后即可,不會(huì)去深究。廢話不多說,說說我的坎坷經(jīng)歷。 表示模塊是內(nèi)建的,不用再調(diào)入,注釋掉 #LoadModule rewrite_module modules/mod_rewrite.so 以下是補(bǔ)充: 服務(wù)器(不一定是Web服務(wù)器)是作為網(wǎng)關(guān)或代理,以滿足客戶的要求(如Web瀏覽器或我們的CheckUpDown機(jī)器人)來訪問所請(qǐng)求的URL 。此服務(wù)器收到無效響應(yīng)從上游服務(wù)器訪問履行它的要求。 關(guān)于502 bad getway報(bào)錯(cuò)的解決辦法 通俗解釋一下 1.什么是502 bad getway 報(bào)錯(cuò) 深入分析Nginx 502 Bad Gateway和Nginx 504 Gateway Time-out及其解決 Nginx 502 Bad Gateway的含義是請(qǐng)求的PHP-CGI已經(jīng)執(zhí)行,但是由于某種原因(一般是讀取資源的問題)沒有執(zhí)行完畢而導(dǎo)致PHP-CGI進(jìn)程終止。 Nginx 502 bad gateway錯(cuò)誤解決方法 使用Nginx作為Web服務(wù)器的時(shí)候,你或多或少都會(huì)遇到Nginx 502 bad gateway的錯(cuò)誤,造成這種錯(cuò)誤的原因有很多。下面我們來一一解析。 一、查看php-cgi是否在運(yùn)行 ps -A | grep php5-cgi /etc/init.d/php_cgi start if ps aux | grep ‘php5-cgi' | grep -v grep > /dev/null ; then echo "PHP-cgi is runnning !" else echo "PHP-cgi is down. Starting over…" /etc/init.d/php-fcgi start fi 二、fastcgi進(jìn)程數(shù)不夠用、php執(zhí)行時(shí)間長(zhǎng)的原因 fastcgi進(jìn)程數(shù)可以修改php-fpm.conf中的max_children的數(shù)值,高峰時(shí)php-cgi耗掉的最大內(nèi)存為20M,請(qǐng)根據(jù)自己的內(nèi)存情況計(jì)算了。 限制php執(zhí)行時(shí)間可以在php-fpm.conf中的request_terminate_timeout設(shè)置,這是為了防止php程序的bug導(dǎo)致php-cgi假死。 三、FastCGI執(zhí)行時(shí)間過長(zhǎng) fastcgi_connect_timeout 300; fastcgi_send_timeout 300; fastcgi_read_timeout 300; 最近幾天發(fā)現(xiàn)網(wǎng)通線路的服務(wù)器出現(xiàn)流量不穩(wěn)定的情況,具體的表現(xiàn)是,流量時(shí)而高,時(shí)而低,在流量低的時(shí)候發(fā)現(xiàn)系統(tǒng)的負(fù)載很小,幾乎為0,但是過一會(huì),負(fù)載又高上去,流量也上去,很是奇怪,查找了2天沒有找到原因,后來看到一邊文章,介紹了解決nginx出現(xiàn)502的錯(cuò)誤現(xiàn)象,按照這個(gè)方法進(jìn)行嘗試,最終還是找到了問題的原因。 解決步驟如下: 1、查看當(dāng)前的PHP FastCGI進(jìn)程數(shù)是否夠用 netstat -anpo | grep "php-cgi" | wc -l 如果實(shí)際使用的"FastCGI進(jìn)程數(shù)"接近預(yù)設(shè)的"FastCGI進(jìn)程數(shù)",那么,說明"FastCGI進(jìn)程數(shù)"不夠用,需要增大。 2、部分PHP程序的執(zhí)行時(shí)間超過了Nginx的等待時(shí)間,可以適當(dāng)增加nginx.conf配置文件中FastCGI的timeout時(shí)間,例如: 在做第一步的時(shí)候,系統(tǒng)當(dāng)前的PHP FastCGI進(jìn)程數(shù)明顯超過了預(yù)設(shè)值的64這個(gè)數(shù)值,在電信的服務(wù)器上查看當(dāng)前的PHP FastCGI進(jìn)程數(shù)沒有高于64這個(gè)數(shù)值,而且網(wǎng)通線路的活動(dòng)連接明顯高于電信的活動(dòng)連接,準(zhǔn)備到晚上的時(shí)候看看情況,結(jié)果到晚上22:30的時(shí)候,查看系統(tǒng)當(dāng)前的PHP FastCGI進(jìn)程數(shù)明顯小于64預(yù)設(shè)值,當(dāng)前的活動(dòng)連接也比原來低很多,由此可以說明出現(xiàn)nginx不穩(wěn)定的情況是由于服務(wù)器訪問負(fù)載過大引起的,就是加上第二步的錯(cuò)誤也不頂作用。 總結(jié),php-cgi進(jìn)程數(shù)不夠用、php執(zhí)行時(shí)間長(zhǎng)、或者是php-cgi進(jìn)程死掉,都會(huì)出現(xiàn)502錯(cuò)誤
Nginx 502錯(cuò)誤的原因比較多,是因?yàn)樵诖砟J较潞蠖朔?wù)器出現(xiàn)問題引起的。這些錯(cuò)誤一般都不是nginx本身的問題,一定要從后端找原因!但nginx把這些出錯(cuò)都攬?jiān)谧约荷砩狭耍鴮?shí)讓nginx的推廣者備受置疑,畢竟從字眼上理解,bad gateway?不就是bad nginx嗎?讓不了解的人看到,會(huì)直接把責(zé)任推在nginx身上,希望nginx下一個(gè)版本會(huì)把出錯(cuò)提示寫稍微友好一些,至少不會(huì)是現(xiàn)在簡(jiǎn)單的一句 502 Bad Gateway,另外還不忘附上自己的大名。 Nginx 502的觸發(fā)條件 502錯(cuò)誤最通常的出現(xiàn)情況就是后端主機(jī)當(dāng)機(jī)。在upstream配置里有這么一項(xiàng)配置:proxy_next_upstream,這個(gè)配置指定了 nginx在從一個(gè)后端主機(jī)取數(shù)據(jù)遇到何種錯(cuò)誤時(shí)會(huì)轉(zhuǎn)到下一個(gè)后端主機(jī),里頭寫上的就是會(huì)出現(xiàn)502的所有情況拉,默認(rèn)是error timeout。error就是當(dāng)機(jī)、斷線之類的,timeout就是讀取堵塞超時(shí),比較容易理解。我一般是全寫上的: proxy_next_upstream error timeout invalid_header http_500 http_503; 不過現(xiàn)在可能我要去掉http_500這一項(xiàng)了,http_500指定后端返回500錯(cuò)誤時(shí)會(huì)轉(zhuǎn)一個(gè)主機(jī),后端的jsp出錯(cuò)的話,本來會(huì)打印一堆 stacktrace的錯(cuò)誤信息,現(xiàn)在被502取代了。但公司的程序員可不這么認(rèn)為,他們認(rèn)定是nginx出現(xiàn)了錯(cuò)誤,我實(shí)在沒空跟他們解釋502的原理 了…… 503錯(cuò)誤就可以保留,因?yàn)楹蠖送ǔJ莂pache resin,如果apache死機(jī)就是error,但resin死機(jī),僅僅是503,所以還是有必要保留的。 解決辦法 遇到502問題,可以優(yōu)先考慮按照以下兩個(gè)步驟去解決。 1、查看當(dāng)前的PHP FastCGI進(jìn)程數(shù)是否夠用: 代碼如下: netstat -anpo | grep "php-cgi" | wc -l 如果實(shí)際使用的“FastCGI進(jìn)程數(shù)”接近預(yù)設(shè)的“FastCGI進(jìn)程數(shù)”,那么,說明“FastCGI進(jìn)程數(shù)”不夠用,需要增大。 2、部分PHP程序的執(zhí)行時(shí)間超過了Nginx的等待時(shí)間,可以適當(dāng)增加nginx.conf配置文件中FastCGI的timeout時(shí)間,例如: 代碼如下: http { php.ini中memory_limit設(shè)低了會(huì)出錯(cuò),修改了php.ini的memory_limit為64M,重啟nginx,發(fā)現(xiàn)好了,原來是PHP的內(nèi)存不足了。 ?如果這樣修改了還解決不了問題,可以參考下面這些方案: 一、max-children和max-requests 一臺(tái)服務(wù)器上運(yùn)行著nginx php(fpm) xcache,訪問量日均 300W pv左右。 最近經(jīng)常會(huì)出現(xiàn)這樣的情況:php頁面打開很慢,cpu使用率突然降至很低,系統(tǒng)負(fù)載突然升至很高,查看網(wǎng)卡的流量,也會(huì)發(fā)現(xiàn)突然降到了很低。這種情況只持續(xù)數(shù)秒鐘就恢復(fù)了。 檢查php-fpm的日志文件發(fā)現(xiàn)了一些線索。 代碼如下: Sep 30 08:32:23.289973 [NOTICE] fpm_unix_init_main(), line 271: getrlimit(nofile): max:51200, cur:51200 Sep 30 08:32:23.290212 [NOTICE] fpm_sockets_init_main(), line 371: using inherited socket fd=10, “127.0.0.1:9000″ Sep 30 08:32:23.290342 [NOTICE] fpm_event_init_main(), line 109: libevent: using epoll Sep 30 08:32:23.296426 [NOTICE] fpm_init(), line 47: fpm is running, pid 30587 在這幾句的前面,是1000多行的關(guān)閉children和開啟children的日志。 原來,php-fpm有一個(gè)參數(shù) max_requests,該參數(shù)指明了,每個(gè)children最多處理多少個(gè)請(qǐng)求后便會(huì)被關(guān)閉,默認(rèn)的設(shè)置是500。因?yàn)閜hp是把請(qǐng)求輪詢給每個(gè) children,在大流量下,每個(gè)childre到達(dá)max_requests所用的時(shí)間都差不多,這樣就造成所有的children基本上在同一時(shí)間 被關(guān)閉。 在這期間,nginx無法將php文件轉(zhuǎn)交給php-fpm處理,所以cpu會(huì)降至很低(不用處理php,更不用執(zhí)行sql),而負(fù)載會(huì)升至很高(關(guān)閉和開啟children、nginx等待php-fpm),網(wǎng)卡流量也降至很低(nginx無法生成數(shù)據(jù)傳輸給客戶端) 解決問題很簡(jiǎn)單,增加children的數(shù)量,并且將 max_requests 設(shè)置未 0 或者一個(gè)比較大的值: 打開 /usr/local/php/etc/php-fpm.conf調(diào)大以下兩個(gè)參數(shù)(根據(jù)服務(wù)器實(shí)際情況,過大也不行) 代碼如下: <value name="max_children">5120</value> 然后重啟php-fpm。 二、增加緩沖區(qū)容量大小 將nginx的error log打開,發(fā)現(xiàn)“pstream sent too big header while reading response header from upstream”這樣的錯(cuò)誤提示。查閱了一下資料,大意是nginx緩沖區(qū)有一個(gè)bug造成的,我們網(wǎng)站的頁面消耗占用緩沖區(qū)可能過大。參考老外寫的修 改辦法增加了緩沖區(qū)容量大小設(shè)置,502問題徹底解決。后來系統(tǒng)管理員又對(duì)參數(shù)做了調(diào)整只保留了2個(gè)設(shè)置參數(shù):client head buffer,fastcgi buffer size。 三、request_terminate_timeout 如果主要是在一些post或者數(shù)據(jù)庫(kù)操作的時(shí)候出現(xiàn)502這種情況,而不是在靜態(tài)頁面操作中常見,那么可以查看一下php-fpm.conf設(shè)置中的一項(xiàng): request_terminate_timeout 這個(gè)值是max_execution_time,就是fast-cgi的執(zhí)行腳本時(shí)間。 0s 0s為關(guān)閉,就是無限執(zhí)行下去。(當(dāng)時(shí)裝的時(shí)候沒仔細(xì)看就改了一個(gè)數(shù)字)問題解決了,執(zhí)行很長(zhǎng)時(shí)間也不會(huì)出錯(cuò)了。優(yōu)化fastcgi中,還可以改改這個(gè)值5s 看看效果。 php-cgi進(jìn)程數(shù)不夠用、php執(zhí)行時(shí)間長(zhǎng)、或者是php-cgi進(jìn)程死掉,都會(huì)出現(xiàn)502錯(cuò)誤。 今天,我的VPS頻繁提示Nginx 502 Bad Gateway錯(cuò)誤了,重啟了VPS解決之后又出現(xiàn),很煩。有點(diǎn)想不通,前兩天網(wǎng)站達(dá)到了1290的訪問量都沒有出什么問題,怎么這次就出現(xiàn)了502 Bad Gateway?郁悶啊!!!在搜索了很久,終于找到了不少相關(guān)的答案,希望修改之后不會(huì)再出現(xiàn)這個(gè)錯(cuò)誤了。唉,既然在網(wǎng)上找了那么久的答案,那當(dāng)然得把有用的東西記錄下,免得我下次再去谷歌~ 由于我是采用了LNMP一鍵安裝包 ,出了問題肯定要先到官方論壇去搜索下了,真好,官方有個(gè)這樣的置頂帖,大家先瞧瞧。 LNMP一鍵安裝包官方的: 第一種原因:目前l(fā)nmp一鍵安裝包比較多的問題就是502 Bad Gateway,大部分情況下原因是在安裝php前,腳本中某些lib包可能沒有安裝上,造成php沒有編譯安裝成功。 第二種原因: 在php.ini里,eaccelerator配置項(xiàng)一定要放在Zend Optimizer配置之前,否則也可能引起502 Bad Gateway 第三種原因: 在安裝好使用過程中出現(xiàn)502問題,一般是因?yàn)槟J(rèn)php-cgi進(jìn)程是5個(gè),可能因?yàn)閜hpcgi進(jìn)程不夠用而造成502,需要修改/usr/local/php/etc/php-fpm.conf 將其中的max_children值適當(dāng)增加。 第四種原因: php執(zhí)行超時(shí),修改/usr/local/php/etc/php.ini 將max_execution_time 改為300 第五種原因: 磁盤空間不足,如mysql日志占用大量空間 第六種原因: 查看php-cgi進(jìn)程是否在運(yùn)行 也有網(wǎng)友給出了另外的解決辦法: Nginx 502 Bad Gateway的含義是請(qǐng)求的PHP-CGI已經(jīng)執(zhí)行,但是由于某種原因(一般是讀取資源的問題)沒有執(zhí)行完畢而導(dǎo)致PHP-CGI進(jìn)程終止,一般來說Nginx 502 Bad Gateway和php-fpm.conf的設(shè)置有關(guān)。 php-fpm.conf有兩個(gè)至關(guān)重要的參數(shù),一個(gè)是max_children,另一個(gè)是request_terminate_timeout,但是這個(gè)值不是通用的,而是需要自己計(jì)算的。 計(jì)算的方式如下: 如果你的服務(wù)器性能足夠好,且寬帶資源足夠充足,PHP腳本沒有系循環(huán)或BUG的話你可以直接將 request_terminate_timeout設(shè)置成0s。0s的含義是讓PHP-CGI一直執(zhí)行下去而沒有時(shí)間限制。而如果你做不到這一點(diǎn),也就 是說你的PHP-CGI可能出現(xiàn)某個(gè)BUG,或者你的寬帶不夠充足或者其他的原因?qū)е履愕腜HP-CGI假死那么就建議你給 request_terminate_timeout賦一個(gè)值,這個(gè)值可以根據(jù)服務(wù)器的性能進(jìn)行設(shè)定。一般來說性能越好你可以設(shè)置越高,20分鐘-30分 鐘都可以。 按照官方的答案,排查了相關(guān)的可能,并結(jié)合了網(wǎng)友的答案,得出了下面的解決辦法。 1、查看php fastcgi的進(jìn)程數(shù)(max_children值) 代碼:netstat -anpo | grep “php-cgi” | wc -l 5(假如顯示5) 2、查看當(dāng)前進(jìn)程 代碼:top 3、調(diào)整/usr/local/php/etc/php-fpm.conf 的相關(guān)設(shè)置 <value name=”max_children”>10</value> 該文章在 2025/7/16 10:46:14 編輯過 |
關(guān)鍵字查詢
相關(guān)文章
正在查詢... |