C#.NET dump解析入門-用VS解析dump文件進(jìn)行排障
當(dāng)前位置:點(diǎn)晴教程→知識(shí)管理交流
→『 技術(shù)文檔交流 』
突然有一天部署在服務(wù)器的一個(gè)應(yīng)用掛掉了,沒辦法只能進(jìn)入服務(wù)器打開
【事件查看器】查看下,好不容易找到了打開后一臉懵逼
事件查看器查到的內(nèi)容根本對(duì)我們排障沒有任何作用。 在這個(gè)時(shí)候如果有對(duì)應(yīng)的dump文件就能派上用場(chǎng)了, 只要有dump文件就能查到應(yīng)用掛掉那刻的一手情報(bào),可能有人認(rèn)為分析dump文件是非常難的事情, 但是最近不斷有新的dump分析工具出來(lái),例如用vs2017就能夠很簡(jiǎn)單的分析dump文件。 接下來(lái)我們用幾個(gè)實(shí)際的例子來(lái)看看如何用vs2017來(lái)分析dump文件吧
dump文件的收集 應(yīng)用掛是一瞬間的事情,掛了之后就沒辦法生成dump文件了。所以首先要設(shè)置一下自動(dòng)生成dump文件。 打開注冊(cè)表HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows\Windows Error Reporting
在Windows Error Reporting下新建一個(gè) LocalDumps文件夾 然后在這項(xiàng)里面新增 DumpCount DumpFolder DumpType 這三項(xiàng)
演示stackoverflow錯(cuò)誤導(dǎo)致的crash 我們有創(chuàng)建一個(gè)簡(jiǎn)單的console程序 class Program { static void HogeHoge(string s) { HogeHoge(s); } static void Main(string[] args) { HogeHoge("hoge-"); } }
編譯成exe 后運(yùn)行 毫無(wú)疑問會(huì)出現(xiàn)如下錯(cuò)誤
查看下dump文件果然生成了
那我們分析下這個(gè)dump文件,用VS2017打開它,會(huì)出現(xiàn)它的概要信息
你會(huì)發(fā)現(xiàn)異常信息處寫了 【該線程已用完其堆棧】就可以很明顯看出來(lái)是stackoverflow。 而且看右側(cè)【操作】處 有[使用 僅限托管 進(jìn)行調(diào)試] 和 [使用 混合 進(jìn)行調(diào)試] 和 [使用 僅限本機(jī) 進(jìn)行調(diào)試] 這里牽扯出3個(gè)名詞 托管 ======> 適用于在公共語(yǔ)言運(yùn)行時(shí)下運(yùn)行的代碼 所謂托管是指內(nèi)存管理由系統(tǒng)而不是由程序員管理 大家都知道c#有關(guān)內(nèi)存都是CLR來(lái)管理的 混合 ======>對(duì)托管代碼和非托管代碼都調(diào)用調(diào)試器 本機(jī) ======>適用于非托管代碼 如果你的代碼里面沒有調(diào)用非托管代碼的話 點(diǎn)擊 前面2個(gè)按鈕都可以的
點(diǎn)擊后會(huì)直接進(jìn)入
這樣錯(cuò)誤源碼級(jí)別看的非常清楚了。因?yàn)槭俏覀儽緳C(jī)創(chuàng)建的工程 pdb 和 源碼都有。所以才能直接定位到。但是實(shí)際上crash都是發(fā)生在服務(wù)器上,把服務(wù)器上的dump文件打開的話還會(huì)是這樣嗎 下面我們來(lái)做一個(gè)模擬 用Relase編譯 然后把 Program.cs文件也給刪除掉。然后重新執(zhí)行crash生成dump文件 然后用同樣的步驟vs打開點(diǎn)擊調(diào)試就會(huì)提示找不到 Program.cs
這樣一來(lái)可供我們排障的情報(bào)就少了很多。在這種情況下 我們可以利用vs 提供的幾個(gè)窗口來(lái)觀察 分別是以下三個(gè)
第一個(gè)窗口:線程窗口
實(shí)際的程序往往有很多線程在運(yùn)行,每個(gè)線程的切換等重要信息可以在這個(gè)窗口進(jìn)行觀察。
第二個(gè)窗口:調(diào)用堆棧窗口
調(diào)用堆棧窗口是和線程窗口聯(lián)動(dòng)的。
第三個(gè)窗口也是最重要的窗口:并行堆棧
如圖所示,每個(gè)線程和它的堆棧內(nèi)容展示的很清楚。只不過(guò)本例子是比較簡(jiǎn)單的,即使不看這個(gè)看前2個(gè)窗口就能知道原因了。 但是實(shí)際的應(yīng)用若超過(guò)運(yùn)行上百個(gè)線程的話,將這些線程用圖形可視化出來(lái)對(duì)于我們排查復(fù)雜問題是非常有用的!
CPU100和死鎖導(dǎo)致的crash解析 由于系統(tǒng)可以配置crash自動(dòng)生成dump文件。但是有些情況比如部署在iis上web服務(wù)cpu飆到100%下不來(lái)導(dǎo)致為web停止服務(wù)。這個(gè)時(shí)候就需要我們手動(dòng)提取dump文件了。 下面我們來(lái)模擬一下這種場(chǎng)景: 新建一個(gè)asp.net mvc程序 public class HomeController : Controller { async Task<string> GetAsync() { var str = await new HttpClient().GetStringAsync("http://www.baidu.com/"); return str; } public ActionResult Index() { var s = GetAsync().Result; return View(); } }
以上代碼 async/await會(huì)造成死鎖 我們用iis來(lái)啟動(dòng)這個(gè)web應(yīng)用后頁(yè)面圈圈一直在轉(zhuǎn)網(wǎng)頁(yè)空白一片 打開Windows任務(wù)管理器找到w3wp
用vs打開這個(gè)dump文件 點(diǎn)擊調(diào)試后后 打開并行堆棧這個(gè)窗口
大家看會(huì)有很多分支,該從哪個(gè)開始分析呢,教大家一個(gè)小技巧,不知道如何下手的時(shí)候就選分支越長(zhǎng)的!
從HomeController.Index進(jìn)來(lái),停止在ManualResetEventSlim.Wait 死鎖原因:
該文章在 2024/11/19 9:13:02 編輯過(guò) |
關(guān)鍵字查詢
相關(guān)文章
正在查詢... |