.NET運行時中的監(jiān)測和可觀測性

今年5月份的時候研究分布式追蹤的問題知道了的攔截方式比較零散, 剛好8月份的時候看到這篇文章,這邊文章總結(jié)的比較完整。好久都沒有翻譯,趁今天有空翻譯給大家。原文地址,校驗:張蘅水

.NET是一個托管運行時,這意味著它提供了“管理”您的程序的高級功能,從簡介到公共語言運行時(CLR)(2007年編寫):

運行時具有許多功能,因此按如下方式對它們進行分類很有用:

  1. 基本功能 對其他功能設(shè)計有廣泛影響的功能。這些包括:
    1.垃圾收集
    2.記憶安全和類型安全
    3.對編程語言的高級支持。
  2. 輔助功能 - 許多有用的程序可能不需要基本特性所支持的功能:
    1.使用AppDomains進行程序隔離
    2.程序安全和沙盒
  3. 其他功能 - 所有運行時環(huán)境都需要但不利用CLR基本功能的功能。相反,它們是創(chuàng)建完整編程環(huán)境的結(jié)果。其中包括:
    1.版本
    2.Debugging/Profiling
    3.互操作

您可以看到,“Debugging/Profiling”雖然不是基本或輔助功能,但由于“ 需要創(chuàng)建完整的編程環(huán)境 ” ,它仍然會進入列表。

這篇文章的其余部分將看什么 監(jiān)測可觀測性內(nèi)省功能核心CLR提供,為什么他們是有用的,如何提供他們。**

為了便于瀏覽,帖子分為3個主要部分(最后有一些“額外閱讀材料”):

診斷(Diagnostics)

首先,我們將查看CLR提供的診斷信息,傳統(tǒng)上這些信息是通過“Windows事件跟蹤”(ETW)提供的。

CLR提供的各種事件涉及:

  • 垃圾收集(GC)
  • 即時(JIT)編譯
  • 模塊和AppDomains
  • 線程和鎖爭用
  • 以及更多

例如,這是觸發(fā)AppDomain Load事件的地方,這是Exception Thrown事件,這里是GC Allocation Tick事件

Perf View

如果你想看到來自你的.NET程序的ETW事件,我建議使用優(yōu)秀的PerfView工具,從這些PerfView教程開始,或者這個優(yōu)秀的演講PerfView:終極.NET性能工具。PerfView被廣泛認可,因為它提供了寶貴的信息,例如Microsoft工程師經(jīng)常將其用于性能調(diào)查

image.png

共同基礎(chǔ)設(shè)施

但是,如果從名稱中不清楚,ETW事件僅在Windows上可用,這并不適合新的.NET“跨平臺”世界。您可以在Linux上使用PerfView進行性能跟蹤(通過LTTng),但這只是cmd-line集合工具,稱為“PerfCollect”,分析和豐富的UI(包括flamegraphs)目前僅適用于Windows。

但是如果你想分析.NET Performance Linux,還有其他一些方法:

上面的第二個鏈接討論了在.NET Core中正在使用的新“EventPipe”基礎(chǔ)架構(gòu)(以及EventSources和EventListeners,你能發(fā)現(xiàn)一個主題!),你可以看到它在跨平臺性能監(jiān)控設(shè)計中的目標。在高層次上,它將為CLR提供一個單獨的位置來推動與診斷和性能相關(guān)的“事件”。然后,這些“事件”將被路由到一個或多個記錄器,例如,可能包括ETW,LTTng和BPF,精確記錄器由CLR運行的OS /平臺確定。.NET Cross-Plat性能和事件設(shè)計中還有更多背景信息可以解釋不同日志記錄技術(shù)的優(yōu)缺點。

“事件管道”中正在進行的所有工作都在“性能監(jiān)控”項目和相關(guān)的“EventPipe”問題中進行跟蹤。

未來的計劃

最后,還有一個性能分析控制器的(Performance Profiling Controller )未來計劃,其目標如下:

控制器負責以簡單和跨平臺的方式控制性能分析基礎(chǔ)結(jié)構(gòu)和.NET性能診斷組件生成的性能數(shù)據(jù)。

我們的想法是通過從“事件管道”中提取所有相關(guān)數(shù)據(jù),通過HTTP服務(wù)器公開以下功能

REST API

  • Pri 1:簡單分析:為運行時間配置X個時間并返回跟蹤。
  • Pri 1:高級分析:開始跟蹤(以及配置)
  • Pri 1:高級分析:停止跟蹤(對此調(diào)用的響應(yīng)將是跟蹤本身)
  • Pri 2:獲取與所有EventCounters或指定EventCounter相關(guān)的統(tǒng)計信息。

可瀏覽的HTML頁面

  • Pri 1:流程中所有托管代碼堆棧的文本表示。
  • 提供當前正在運行的用作簡單診斷報告的快照概述。
  • Pri 2:顯示EventCounters的當前狀態(tài)(可能具有歷史記錄)。
  • 提供現(xiàn)有計數(shù)器及其值的概述。
  • 開放性問題:我不相信存在必要的公共API來枚舉EventCounters。

我很高興看到“性能分析控制器(Performance Profiling Controller)”(PPC?)的位置,我認為將這種內(nèi)置到CLR中確實非常有價值,這是其他運行時的內(nèi)容

剖析(Profiling)

CLR提供的另一個強大功能是Profiling API,它(大部分)被第三方工具用于在非常低級別掛鉤到運行時。您可以在此概述中找到有關(guān)API的更多信息,但在較高級別,它允許您連接在以下情況下觸發(fā)的回調(diào):

  • GC相關(guān)事件發(fā)生
  • 拋出異常
  • 裝配/卸載裝配
  • 更多,更多
image.png

來自BOTR頁面的圖像分析API - 概述

此外還有其他非常強大的功能。首先,您可以設(shè)置每次執(zhí)行.NET方法時調(diào)用的掛鉤,無論是在運行時還是用戶代碼中。這些回調(diào)被稱為“進入/離開”鉤子,并且有一個很好的示例顯示如何使用它們,但為了使它們工作,您需要了解不同操作系統(tǒng)和CPU架構(gòu)的“調(diào)用約定”,這并不總是容易的。另外,作為警告,Profiling API是一個只能通過C / C ++代碼訪問的COM組件,你不能在C#/ F#/ VB.NET中使用它!

其次,Profiler能夠通過SetILFunctionBody()APIJIT 之前重寫任何.NET方法的IL代碼。這個API功能非常強大,構(gòu)成了許多.NET APM工具的基礎(chǔ),您可以在我之前的文章中了解更多關(guān)于如何使用它的方法。如何模擬密封類和靜態(tài)方法以及隨附的代碼

ICorProfiler API

事實證明,運行時必須執(zhí)行各種瘋狂的技巧才能使Profiling API正常工作,只需查看進入此PR的內(nèi)容允許重新連接(有關(guān)'ReJIT'的詳細信息,請參閱ReJIT:A How-To指南)。

所有Profiling API接口和回調(diào)的總體定義可在\vm\inc\corprof.idl中找到(請參閱接口說明語言)。但它分為2個邏輯部分,一個是Profiler - >'Execution Engine'(EE)接口,稱為ICorProfilerInfo

// Declaration of class that implements the ICorProfilerInfo* interfaces, which allow the
// Profiler to communicate with the EE.  This allows the Profiler DLL to get
// access to private EE data structures and other things that should never be exported
// outside of the EE.

這在以下文件中實現(xiàn):

另一個主要部分是EE - > Profiler回調(diào),它們在ICorProfilerCallback界面下組合在一起:

// This module implements wrappers around calling the profiler's 
// ICorProfilerCallaback* interfaces. When code in the EE needs to call the
// profiler, it goes through EEToProfInterfaceImpl to do so.

這些回調(diào)在以下文件中實現(xiàn):

最后,值得指出的是,Profiler API可能無法在.NET Core運行的所有操作系統(tǒng)和CPU-arch上運行,例如Linux上的ELT調(diào)用存根問題,有關(guān)詳細信息,請參閱CoreCLR Profiler API的狀態(tài)

分析和調(diào)試(Profiling v. Debugging)

除此之外,“分析”和“調(diào)試”確實有一些重疊,因此從CLR調(diào)試與CLR分析中了解.NET運行時上下文中不同的API提供什么是有幫助的。

image.png

調(diào)試(Debugging)

調(diào)試意味著不同的事情不同的人,比如我問在Twitter上“ 什么是你調(diào)試的.NET程序的途徑 ”,并得到了廣泛不同反應(yīng),雖然反應(yīng)兩組含有一個很好的工具清單和技術(shù),所以他們值得一試,謝謝#LazyWeb!

但也許這句話最好總結(jié)一下Debugging究竟是什么??

image.png

CLR提供了與調(diào)試相關(guān)的非常廣泛的功能,但為什么需要提供這些服務(wù),優(yōu)秀的帖子為什么托管調(diào)試與本機調(diào)試不同?提供了3個理由:

  1. 可以在硬件級別抽象本機調(diào)試,但需要在IL級別抽象管理調(diào)試
  2. 托管調(diào)試需要大量的信息,直到運行時才可用
  3. 托管調(diào)試器需要與垃圾收集器(GC)協(xié)調(diào)

所以給一個體面的經(jīng)驗,CLR 具有提供更高級別的調(diào)試APIICorDebug,這將在下面從“常用的調(diào)試方案”的圖像中顯示的BOTR

image.png

此外,還有很好的描述了不同部分如何在管理斷點如何工作中相互作用,雖然描述是上圖中的相反!

Here’s an overview of the pipeline of components:
1) End-user
2) Debugger (such as Visual Studio or MDbg).
3) CLR Debugging Services (which we call "The Right Side"). This is the implementation of ICorDebug (in mscordbi.dll).
---- process boundary between Debugger and Debuggee ----
4) CLR. This is mscorwks.dll. This contains the in-process portion of the debugging services (which we call "The Left Side") which communicates directly with the RS in stage #3.
5) Debuggee's code (such as end users C# program)

ICorDebug API

但是如何實現(xiàn)所有這些以及從CLR Debugging簡要介紹的不同組件是什么:

所有.Net調(diào)試支持都在我們稱之為“The Dac”的dll之上實現(xiàn)。此文件(通常命名mscordacwks.dll)是我們的公共調(diào)試API(ICorDebug)以及兩個私有調(diào)試API 的構(gòu)建塊:SOS-Dac API和IXCLR。

在一個完美的世界中,每個人都會使用ICorDebug我們的公共調(diào)試API。但是,像您這樣的工具開發(fā)人員所需的絕大多數(shù)功能都缺乏ICorDebug。這是我們正在修復(fù)的問題,但這些改進將進入CLR v.next,而不是舊版本的CLR。實際上,ICorDebugAPI僅在CLR v4中添加了對故障轉(zhuǎn)儲調(diào)試的支持。任何調(diào)試CLR v2崩潰轉(zhuǎn)儲的人根本無法使用ICorDebug

(有關(guān)其他文章,請參閱SOS和ICorDebug

ICorDebugAPI實際上是分成多個接口,也有在他們的70!我不會在這里列出所有內(nèi)容,但是我將展示它們所屬的類別,有關(guān)更多信息,請參閱ICorDebug的分區(qū),其中包含此列表,因為它更詳細。

  • 頂級(Debugging): ICorDebug + ICorDebug2是頂級接口,有效地充當ICorDebugProcess對象的集合。
  • 回調(diào)(Callbacks):通過調(diào)試器實現(xiàn)的回調(diào)對象上的方法調(diào)度托管調(diào)試事件
  • 進程(Process):這組接口表示正在運行的代碼,并包含與事件相關(guān)的API。
  • 代碼/類型檢查(Code / Type Inspection): 主要可以在靜態(tài)PE映像上運行,但實時數(shù)據(jù)有一些便??捷方法。
  • 執(zhí)行控制(Execution Control):執(zhí)行是“檢查”線程執(zhí)行的能力。實際上,這意味著放置斷點(F9)和踩踏(F11步入,F(xiàn)10步進,S + F11步出)等。ICorDebug的執(zhí)行控制僅在托管代碼中運行。
  • 線程+調(diào)用堆棧(Threads + Callstacks):調(diào)用堆棧是調(diào)試器檢查功能的支柱。以下接口與獲取callstack有關(guān)。ICorDebug僅公開調(diào)試托管代碼,因此堆棧跟蹤僅受管理。
  • 對象檢查(Object Inspection):對象檢查是API的一部分,它允許您在整個調(diào)試對象中查看變量的值。對于每個接口,我列出了“MVP”方法,我認為必須簡潔地傳達該接口的用途。

另外需要注意的是,與Profiling APIs一樣,調(diào)試API的支持級別因操作系統(tǒng)和CPU架構(gòu)而異。例如,截至2018年8月,“沒有針對Linux ARM進行托管調(diào)試和診斷的解決方案”。有關(guān)“Linux”支持的更多信息,請參閱這篇很棒的文章,在Linux上使用LLDB調(diào)試.NET Core,并從Microsoft 檢出診斷存儲庫,其目標是更容易在Linux上調(diào)試.NET程序。

最后,如果你想看看ICorDebugAPI在C#中的樣子,看一下CLRMD庫中包含包裝器,包括所有可用的回調(diào)(CLRMD將在后面的文章中進行更深入的介紹)。

SOS和DAC

“數(shù)據(jù)訪問組件(Data Access Component)”(DAC)在BOTR頁面中有詳細討論,但實際上它提供了對CLR數(shù)據(jù)結(jié)構(gòu)的“進程外”訪問,因此可以從另一個進程讀取其內(nèi)部詳細信息。這允許調(diào)試器(via ICorDebug)或'Son of Strike'(SOS)擴展進入CLR的運行實例或內(nèi)存轉(zhuǎn)儲,并找到如下內(nèi)容:

  • 所有正在運行的線程
  • 托管堆上有哪些對象
  • 有關(guān)方法的完整信息,包括機器代碼
  • 當前的'堆棧跟蹤'

除此之外,如果您想要解釋所有奇怪的名稱和一點'.NET歷史課',請參閱此Stack Overflow答案

SOS命令的完整列表非常令人印象深刻,并且在WinDBG旁邊使用它可以讓您非常低級地了解程序和CLR中發(fā)生的情況。要了解它是如何實現(xiàn)的,讓我們看一下這個!HeapStat命令,該命令可以為您提供.NET GC正在使用的不同堆大小的摘要:

image.png

(來自SOS的圖片:即將發(fā)布的版本有一些新命令 - HeapStat

這是代碼流,顯示了SOS和DAC如何協(xié)同工作:

  • SOS完整!HeapStat命令(鏈接
  • SOS!HeapStat處理'Workstation GC' 的命令中的代碼(鏈接
  • SOS GCHeapUsageStats(..)功能,重負荷(鏈接
  • 共享DacpGcHeapDetails包含指向GC堆中主數(shù)據(jù)的指針的數(shù)據(jù)結(jié)構(gòu),例如段,卡表和各代(鏈接
  • GetGCHeapStaticData填充DacpGcHeapDetails結(jié)構(gòu)的DAC函數(shù)(鏈接
  • 共享DacpHeapSegmentData包含GC堆的單個“段”的詳細信息的數(shù)據(jù)結(jié)構(gòu)(鏈接
  • GetHeapSegmentData(..)填充DacpHeapSegmentData結(jié)構(gòu)的DAC鏈接

第三方'調(diào)試器'(3rd Party ‘Debuggers’)

由于Microsoft發(fā)布了調(diào)試API,它允許第三方使用ICorDebug接口,這里列出了我遇到的一些內(nèi)容:

記憶轉(zhuǎn)儲(Memory Dumps)

我們要看的最后一個區(qū)域是“內(nèi)存轉(zhuǎn)儲”,可以從實時系統(tǒng)中捕獲并離線分析。.NET運行時一直很好地支持在Windows上創(chuàng)建“內(nèi)存轉(zhuǎn)儲”,現(xiàn)在.NET Core是“跨平臺”,也可以在其他操作系統(tǒng)上使用相同的工具。

“內(nèi)存轉(zhuǎn)儲”的一個問題是,獲取SOS和DAC文件的正確匹配版本可能會非常棘手。幸運的是,Microsoft剛剛發(fā)布了以下dotnet symbolCLI工具

可以下載任何給定核心轉(zhuǎn)儲,minidump或任何支持平臺的文件格式(如ELF,MachO,Windows DLL,PDB和便攜式PDB)的調(diào)試所需的所有文件(給出coreclr模塊的符號,模塊,SOS和DAC)。

最后,如果你花費任何時間分析'內(nèi)存轉(zhuǎn)儲',你真的應(yīng)該看看微軟幾年前發(fā)布的優(yōu)秀的CLR MD庫。我之前已經(jīng)寫過你可以用它做什么,但簡而言之,它允許你通過一個直觀的C#API與內(nèi)存轉(zhuǎn)儲交互,其中的類可以訪問ClrHeapGC RootsCLR ThreadsStack Frames更多。實際上,除了實現(xiàn)工作所需的時間之外,CLR MD還可以實現(xiàn)大多數(shù)(如果不是全部)SOS命令

但是從宣布帖子來看它是如何運作

ClrMD托管庫是CLR僅內(nèi)部調(diào)試API的包裝器。雖然這些僅內(nèi)部API對于診斷非常有用,但我們不支持它們作為公開的,有文檔的版本,因為它們非常難以使用并且與CLR的其他實現(xiàn)細節(jié)緊密耦合。ClrMD通過圍繞這些低級調(diào)試API提供易于使用的托管包裝來解決此問題。

通過在官方支持的庫中提供這些API,Microsoft使開發(fā)人員能夠在CLRMD之上構(gòu)建各種工具,這是一個很好的結(jié)果!


總而言之,.NET Runtime提供了廣泛的診斷,調(diào)試和分析功能,可以深入了解CLR內(nèi)部的情況。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 228,363評論 6 532
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 98,497評論 3 416
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 176,305評論 0 374
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經(jīng)常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 62,962評論 1 311
  • 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,727評論 6 410
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 55,193評論 1 324
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,257評論 3 441
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 42,411評論 0 288
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 48,945評論 1 335
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 40,777評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 42,978評論 1 369
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,519評論 5 359
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 44,216評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,642評論 0 26
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,878評論 1 286
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,657評論 3 391
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 47,960評論 2 373

推薦閱讀更多精彩內(nèi)容

  • 眾所周知,性能問題是所有實用應(yīng)用在迭代過程中必然要面對的問題。對于此類問題,簡單地投入更多硬件資源的做法可能會取得...
    OneAPM閱讀 659評論 0 3
  • [TOC] 內(nèi)存管理 一、托管堆基礎(chǔ) 在面向?qū)ο笾校總€類型代表一種可使用的資源,要使用該資源,必須為代表資源的類...
    _秦同學_閱讀 3,846評論 0 3
  • 1、通過CocoaPods安裝項目名稱項目信息 AFNetworking網(wǎng)絡(luò)請求組件 FMDB本地數(shù)據(jù)庫組件 SD...
    陽明先生_X自主閱讀 16,000評論 3 119
  • Spring Cloud為開發(fā)人員提供了快速構(gòu)建分布式系統(tǒng)中一些常見模式的工具(例如配置管理,服務(wù)發(fā)現(xiàn),斷路器,智...
    卡卡羅2017閱讀 134,782評論 18 139
  • (本想寫畢業(yè)季的一些東西,到最后,也不知道寫成了什么,標題本來是“畢業(yè)季”,寫到最后有感覺不合適,先叫“畢業(yè)季”吧...
    腦抽者的獨白閱讀 301評論 0 0