數據可觀測性-架構設計

整體架構

Datavines [github] 是一個數據可觀測性系統,旨在幫助企業減少“數據宕機時間”,幫助企業能夠在數據錯誤導致損失之前及時發現數據錯誤,它具有數據目錄管理、數據質量監控和SLAs等功能。下面是它的架構設計圖:

DataVines架構圖.png

DatavinesServer 服務采用無中心化設計,支持水平無限擴容。主要負責對外提供API、調度各種數據監控任務并執行。

組件詳解

CatalogManager

主要功能

  • Api 服務
  • 數據源管理
    • 數據源的元數據管理
  • 數據質量管理
    • 數據質量檢查作業調度和執行
    • 檢查規則管理
    • 質量檢查管理
  • SLAs 管理
  • 錯誤數據管理

高可用設計

  • DatavinesServer采用無中心化設計,支持動態增容擴展。集群中所有節點都能對外提供服務,節點之間通過競爭分布式鎖獲取Job來進行調度和執行

MetaDataServer

MetaDataServer是元數據管理中心,主要負責數據目錄,元數據模型、元數據存儲、查詢等元數據相關的功能。

MetaDataCrawler

MetaDataCrawler 主要負責定時去抓取指定數據源的元數據信息,然后更新到元數據存儲引擎中

NotificationServer

NotificationServer主要負責告警,用戶在平臺上配置告警規則,一旦數據監控任務觸發告警,那么NotificationServer就會將報錯信息發送到指定的平臺上,例如郵箱,企業微信等

核心設計

插件化設計

Connector插件化設計

  • Connector模塊中定義了包括不僅限于連接參數相關、元數據信息獲取相關、數據源執行腳本相關等接口,用于實現連接數據源、獲取元數據信息以及執行相應腳本等功能。
  • 插件化設計允許用戶實現Connector模塊的相應接口來實現添加自定義數據源

Metric插件化設計

  • Metric是平臺中非常重要的組成部分,主要用在各種數據監控任務中,Metric的豐富性使得平臺的監控和檢查手段更加豐富。本平臺會內置多種Metric讓用戶可以開箱即用,同時也支持用戶實現Metric相關接口來新增用戶個性化的Metric。

Engine插件化設計

  • Engine是平臺核心組成部分,是定義數據監控任務在計算引擎中的執行邏輯,不同的Engine對應不同的執行引擎,例如Spark、Flink、Presto等。執行邏輯主要由Sources、Transformers和Sinks組成,由Source來執行數據源的連接和數據讀取,由Transformer來執行各種聚合統計處理,由Sink來執行執行結果的輸出。不同的計算引擎實現方式有所不同,但是核心的流程就是讀取數據,執行統計和輸出數據。插件化設計允許用戶自定義Engine來增加新的計算引擎。

流程設計

任務執行流程

任務執行流程

數據監控參數生成流程

參數的構造和轉換流程

未完待續。。。

加入我們

Datavines 的目標是成為更好的數據可觀測性領域的開源項目,為更多的用戶去解決元數據管理和數據質量管理中遇到的問題。在此我們真誠歡迎更多的貢獻者參與到社區建設中來,和我們一起成長,攜手共建更好的社區。

關于Datavane

Datavane是一個專注于大數據領域的開源組織(社區),由一群大數據領域優秀的開源項目作者共同創建,旨在幫助開源項目作者更好的建設項目、為大眾提供高質量的開源軟件,宗旨是:只為做一個好軟件。目前已經聚集了一批優質的開源項目,涉及到數據集成、大數據組件管理、數據質量等。

Datavane 社區中,所有的項目都是開源開放的,代碼質量和架構設計優質的潛力項目。社區保持開放中立、協作創造、堅持精品,鼓勵所有的開發者、用戶和貢獻者積極參與我們的社區、共同合作,創新創造,建設一個更加強大的開源社區。

Github: https://github.com/datavane

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 227,818評論 6 531
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,185評論 3 414
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 175,656評論 0 373
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 62,647評論 1 309
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,446評論 6 405
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 54,951評論 1 321
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,041評論 3 440
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,189評論 0 287
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 48,718評論 1 333
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,602評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 42,800評論 1 369
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,316評論 5 358
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,045評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,419評論 0 26
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,671評論 1 281
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,420評論 3 390
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 47,755評論 2 371

推薦閱讀更多精彩內容