得物供應(yīng)鏈復(fù)雜業(yè)務(wù)實(shí)時(shí)數(shù)倉(cāng)建設(shè)之路

1 背景

得物供應(yīng)鏈業(yè)務(wù)是紛繁復(fù)雜的，我們既有 JIT 的現(xiàn)貨模式中間夾著這大量的倉(cāng)庫(kù)作業(yè)環(huán)節(jié)，又有到倉(cāng)的寄售，品牌業(yè)務(wù)，有非常復(fù)雜的逆向鏈路。在這么復(fù)雜的業(yè)務(wù)背后，我們需要精細(xì)化關(guān)注人貨場(chǎng)車的效率和成本，每一單的及時(shí)履約情況，要做到這一點(diǎn)我們需要各粒度和維度的數(shù)據(jù)來支撐我們的精細(xì)化管理。

1.1 業(yè)務(wù)早期

業(yè)務(wù)早期，業(yè)務(wù)反饋我們后臺(tái)管理系統(tǒng)某些報(bào)表查詢慢。查詢代碼可知，如下圖：

這種現(xiàn)象一般表現(xiàn)為：

大表 JOIN,rdbms 不擅長(zhǎng)做數(shù)據(jù)聚合,查詢響應(yīng)慢,調(diào)優(yōu)困難；
多表關(guān)聯(lián),索引優(yōu)化,子查詢優(yōu)化,加劇了復(fù)雜度,大量索引,讀庫(kù)磁盤空間膨脹過快；
數(shù)據(jù)量大,多維分析困難,跨域取數(shù),自助拉到實(shí)時(shí)數(shù)據(jù)困難等。

一方面原因是系統(tǒng)設(shè)計(jì)之初,我們主要關(guān)注業(yè)務(wù)流程功能設(shè)計(jì),事務(wù)型業(yè)務(wù)流程數(shù)據(jù)建模,對(duì)于未來核心指標(biāo)的落地,特別是關(guān)鍵實(shí)時(shí)指標(biāo)落地在業(yè)務(wù)快速增長(zhǎng)的情況下如何做到非常好的支撐。mysql 在此方面越來越捉襟見肘。

另外一方面原因是 mysql 這種 oltp 數(shù)據(jù)庫(kù)是無法滿足實(shí)時(shí)數(shù)據(jù)分析需求的,我們需要探索一套實(shí)時(shí)數(shù)據(jù)架構(gòu),拉通我們的履約,倉(cāng)儲(chǔ),運(yùn)配等各域的數(shù)據(jù),做有效串聯(lián),因此我們開始了我們的實(shí)時(shí)數(shù)據(jù)架構(gòu)探索，下圖是我們一些思考。

附:數(shù)據(jù)視角的架構(gòu)設(shè)計(jì)也是系統(tǒng)架構(gòu)設(shè)計(jì)的重要組成部分。

2 架構(gòu)演變

2.1 原始階段

2.1.1 通過 Adb(AnalyticDB for MySQL)完成實(shí)時(shí) join

通過阿里云 DTS 同步直接將業(yè)務(wù)庫(kù)單表實(shí)時(shí)同步到 Adb，通過 Adb 強(qiáng)大的 join 能力和完全兼容 mysql 語(yǔ)法,可以執(zhí)行任意 sql，對(duì)于單表大數(shù)據(jù)量場(chǎng)景或者單表和一些簡(jiǎn)單維表的 join 場(chǎng)景表現(xiàn)還是不錯(cuò)的,但是在業(yè)務(wù)復(fù)雜,復(fù)雜的 sql rt 很難滿足要求,即使 rt 滿足要求,單個(gè) sql 所消耗的內(nèi)存,cpu 也不盡人意,能支撐的并發(fā)量很有限。

2.1.2 通過 Otter 完成大寬表的建設(shè)

基于 Canal 開源產(chǎn)品，獲取數(shù)據(jù)庫(kù)增量日志數(shù)據(jù)并下發(fā)，下游消費(fèi)增量數(shù)據(jù)直接生成大寬表，但是寬表還是寫入 mysql 數(shù)據(jù)庫(kù)，實(shí)現(xiàn)單表查詢，單表查詢速度顯著提升，無 olap 數(shù)據(jù)庫(kù)的常見做法，通過寬表減少 join 帶來的性能消耗。

但是存在以下幾個(gè)問題：

雖然 otter 有不錯(cuò)的封裝,通過數(shù)據(jù)路由能做一些簡(jiǎn)單的數(shù)據(jù)拼接,但在調(diào)試上線復(fù)雜度上依然有不小的復(fù)雜度；
otter 偽裝 mysql 從庫(kù)同時(shí)要去做 etl 邏輯,把 cdc 干的活和實(shí)時(shí) ETL 的活同時(shí)干了,耦合度較高。

2.2 實(shí)時(shí)架構(gòu) 1.0

2.2.1 flink+kafka+ClickHouse

在上述調(diào)研嘗試后都沒有解決根本的問題，我們開始把目標(biāo)建立標(biāo)準(zhǔn)的實(shí)時(shí)數(shù)倉(cāng)的思路上來，在 20 年 olap 沒有太多的可選項(xiàng),我們把目標(biāo)放在 clickhouse 上。

為了保證順序 append 每次寫入都會(huì)生成一個(gè) part 文件，滿足一定條件后臺(tái)定時(shí)合并。
非常弱的 update delete，不能保證原子性和實(shí)時(shí)性。* clickhouse 只適合數(shù)據(jù)量大，業(yè)務(wù)模型簡(jiǎn)單,更新場(chǎng)景少的場(chǎng)景。
存算不分離，復(fù)雜查詢影響 clickhouse 寫入。

因?yàn)?clickhouse 的這些特性,尤其是不支持 upsert 的情況下,我們通常需要提前把大寬表的數(shù)據(jù)提前在 flink 聚合好,并且供應(yīng)鏈數(shù)據(jù)生命周期長(zhǎng),作業(yè)流程也長(zhǎng)如：

貨物的生命周期較短時(shí)長(zhǎng)為一周，長(zhǎng)周期時(shí)長(zhǎng)超過 1 個(gè)月；
庫(kù)內(nèi)環(huán)節(jié)異常的多，從賣家發(fā)貨到收貨、分揀、質(zhì)檢、拍照、鑒別、防偽、復(fù)查、打包、出庫(kù)、買家簽收等十幾個(gè)甚至更多的環(huán)節(jié)，一張以商品實(shí)物 id 為主鍵的大寬表，需要 join 幾十張業(yè)務(wù)表 ；
供應(yīng)鏈系統(tǒng)早期設(shè)計(jì)沒有每張表都會(huì)冗余唯一單號(hào)（入庫(kù)單，作業(yè)單，履約單）這樣的關(guān)鍵字段，導(dǎo)致沒辦法直接簡(jiǎn)單的 join 數(shù)據(jù)。
在這樣一個(gè)架構(gòu)下，們的 flink 在成本上，在穩(wěn)定性維護(hù)上，調(diào)優(yōu)上做的非常吃力。

附:clickhouse 不支持標(biāo)準(zhǔn)的 upsert 模式，可以通過使用 AggregatingMergeTree 引擎字段類型使用 SimpleAggregateFunction(anyLast, Nullable(UInt64)) 合并規(guī)則取最后一條非 null 數(shù)據(jù)可以實(shí)現(xiàn) upsert 相似的功能，但讀時(shí)合并性能有影響。

2.3 實(shí)時(shí)架構(gòu) 2.0

2.3.1 flink+kafka+hologres

因此我們迫切的希望有支持 upsert 能力的 olap 數(shù)據(jù)庫(kù),同時(shí)能搞定供應(yīng)鏈寫多少的場(chǎng)景,也能搞定我們復(fù)雜查詢的場(chǎng)景,我們希望的 olap 數(shù)據(jù)至少能做到如下幾點(diǎn)：

有 upsert 能力，能對(duì) flink 大任務(wù)做有效拆分；
存算分離，復(fù)雜業(yè)務(wù)計(jì)算，不影響業(yè)務(wù)寫入，同時(shí)能平滑擴(kuò)縮容；
有一定的 join 能力帶來一些靈活度；
有完善的分區(qū)機(jī)制，熱數(shù)據(jù)查詢性能不受整體數(shù)據(jù)增長(zhǎng)影響；
完善的數(shù)據(jù)備份機(jī)制。

這樣一個(gè)行列混合的 olap 數(shù)據(jù)庫(kù),支持 upsert,支持存算分離,還是比較符合我們的預(yù)期。

目前這樣一套架構(gòu)支持了供應(yīng)鏈每天數(shù)千人的報(bào)表取數(shù)需求,以及每天 10 億數(shù)據(jù)量的導(dǎo)出,訪問量在得物所有 to B 系統(tǒng)中排名靠前。

2.3.2 我們遇到的一些問題

多時(shí)間問題如何設(shè)置 segment_key,選擇哪個(gè)業(yè)務(wù)字段作為 segment_key 供應(yīng)鏈幾十個(gè)環(huán)節(jié)都有操作時(shí)間,在不帶 segment_key 的情況下性能如何保障，困擾了我們一段時(shí)間。

設(shè)置合理的 segment_key 如有序的時(shí)間字段,可以做到完全順序?qū)憽Ｃ總€(gè) segment 文件都有個(gè) min,max 值,所有的時(shí)間字段過來只需要去比較下在不在這個(gè)最小值最大值之間(這個(gè)動(dòng)作開銷很低),不在范圍內(nèi)直接跳過，在不帶 segment_key 查詢的條件下,也能極大的降低所需要過濾的文件數(shù)量。

批流融合背景：業(yè)務(wù)快速發(fā)展過程中，持續(xù)迭代實(shí)時(shí)任務(wù)成為常態(tài)。供應(yīng)鏈業(yè)務(wù)復(fù)雜，環(huán)節(jié)多，流程往往長(zhǎng)達(dá)一個(gè)月周期之久，這就導(dǎo)致 state ttl 設(shè)置周期長(zhǎng)。job 的 operator 變化（sql 修改），checkpoint 無法自動(dòng)恢復(fù)，savepoint 恢復(fù)機(jī)制無法滿足，比如增加 group by 和 join。重新消費(fèi)歷史數(shù)據(jù)依賴上游 kafka 存儲(chǔ)時(shí)效，kafka 在公司平臺(tái)一般默認(rèn)都是存儲(chǔ) 7 天，不能滿足一個(gè)月數(shù)據(jù)回刷需求場(chǎng)景。

方案：通過批流融合在 source 端實(shí)現(xiàn)離線 + 實(shí)時(shí)數(shù)據(jù)進(jìn)行數(shù)據(jù)讀取、補(bǔ)齊。

（1）離線按 key 去重，每個(gè) key 只保留一條，減少消息量下發(fā)。（2）離線和實(shí)時(shí)數(shù)據(jù)合并，使用 last_value 取相同主鍵最新事件時(shí)間戳的一條數(shù)據(jù)。（3）使用 union all + group by 方式是可作為代替 join 的一個(gè)選擇。（4）實(shí)時(shí)數(shù)據(jù)取當(dāng)日數(shù)據(jù)，離線數(shù)據(jù)取歷史數(shù)據(jù)，防止數(shù)據(jù)漂移，實(shí)時(shí)數(shù)據(jù)需前置一小時(shí)。

Join 算子亂序

問題分析

由于 join 算子是對(duì) join 鍵做 hash 后走不同的分片處理數(shù)據(jù) ，開啟了 2 個(gè)并發(fā)后，再因?yàn)?header_id 字段的值變化，detail 表 2 次數(shù)據(jù)流走到了 2 個(gè)不同的 taskmanage,而不同的線程是無法保證輸出有序性的 ，所以數(shù)據(jù)有一定的概率會(huì)亂序輸出，導(dǎo)致期望的結(jié)果不正確，現(xiàn)象是數(shù)據(jù)丟失。

解決辦法

通過 header inner join detail 表后，拿到 detail_id，這樣再次通過 detail_id join 就不會(huì)出現(xiàn)（join 鍵）的值會(huì)從 null 變成非 null 的情況發(fā)生了，也就不會(huì)亂序了。

insert into sinkSelect detail.id,detail.header_id,header.idfrom detailleft join (    Select detail.id AS detail_id,detail.header_id,header.id    from header     inner join detail    on detail.header_id  =  header.id ) headerNewon detail.id  =  headerNew.detail_id

2.3.3 Hologres or starrocks

這里也聊聊大家比較關(guān)注的 hologres 和 starrocks,starrocks 從開源開始也和我們保持了密切聯(lián)系,也做了多次的深入交流,我們也大致列了兩者之間的一些各自優(yōu)勢(shì)和對(duì)于我們看來一些不足的地方。

3 其他做的一些事情

3.1 開發(fā)提效工具——flink 代碼生成器

參考 MyBatis gennerator 一些思想，利用模板引擎技術(shù)，定制化模板來生成 flink sql。可以解決代碼規(guī)范，和提升開發(fā)效率。基本可以通過代碼配置來生成 flink sql。

3.2 開發(fā)提效工具——可視化平臺(tái)

直接通過配置的方式,在線寫 sql,直接生成頁(yè)面和接口,一鍵發(fā)布,同時(shí)引入緩存,鎖排隊(duì)機(jī)制解決高峰訪問性能問題。

動(dòng)態(tài)配置接口，一鍵生成 rpc 服務(wù):

動(dòng)態(tài)配置報(bào)表:

4 未來規(guī)劃

當(dāng)前架構(gòu)依然存在某種程度的不可能三角，我們需要探索更多的架構(gòu)可能性：

（1）利用寫在 holo,計(jì)算在 mc 避免 holo 這種內(nèi)存數(shù)據(jù)庫(kù)，在極端查詢內(nèi)存被打爆的問題，利用 mc 的計(jì)算能力可以搞定一些事實(shí)表 join 的問題提升一些靈活度。

（2）借助 apache hudi 推進(jìn)湖倉(cāng)一體，hudi 做批流存儲(chǔ)統(tǒng)一，flink 做批流計(jì)算統(tǒng)一，一套代碼，提供 5-10 分鐘級(jí)的準(zhǔn)實(shí)時(shí)架構(gòu)，緩解部分場(chǎng)景只需要準(zhǔn)時(shí)降低實(shí)時(shí)計(jì)算成本。

最后編輯于：2023.03.10 01:57:24

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個(gè)濱河市，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌，老刑警劉巖，帶你破解...
沈念sama閱讀 227,663評(píng)論 6贊 531
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場(chǎng)離奇詭異，居然都是意外死亡，警方通過查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 98,125評(píng)論 3贊 414
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人，你說我怎么就攤上這事。” “怎么了？”我有些...
開封第一講書人閱讀 175,506評(píng)論 0贊 373
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長(zhǎng)。經(jīng)常有香客問我，道長(zhǎng)，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 62,614評(píng)論 1贊 307
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘。我一直安慰自己，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 71,402評(píng)論 6贊 404
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著，像睡著了一般。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 54,934評(píng)論 1贊 321
城市分裂傳說
那天，我揣著相機(jī)與錄音，去河邊找鬼。笑死，一個(gè)胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播，決...
沈念sama閱讀 43,021評(píng)論 3贊 440
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長(zhǎng)吁一口氣：“原來是場(chǎng)噩夢(mèng)啊……” “哼！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 42,168評(píng)論 0贊 287
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤，失蹤者是張志新（化名）和其女友劉穎，沒想到半個(gè)月后，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 48,690評(píng)論 1贊 333
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 40,596評(píng)論 3贊 354
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點(diǎn)故事閱讀 42,784評(píng)論 1贊 369
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情，我是刑警寧澤，帶...
沈念sama閱讀 38,288評(píng)論 5贊 357
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站，受9級(jí)特大地震影響，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 44,027評(píng)論 3贊 347
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧，春花似錦、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 34,404評(píng)論 0贊 25
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)。三九已至，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 35,662評(píng)論 1贊 280
情欲美人皮
我被黑心中介騙來泰國(guó)打工，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人。一個(gè)月前我還...
沈念sama閱讀 51,398評(píng)論 3贊 390
代替公主和親
正文我出身青樓，卻偏偏與公主長(zhǎng)得像，于是被迫代替她去往敵國(guó)和親。傳聞我的和親對(duì)象是個(gè)殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 47,743評(píng)論 2贊 370

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频

得物供應(yīng)鏈復(fù)雜業(yè)務(wù)實(shí)時(shí)數(shù)倉(cāng)建設(shè)之路

得物供應(yīng)鏈復(fù)雜業(yè)務(wù)實(shí)時(shí)數(shù)倉(cāng)建設(shè)之路

1 背景

1.1 業(yè)務(wù)早期

2 架構(gòu)演變

2.1 原始階段