
本章主要總結開發性能調優及作業調度相關的產品知識,性能調優主要是減少性能消耗和提高ETL作業時間,常見的調優就會數據傾斜調優、合并小文件、緩存中...
標簽數據開發是用戶畫像體系中最重要的一環,主要包括離線標簽開發、實時標簽開發、用戶特征庫開發、人群計算、打通數據服務層等開發內容。 一、統計類標...
用戶畫像的數據存儲的技術選型有多種,不同存儲方式適用于不同場景。主要有Hive、MySQL、HBase、Elasticsearch。 如果將用戶...
數據指標體系是建立用戶畫像的基礎,也是在進入開發前的關鍵環節,是需要結合業務場景制定的數據指標。建立用戶畫像一般從2個維度: ①用戶維度(use...
用戶畫像,即用戶信息標簽化,是大數據精細化運營和精準營銷服務的基礎。它是一種勾畫目標用戶、聯系用戶訴求與設計方向的有效工具。在大數據的時代下,用...
在剛邁入數據的大門時,我經常對一些數據指標或者數據本身的概念很模糊,尤其是當跟運營、數據分析師扯需求的時候,會被這些密密麻麻的指標給弄糊涂。為了...
說明 ▍ 子查詢:嵌套在其他查詢中的查詢; ▍ 組合查詢(復合查詢 / 并操作):執行多次查詢,多條select語句,并將結果作為單個查詢結果返...
一、聚合函數 對一組值進行計算,并返回單個值,也被稱為組函數; 聚合計算過程:選定分組字段 – 分組 – 計算:1.選定分組字段:在 selec...
一、字段處理函數 字符串處理函數:concat(field1,field2 …… )substr(str,pos,len)replace(str...