今天談談數據分析中2個重要的概念:維度和度量。
這里所說的維度和度量可能與其他人講得有所區別,但我覺得關系不大,只要是能夠給出一套合理的解釋即可。
那么什么是維度和度量呢?
先看這樣一個指標:
上海男性互聯網從業人數
如果是對數據敏感的分析師,立馬就可以看出,數據中有三個維度。
分別是:城市、性別、行業
數據中的度量就是從業人數。
一個數據指標一般由一種或多種維度加上一種度量組成。
通俗的講,維度其實可以理解成一種分類的方式,或者叫做標簽,最常見的標簽就是大家口中經常說的80后、90后、00后,這三種標簽其實就是將人進行了分類,方便對每一類人進行統計或描述。
而度量就更好理解了,比如人數,就是計算一下有多少人,將不同類型的人求和,得出一個數值。在比如,交易額,就是將所有的訂單金額加起來求和,得出總金額。
可能有讀者會問,既然指標指標就是由維度和度量組成,那么直接看指標不就好了,為什么還要分成維度和度量呢?
從最終效果來看,維度和度量有助于我們發現問題真相,,找到一些難以解釋(異常)現象的原因。
加入我們不從維度和度量下手,容易導致這些問題:第一,思考不知從何下手,容易導致亂撞。第二,指標太多,不知道看哪一個。
下面這個例子也許可以幫助我們更深入理解其作用:
公司希望App新用戶數量相比上個月再增長一倍,分析一下那些用戶群體最有增長潛力。
可以這樣著手展開分析:
網站用戶的指標有哪些?公司希望的新用戶數增長?那么有哪些度量與用戶數相關呢?比如UV,SKU,新客轉化率等,找到影響整體新用戶的度量,然后針對這些度量,拆封不同的維度,比如來自站內活動/站內流量/百度引流/知乎推廣/網頁廣告等。這是先從度量角度看,再拆分維度逐步分析。
也可以直接從用戶數出發,開始直接拆分維度,比如,用戶性別/用戶年齡/城市/職業等維度展開,發現不同維度中的奧秘。
度量也可以轉化成維度
比如訂單金額,本來可以看作是一種度量,因為訂單金額從0到10000都有可能,但為了區分或刻畫用戶的消費能力,于是就會人為的按照訂單金額大小將訂單分成幾類,比如0-30元,30-60元,30-90元等,從而將訂單按照訂單金額分成了高/中/低(甚至更多)分類,那么這些不同類型的訂單數,比如高單價訂單數就成了一個新指標,其中高客單價就是一種新的維度,是由訂單金額轉化而來的。
維度可以產生很多不同的組合
這個應該很好理解,比如上海男性就是城市維度和性別維度的組合,類似的組合千變萬化,從而形成了許許多多的指標,當然,其中很多都沒有太大意義。
那么一般的數據分析,就可以這樣理解:
結合實際業務,將自己對問題的看法轉化具體到維度和度量,將維度和度量轉化成成可視化的圖表,然后通過不同的維度和度量進行觀察,做出調整,重復上面的步驟,直到發現數據中異常的地方,找到突破口。
附上做一個項目時的體會(項目與維度和度量密切相關):
數據之旅,前路漫漫,需求郵件,浩如煙海,苦苦思索,得一良方;
知識點滴,眾人收集,打破界限,跨躍鴻溝,指標圖譜,為你導航。