為什么數據分析思維重要
不知道問題發生沒
不知道問題在哪
不知道為什么
不確定分析對不對
不確定執行結果
不知道是否加薪
三種核心思維
七種分析思維技巧
在業務時間鍛煉分析能力
1.數據分析的三種核心思維:
結構化
公式化
業務化
1.1 結構化:
將分析思維結構化:
將論點歸納整理
將論點遞進和拆解
將論點完善和補充
核心論點:
尋找金字塔的塔頂,它可以是假設,是問題,是預測,是原因
結構拆解:
自上而下,將核心論點層層拆解成分論點,上下之間呈現因果或者依賴關系
MECE:
相互獨立,完全窮盡,論點之間避免交叉和重復,分論點們要盡量完善
驗證:
不論核心論點還是分論點,都應是可量化的,用數據說話,它們必然是可驗證的。
借助思維導圖 xmind
結構化不是完美的
1.2 公式化
結構化是分析的思維,但它還不夠數據,而且難免有發散的缺點,因此還需要公式化的思維
公式化
上下互為計算 左右呈現關聯
一切結構皆可量化 最小不可分割
例子:
銷售額由什么組成?銷量*單價
利潤由什么組陳?銷售額受益-成本
銷售額是單一維度嗎?不是。銷售額是多個商品/SKU的總和
地區的銷售是由什么組成?是不同線下渠道的累加
銷量還能細分嗎?不妨想想人均銷量和購買人數
不同類別的業務疊加可以用加法
減法常用來計算業務間的邏輯關系
乘法和除法是各種比例或者比率
1.3 業務化
預估共享單車投放量:
從城市流動人口計算
從人口密度計算
從城市交通數據計算
從保有自行車計算
但是單車是有損耗的,計算公式中應該考慮單車的損耗因素
在數據分析中,要考慮分析是否貼合業務:
有沒有從業務方的角度思考
針對分析出原因了嗎
能不能將分析結果落地
用結構化思考+公式化拆解,獲得了最終分析論點,但是很多時候,是現象,數據是某個結果的體現,不代表原因
那么作為數據分析師,要考慮設立哪些指標,換位,如果是參與其中的人,會怎么考慮,有哪些行為。
結構化思維--結構化數據--結構化業務數據
捋順思路--將其可視化--落地、貼合業務
2. 數據分析的七種思維技巧
三種核心思想是框架性的指引,實際應用中也應該借助思維的技巧工具,達到四兩拔千金的效果,并且,它們應該足夠簡單和有效
象限法
多維法
假設法
指數法
二八法
對比法
漏斗法
2.1 象限法
象限法:
核心:
一種策略驅動的思維
優點:
直觀、清晰、對數據進行人工的劃分,劃分結果可以直接應用于策略
應用:
適用范圍廣,戰略分析、產品分析、市場分析、客戶管理、用戶管理、商品管理等
須知:
象限劃分可以按中位數,也可以按平均數,或者經驗
2.2 多維法
用戶統計維度:性別、年齡……
用戶行為維度:注冊用戶、用戶偏好、用戶興趣、用戶流失……
消費維度:消費金額、消費頻率、消費水平……
商品維度:商品品類、商品品牌、商品屬性……
多維法:
核心:
多維法是一種精細驅動的思維
優點:
處理大量數據、維度豐富且復雜的數據具有好的效果,但是維度過多,會消耗不少時間
應用:
只要數據齊全且豐富,均可以應用
須知:
對不同維度進行交叉分析時,需要注意辛普森悖論
規避辛普森悖論:鉆取 drill down (細分維度)
2.3 假設法
很多時候,數據分析是沒有數據可以明確參考的,不如新進入一個市場,公司開拓某樣產品,需要預測一年后的銷量,或者產品的數據基礎非常糟糕,拿不到數據,這時候需要用到假設法
公司在節日進行了依次營銷活動,APP上的銷量數據整體比上周上升了20%,因為統計失誤問題,拿不到明細數據,也就是說,活動效果是一個黑盒子。現在的問題是,銷量本身就有可能因為節日提高,那么怎么證明活動是有效或者無效的呢?
假設活動是有效的:
- 思考一下,活動有效的話,會發生什么事情?
- 會有一定數量的用戶購買,如果能證明這條,那么有理由相信活動是有效的
- 用戶通過活動購買商品,會發生什么可觀測行為?假設一些用戶會評論留言,那么可以統計提及活動的字眼
- 當用戶提及了這次活動,接下來的問題是,有效了多少?10% 20%?
- 假設參與活動的用戶行為沒有變化,那么通過歷史數據的用戶評論占比,反推購買人數。
作為自營電商的數據分析師,在商品提價后,分析收入會不會有變化?
- 假設商品提價后,銷量一定會下降,問題是銷量下跌多少
- 首先假設流量不會變化,流量和渠道營銷正相關,商品價格影響轉化率,那么現在確定轉化率的波動
- 找出平時的轉化率,預估提價后轉化率的變化,假設各類型用戶對價格敏感程度不同,那么將用戶劃分為忠誠用戶、普通用戶、羊毛黨
- 不同用戶層次數量不同,反應不同,忠誠用戶轉化率變化極低,羊毛黨幾乎不會轉化,這些數據可以憑借經驗做出假設,最后匯總
假設法:
核心:
是一種啟發思考驅動的思維
優點:當沒有直觀數據或者線索能分析時,以假設先行的方式進行推斷,這是一個論證的過程
應用:
它更多是一種思考方式,假設--驗證--判斷
2.4 指數法
中國今年的經濟指標如何?
美國NBA最佳球員是誰?
競爭對手產品表現如何?
NBA比賽數據貢獻值=
(得分+籃板+主公+搶斷+封蓋)-(出手次數-命中次數)-(罰球次數-罰球命中次數)-(失誤次數/球員上場比賽的場次)
很多時候,我們有數據,但是不知道怎么用,就是因為缺乏了一個有效性的方向。這個方向可以成為目標指數,通過將數據加工成指數,達到聚焦的目的。
方法:
1.線性加權
不同指標有不同的權重 根據具體情況賦予權重
2.反比例
忠誠指數=1-1/各月消費次數 再對每月數據進行平均計算
也可對不同月份的忠誠指數設置權重
3.log
指數法:
核心:
是一種目標驅動的思維
優點:
目標驅動力強,直觀、簡潔、有效。對業務有一定的知道做東,一旦設立指數,不易頻繁變動
應用:
和假設法不同,假設法是缺乏有效的數據,指數法是無法利用數據而將其加工成可利用的數據
須知:
指數法沒有統一的標準,很多指數更依賴經驗的加工
2.5 二八法
二八法則在數據分析中的應用:
數據中,20%的變量將直接產生80%的效果,數據分析更該圍繞這20%做文章;
持續關注topN的數據是一個非常好的習慣,尤其在部分行業;
雖然指標很多,但往往某些指標更有價值,二八法則不僅能分析數據,也能管理數據
二八法:
核心:
是一種只抓重點的思維
優點:
和業務緊密相關,和KPI更緊密相關,幾乎花費最少的精力就能達到不錯的效果,性價比很優
應用:
二八法則存在于幾乎所有的領域,所以這種分析思維沒有局限
須知:
在條件允許的情況下,數據分析依舊不能放棄全局,否則會讓思路變得狹隘
2.6 對比法
好的數據指標,一定是比例或者比率
好的數據分析,一定會用到對比
老王賣水果,今天賣了1000元水果,這個數據有分析價值嗎?
老王賣水果,今天賣了1000元,昨天賣了800元,這個數據分析有價值嗎?
老王賣水果,今天賣了1000元,隔壁的老馬賣了2000元,這個數據分析有價值嗎?
老王賣水果,今天賣了1000元,昨天賣了800元,隔壁的老馬昨天賣了3000元,今天賣了2000元,這個數據分析有價值嗎?
老王花了3000元的營銷成本賣了1000元水果,這個數據分析有價值嗎?
老王其實是王健林,他有幾百億資產,他賣水果賣了1000元,這個數據分析有價值嗎?
節日大促,女生消費占比從60%變為70%,得出結論女生節日愛消費
- 這個結論是有問題的
- 占比提高了,不代表絕對值提高了。某商品平時銷售額100萬女生占60萬,節日銷售額80萬女生占56萬,女生真的消費變高了?
- 誰說節日銷售額會提高?別忘了競爭對手
- 孤數不證
競爭對手對比
類別對比
特征和屬性對比
時間同比環比
轉化對比
前后變化對比
對比法:
核心:
對比法是一種挖掘數據規律的思考方式
優點:
對比法可以發現很多數據間的規律,它可以與任何思維技巧結合,比如多維對比、象限對比、假設對比等
應用:
對比更多是一種習慣,是數據分析的牛角尖,一次合格的分析,一定要用到N次對比
須知:
在條件允許的情況下,數據分析依舊不能放棄全局,否則會讓思路變得狹隘
2.7漏斗法
核心:
漏斗法是一種流程化的思考方式
優點:
單一的漏斗分析沒有用,轉化率20%,但是能說明什么呢?它要和其他分析思維結合,比如多維,比如對比
應用:
涉及到變化和流程的都能用
須知:
單一的轉化率沒有用