1. 何為數據分析及數據分析的作用
1. 1數據分析的類別
1.1.1 描述性數據分析(初級數據分析)
- 對比分析法
- 平均分析法
- 交叉分析法等
1.1.2 探索性數據分析(高級數據分析)
- 相關分析
- 因子分析
- 回歸分析
1.1.3 驗證性數據分析(高級數據分析)
- 相關分析
- 因子分析
- 回歸分析
1.2 數據分析的作用
- 現狀分析
- 原因分析
- 預測分析
2. 數據分析六步曲
2.1 明確分析目的和思路
分析理論模型:
** 營銷方面的理論模型**
- 4P
- 用戶使用行為
- STP理論
- SWOT理論等
** 管理方面的理論模型**
- PEST
- 5W2H
- 時間管理
- 生命周期
- 邏輯樹
- SMART原則等
2.2 數據收集
數據來源:
- 數據庫
- 公開出版物
<<中國統計年鑒>> <<中國社會統計年鑒>> <<中國人口統計年鑒>> <<世界經濟年鑒>> <<世界發展報告>> - 互聯網
國家或地方統計局網站,行業組織網站,政府機構網站,傳播媒體網站,大型綜合門戶網站等 - 市場調查
2.3 數據處理
- 數據清洗
- 數據轉化
- 數據提取
- 數據計算
2.4 數據分析
- 數據分析與數據處理的關系
數據處理是數據分析的基礎,是將收集到的數據轉換為可以分析的形式,保證數據的一致性和有效性 - 數據分析與數據挖掘的關系
數據挖掘是一種高級的數據分析方法,從大量的數據中挖掘出有用的信息,側重解決四類數據分析問題:分類\聚類\關聯\預測
2.5 數據展現
- 初步加工
餅圖\柱形圖\條形圖\拆線圖\散點圖\雷達圖 - 進一步加工
金字塔圖\矩陣圖\漏斗圖\帕雷托圖
2.6 報告撰寫
- 分析報告要有一個好的分析框架,并且圖文并茂,層次明晰
- 分析報告要有明確的結論
- 分析報告要有建議或解決方案
3. 數據分析的三大誤區
- 分析目的不明確,為分析而分析
- 缺乏業務知識,分析結果偏離實際
- 一味追求使用高級分析方法,熱衷研究模型
4. 數據分析師的職業要求
- 懂業務
要懂行業知識和業務流程,有自己獨到的見解 - 懂管理
- 懂分析
要掌握數據分析的基礎原理和分析方法- 基本分析方法
對比分析法\分組分析法\交叉分析法\結構分析法\漏斗圖分析法\綜合評價分析法\因素分析法\矩陣關聯分析法等 - 高級分析方法
相關分析法\回歸分析法\聚類分析法\判別分析法\主成份分析法\因子分析法\對應分析法\時間序列等
- 基本分析方法
- 懂工具
EXCEL\Access\SPASS\SAS等 - 懂設計
圖形的選擇\版式的設計\顏色搭等
5. 數據分析常用指標及術語
- 平均數
算術平均數\調和平均數\幾何平均數等 - 絕對數與相對數
從業務角度來看,絕對數就是數量(Quantity),相對數就是質量(Quality),進行數據分析時,可能從兩個角度分析,簡稱QQ模型.例如,先分析業務是否達到一定的規模?如果規模夠大,再分析質量高不高,質量不高就可以從提高質量角度入手.收入與利潤率,用戶數與滲透率等結合分析,都是QQ模型的經典應用.- 絕對數
如:5000萬人,10000億元,300米,500家等 - 相對數
如:20%,7成,6倍,1:5,1200元/人等
-百分比與百分點 - 百分比
百分比是相對數中的一種,表示一個數是另一個數的百分之幾,也稱百分數或百分率.如8% - 百分點
百分點是指不同時期以百分數的形式表示的相對指標的變動幅度,1個百分點=1%,如今年公司利潤率是45%,比去年的28%提高了17個百分點.
- 絕對數
- 頻數與頻率
- 頻數
頻數是絕對數
,指一組數據中個別數據重復出現的次數,比如一個班有50人,男生30人,男生的頻數為30 - 頻率
頻率是相對數
,指某類別在總體中出現的頻繁程度,如上,30名男生在班上50人中出現的頻率為60%
- 頻數
- 比例與比率
比例和比率均是相對數
- 比例
比例是指在總體中各部分數值占全部數值的比重,通常反映總體的構成和結構
.比如30名男生在班上50人中所占的比例(比重)為60% - 比率
比率是指不同類別數值的對比,反映的不是部分與整體之間的關系,而是一個整體中各部分之間的關系
.比如50人的班級,男生30人,則男生與女生的比率為30:20
- 比例
- 倍數與番數
位數與番數都屬于相對數
- 倍數
倍數是一個數除以另一個數所得的商
;倍數一般表示數值的增長或上升幅度,而不適用于表示數值的減少或下降 - 番數
番數是指一個數是原來數值的2的N次方倍
對比表述示例:公司今年產品銷量番了一番(6.4=3.2*2^1),從去年的3.2萬件提高到今年的6.4萬件;此外,公司成本控制得很好,由20萬元下降了50%,今年成本 為10萬元.
- 倍數
- 同比與環比
- 同比
同比是指與歷史同期進行比較
得到的數值,反映的是事物發展的相對情況,比如今年2月與去年2月相比 - 環比
環比是指與前一個統計期進行比較
得到的數值,反映的是事物逐期發展的情況,比如今年2月與今年1月相比
- 同比
6.數據分析三字經
- 學習:
先了解,后深入;先記錄,后記憶;先理論,后實踐;先模仿,后創新 - 方法:
先思路,后方法;先框架,后細化;先方法,后工具;先思考,后動手 - 分析:
先業務,后數據;先假設,后驗證;先總體,后局部;先總結,后建議