書名:誰說菜鳥不會數據分析(入門篇)
作者:劉夏璐,狄松
本書主要還是進行數據分析入門相關知識的分享,主要軟件為Excel。里面整理一些自己覺得重要的知識點提醒,需要的可以找下原書詳細看。因為內容還是比較多的,于是分幾篇完成整理吧。
一、數據分析基礎
數據分析的目的是把復雜數據背后的信息集中與提煉。分為:
描述性數據分析
探索性數據分析
驗證性數據分析
數據分析作用:
現狀分析
原因分析
預測分析
數據分析過程六個階段:
明確分析目的和思路
數據收集
數據處理
數據分析
數據展現
報告撰寫
數據來源:
數據庫
公開出版物(統計年鑒或報告)
互聯網
市場調查
常用指標和術語:
平均數:數據平均值
絕對數:反映客觀現象總體在一定時間、地點條件下的總規模、總水平的綜合性指標,也可表現為一定時間、地點條件下數量增減變化的絕對數。
相對數:兩個有聯系的指標對比計算而得到的數值,用以反映客觀現象之間數量聯系程度,基本公式:相對數=比較數值(比數)/基礎數值(基數)
百分比:相對數的一種,一個數是另一個數的百分之幾。
百分點:不同時期以百分數的形式表示的相對指標的變動幅度,即不應該說提高了17%而應該說提高了17個百分點。
頻數:一組數據中個別數據重復出現的次數。
頻率;每組類別次數與總次數的比值。
比例:屬于相對數,在總體中各部分的數值占全部數值的比重。
比率:屬于相對數,不同類別數值的對比。
同比:與歷史同時期進行比較得到的數值。
環比:與前一個統計期進行比較得到的數值。
二、確定分析思路
數據分析方法論:從宏觀角度指導如何進行數據分析。
數據分析法:具體的分析方法。
常用數據分析方法論:
1、PEST分析法
Political Economic Technological Social
2、5W2H分析法
Why What Who When Where How How much
3、邏輯樹分析法
已知問題作為樹干,相關問題作為樹枝,將問題的所有子問題分層羅列。
遵循以下三個原則:
要素化:把相同問題總結歸納成要素。
框架化:將各個要素組織成框架,遵守不重不漏的原則。
關聯化:框架內的各要素保持必要的相互關系,簡單而不孤立。
4、4P營銷理論
Product Price Place(渠道)Promotion(促銷)
5、用戶行為理論
認知、熟悉、試用、使用、忠誠
以網站分析為例:
認知——網站訪問——IP、PV、人均頁面訪問量、訪問來源
熟悉——網站瀏覽——平均停留時長、跳出率、頁面偏好
熟悉——站內搜索——搜索訪問次數占比
試用——用戶注冊——注冊用戶數、注冊轉化率
使用——用戶登錄——登錄用戶數、人均登錄、訪問登錄比
使用——用戶訂購——訂購量、訂購頻次、內容、轉化率
忠誠——用戶黏性——回訪者比率、訪問深度
忠誠——用戶流失——用戶流失數、流失率
三、數據準備
字段是事物或現象的某種特征,統計學中稱為變量。
記錄是事物或現象某種特征的具體表現,稱為數據或變量值。
四、數據處理
數據清洗,將多余的數據篩選清除,將缺失的數據補充完整,將錯誤的數據糾正或刪除。
數據加工,對數據字段進行信息提取、計算、分組、轉換等加工。
COUNTIF函數
Ctrl+Enter 在不連續的區域中同時輸入同一個數據或公式
Ctrl+F 查找
Ctrl+H 替換
Ctrl+G 定位
以上內容為個人理解整理學習用,請在引用時標明原作者。
如果覺得我的努力還可以,客官點個贊可好?
如果有理解錯誤,請評論指點我修改。你的支持也是我的學習動力。謝謝!