數(shù)據(jù)可視化
《數(shù)據(jù)可視化之美》
在《數(shù)據(jù)可視化之美》中,20多位可視化專家包括藝術家、設計師、評論家、科學家、分析師、統(tǒng)計學家等,展示了他們?nèi)绾卧诟髯缘膶W科領域內(nèi)開展項目。他們共同展示了可視化所能實現(xiàn)的功能以及如何使用它來改變世界。
數(shù)據(jù)可視化的書不多。市面上多以編程為主,面向新手和設計的教程寥寥無幾。 如果只是了解圖表,看Excel的書籍也管用。
分析思維
《金字塔原理》
這是咨詢中必看的一本書,是麥肯錫內(nèi)部的標準,介紹了一個思維模型。
另外麥肯錫相關的書籍還有《麥肯錫意識》《麥肯錫工具》《麥肯錫方法》等。
《精益數(shù)據(jù)分析》
精益系列的書籍,面向的是互聯(lián)網(wǎng)的方面,案例大多是歐美的。
《黑天鵝》
塔勒布的力作,講敘不確定性在我們生活中的作用。他的姊妹篇《黑天鵝的世界》也是這個主題。
《思考的技術》,大前研一的著作,也是咨詢類經(jīng)典。如果對咨詢向的分析感興趣,還可以看BCG系列,或者刷CaseBook。
《批判性思維》,則是教你如何形成理性思維。
SQL
《SQL學習指南》
這本書詳細介紹了SQL的應用,主要使用的案例是MYSQL。特別適合初學者入門而且進階。
統(tǒng)計學
這個主題看幾本教科書都是可以的,比如
《理工科概論論和數(shù)理統(tǒng)計》
介紹理論
《機器學習系統(tǒng)設計》
介紹了常見的機器學習模型,并且使用Python實現(xiàn)。
如果想看看機器學習的理論的話可以看看
《統(tǒng)計學習方法》,《統(tǒng)計學習基礎》,當然這兩本書理論性比較強。
業(yè)務
《增長黑客》
增長黑客的概念就是隨著這本書的暢銷傳播開來。增長黑客在國內(nèi)即是數(shù)據(jù)分析+運營產(chǎn)品的復合型人才。這本書好的地方在于拓展思路,告訴我們數(shù)據(jù)能夠做什么,尤其是連AB測試都不清楚的新人。
《數(shù)據(jù)挖掘與數(shù)據(jù)化運營實戰(zhàn)》
這本書涉及了數(shù)據(jù)挖掘,但是比較淺,可以作為數(shù)據(jù)分析師視野的承上啟下,了解數(shù)據(jù)化運營的高級應用。特點是以阿里的實際工作相結(jié)合,可又因為保密原則不夠詳盡。
《數(shù)據(jù)實踐之美》
這本書是由各領域?qū)<冶娀I完成,比起傳統(tǒng)的書籍,囊括范圍更廣。雖然沒有深度講解技術,但是各領域的案例都是一手資料,對業(yè)務的觸類旁通理解有幫助。
Python
《Python學習手冊》
對于擁有編程基礎的人,這本書系無巨細的有些啰嗦,不過對新人,可以避免不必要的坑,非常好的一本書。把它當作一本工具文檔吧,當遇到不理解的內(nèi)容隨時翻閱。
《利用Python進行數(shù)據(jù)分析》
pandas官方出品,pandas作者親筆寫作。雖然書有點老了,但還是可以運行,有很多Pandas函數(shù)已經(jīng)有更優(yōu)雅的寫法了,例如df.query。每段代碼都敲打一遍,千萬行的數(shù)據(jù)清洗基本不會有大問題了。
《Python cookbook》
Python的進階書,如果想要掌握更好的編程能力,這是一本經(jīng)典,值得時時翻閱。注意,它更偏向程序員。
《數(shù)學之美》
吳軍的力作,介紹了多個數(shù)學模型,用幾個簡單的公式就講清楚了。包括用于搜索引擎,自然語言處理等的應用。
《集體智慧編程》
一本比較老的書了,講了一些利用統(tǒng)計,大樣本來工作的例子。如協(xié)同過濾,pagerank算法,遺傳編程等。
大數(shù)據(jù)
《Spark快速大數(shù)據(jù)分析》
Spark的入門書,清楚了講解了Spark的編程模型,一些使用案例,是入門的好書。
《Spark高級大數(shù)據(jù)分析》
一些數(shù)據(jù)科學家的案例分析,也可以作為業(yè)務的實踐。
《Spark企業(yè)級實戰(zhàn)》
分析Spark源碼
《YARN權(quán)威指南》
新的Hadoop大數(shù)據(jù)基礎設施,介紹了YARN的架構(gòu),配置,Mapreduce的編程模型。
《Spark機器學習》
介紹了Spark中集成的機器學習類,利用案例進行講解。
推薦進階書請留言。