Endle 評語:不推薦
這本書的標題非常的令人激動,看到開頭的序言更是令人熱血沸騰:清洗數據,就像廚師要保證工作區(qū)清潔一樣重要。不過,從第二章開始,期待一點點被失望取代。比如,第二章提到的編碼知識雖然重要,但是在 Dive Into Python 3 - String 中,有著更為詳細的論述。接下來列舉的實例,也有些乏味。抓取電子郵件一章中講到的技巧,我在實現 GGMM Generates Minutes Mail 的時候,對照 Python 手冊,基本都能摸索出來。不謙虛地說,我覺得不比書中實例做得差。最期待的 PDF 部分,也只是淺淺地介紹了一下 Python 里 pdfMiner 庫的使用,并且告訴你,如果沒搞定,買一個 Adobe Acrobat,然后把數據復制出來,人工使用 Excel 一類的軟件調整格式。書中范例是,從一個約150頁的文檔中摘取一個表格。如果需求是摘取每個表格呢?很遺憾,對于更有難度、也更有趣味的這部分內容,書中只字未提。
讀完了整本書,我想不到,這本書的受眾是誰。如果讀者不會編程,那會看的一頭霧水,我會推薦一本 Python 教程而不是《干凈的數據》;如果有了一定編程基礎,那用 Google, Stack Overflow 搜尋答案的效率,比閱讀本書不知道高到哪里去了。
概括一下,《干凈的數據》不是一本爛書,而是一本沒什么收益的書。把讀這本書的時間花在任何一本優(yōu)秀的編程書上,都能獲得遠高于《干凈的數據》所帶來的收益,與樂趣。
這本書很薄。如果你依舊愿意嘗試的話,可以點擊購買鏈接。