《文科生數據科學上手指南》分享

據說技術門檻在降低。作為文科生的你,該如何從這種趨勢中收獲更多?

苦惱

你大概經常聽別人提起,技術的門檻在降低。

數據科學、機器學習、自然語言處理、神經網絡、人工智能……一系列的名詞讓你眼花繚亂,讓你對這個時代充滿興奮的感覺。你躍躍欲試,希望自己動手,也能用新技術做出卓有成效的工作。

但是,如果你不是IT專業的學生,特別糟糕的是,你還是一名文科生,那你可能會逐漸發現,技術的世界似乎不那么友好。

你只想對文本提取主題,人家給你寫了這么長的公式:

你想做個時間序列的預測,結果人家告訴你,一個處理單元,就有這樣的結構:

除了迅速“從入門到放棄”,你還能怎么辦?

應用

別急,這不是真相。

真相是,只要你知道如何找到正確的工具包,就可以用短短幾行代碼,完成從前需要手工干幾天的活兒。不信?可以看看我這篇《如何用4行 R 語句,快速探索你的數據集?

寫代碼,如今已經變成了和開車一樣的基礎技能。開輛自動擋的汽車,不難掌握對吧?

你即便已經安全行駛幾十萬公里,成為名副其實的老司機,也不必理解發動機(或者電動機)的構造,對不?

需要維護保養,那是自然,但是這些工作,我們都可以交給專業人士代勞。

你需要了解的,無非是轉向、剎車、油門、信號燈……

技術門檻的降低,就應該體現在處理數據問題的時候,你會像開車一樣自然。而不應當像學習發動機構造一樣挑戰自我。

受眾

在機械師的眼中,發動機的構造非常簡單易懂。所以他們中大部分人寫發動機構造教程的時候,不會去考慮那些對物理一無所知者的感受。

同樣,那些制造數據科學與人工智能工具的人,一樣很聰明,覺得這些原理就是“應知應會”。所以他們中寫數據科學類教程的時候,大多數人也根本不會考慮那些閱讀數學公式和分析模型構造有困難的文科生。

Youtube 上有位老兄,就是因為 Tensorflow 的官方教程寫得太爛,跟著走一遍都完成不下來。于是一賭氣,自己做了一套 Tensorflow 的教程。

這個教程,我在知識星球為你分享過。

你可能會挑戰我的說法:

老師,我最近剛看過 Tensorflow 官方教程,寫得很好啊!

給你5秒鐘,思考一下……

現在,你明白原因了吧。改進,大都是源于外部壓力的。

文科生們充滿恐懼和緊張,試圖掌握數據科學工具,來完成科研與工作任務;寫教材的人,依然在完完整整列出公式,甚至是推導過程。

你想學開車,他卻一定先要你學會發動機構造。

你可能產生了自卑感——好像看不懂這些公式,你就不配成為他的讀者。

其實,這又有什么?你完全不必成為他的讀者。

你們之間,沒有誰對誰錯,只是沒有緣分而已。

想必你我都認同,普通的非專職司機,智商并不比掌握內燃機構造的機械師低下。他可能是成功的生物學家,成功的作家。即便不動發動機構造和工作原理,依然可以很好地開車,順利安全到達自己的目的地。

同樣,作為文科生,你也不該在這場數字技術洪流中受到歧視。特別是,你不應該把自己推到數字鴻溝的另一端。

適合

你需要的,是適合自己閱讀的教程。

這種教程的特點是什么?

在我看來,大致包括:

  • 以問題為導向。用例子講明白如何用合適的工具,簡單高效解決問題;
  • 解決問題的方法,完全可以重復。教程必須給出全部的代碼和步驟流程。你自己拿過來就能上手,做出的結果會增強你的信心;
  • 盡量不使用數學公式,和一大堆把人繞暈的術語。即便使用術語,也需要給你解釋清楚。

秉持這樣的原則,從2017年6月開始,我在自己的公眾號“玉樹芝蘭”和簡書、知乎、科學網專欄,為你寫了一系列的數據科學教程。

這些教程,受到了很多讀者的歡迎。你熱情的留言和討論,是激發我不斷寫作的源動力。

可惜不論是公眾號,還是專欄,似乎文章一多,檢索都是個問題。公眾號的問題更多一些,因為發布后無法修改和迭代改進。

現在,我覺得這一系列文章,應該可以組合成為一本書了。所以,我就寫了這樣一本書,交付給你。

架構

在書里你可以通覽內容架構,檢索也可以方便許多。

這本書分為以下章節:

  • 導讀
  • 環境設置
  • 上手
  • 探索分析
  • 自然語言處理
  • 機器學習
  • 深度學習
  • 云端環境
  • 數據獲取
  • 答疑時間

以上只列出了章的名稱。建議你拿到書后,先看看目錄。

每一小節,我都保持了原汁原味的問題導向風格標題。希望瀏覽之后,你可以迅速定位到自己需要的部分,實踐和復用代碼,解決自己遇到的實際問題。

我在不同章節間,設定了交叉引用。需要參考其他章節的位置,你都可以在文中找到鏈接,進行快速方便地跳轉。

絕大部分的章節,都配備了 github 配套代碼和樣例數據。你可以盡情下載、修改和使用。只是別忘了在我的 github 上面,點個星星,相當于點贊了。謝謝!

這些文章,經歷了成百上千讀者實際運行檢驗。他們提供的反饋,也曾幫助我查找出了許多問題。我通過觀察他們提問,找到了教程講解中,他們還不是很理解的部分,不斷迭代改進表述方式和用例。

特別地,對于某些問題集中的重點概念,我還專門寫了答疑文章,甚至做了視頻教程。

獲取

好了,我知道讀到這里,你的耐心已經經受了極大的考驗,是吧?

你可以點擊這個鏈接http://t.cn/EvMHAyo),訪問這本書的免費在線開放版本。

希望你動手嘗試以后,會明白“技術門檻降低”不是一句騙人的話。而是真實世界里,實實在在發生的趨勢。

說明

你不是文科生?

那也沒有關系啊。

雖然這本書中的內容,或許有些部分對于你來說過于簡單,甚至有些啰嗦。

但你未必非要站在不具備基礎知識的讀者角度,來看它啊。

歡迎你幫我挑挑硬傷,改進這本書的質量。咱們可以共同協作,以避免“誤人子弟”的悲慘狀況發生。

告訴你一個小秘密——我的專欄和公眾號讀者里面,不乏名牌大學信息科學、計算機科學、統計學和數學專業的老師和研究生。

我曾經納悶,他們怎么也來讀我的教程?

后來我弄明白了。

有的老師,是希望這些教程幫助自己的學生快速上手。

有的老師,是希望切磋教學用例,以及教學方法。

有的老師,是從專業的角度,幫我把關。

他們給了我很多的鼓勵,也提供了諸多有益的反饋和點撥。在此,我向他們表示衷心的感謝!

所以你看,你并不孤獨。開放的數據科學教育,需要你這樣的專業人士貢獻自己一份力量。

Welcome on board!

喜歡請點贊和打賞。還可以微信關注和置頂我的公眾號“玉樹芝蘭”(nkwangshuyi)

如果你對 Python 與數據科學感興趣,不妨閱讀我的系列教程索引貼《如何高效入門數據科學?》,里面還有更多的有趣問題及解法。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 227,837評論 6 531
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,196評論 3 414
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 175,688評論 0 373
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 62,654評論 1 309
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,456評論 6 406
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 54,955評論 1 321
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,044評論 3 440
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,195評論 0 287
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 48,725評論 1 333
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,608評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 42,802評論 1 369
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,318評論 5 358
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,048評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,422評論 0 26
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,673評論 1 281
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,424評論 3 390
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 47,762評論 2 372

推薦閱讀更多精彩內容

  • 你覺得要如何做,看起來才是一個真正的女流氓呢!要抽煙嗎?喝酒?看毛片兒?爆粗口?打色狼? 錯了。 在自己的精神王國...
    陳小星520閱讀 488評論 1 1
  • 一個小時,曾以為是很久的,現在卻覺得時間過的好快,已經到了覺得時間在飛跑的年紀。 一個小時,只能寫兩個測試項目 一...
    天風zz閱讀 161評論 0 0
  • Hi,建頤 你好嗎? 此時此刻,你應該還在雄渾壯美的新疆大地上流連忘返吧? 如你所言,出去玩就是要放空自己,全身心...
    攝影師阿布閱讀 1,548評論 38 33