如何在未來的大數據和機器學習領域,獲得一份不錯的工作?

2018 年,AI 的發展腳步會加快,這一年將是 AI 技術重生和數據科學得以重新定義的一年。對于雄心勃勃的數據科學家來說,他們如何在與數據科學相關的工作市場中脫穎而出?2018 年會有足夠多的數據科學相關工作嗎?還是說有可能出現萎縮?接下來,讓我們來分析一下數據科學的趨勢,并一探如何在未來的大數據和機器學習 /AI 領域獲得一份不錯的工作。”

在這里我還是要推薦下我自己建的大數據學習交流群:199427210,群里都是學大數據開發的,如果你正在學習大數據 ,小編歡迎你加入,大家都是軟件開發黨,不定期分享干貨(只有大數據開發相關的),包括我自己整理的一份2018最新的大數據進階資料和高級開發教程,歡迎進階中和進想深入大數據的小伙伴。

1、你需要牢固掌握概率統計學,并學習和掌握一些算法,比如樸素貝葉斯、高斯混合模型、隱馬爾可夫模型、混淆矩陣、ROC 曲線、P-Value 等。

不但要理解這些算法,還要知道它們的工作原理。你需要牢固掌握梯度下降、凸優化、拉各朗日方法論、二次規劃、偏微分方程、求積法等相關算法。

如果你想找一份高薪的工作,還需要掌握機器學習技術和算法,比如 k-NN、樸素貝葉斯、SVM 和決策森林等。

2、

現在大部分機器學習都需要海量數據,所以你無法在單臺機器上進行機器學習。所以,你需要用到集群,需要掌握 Apache Hadoop 和一些云服務,如 Rackspace、Amazon EC2、Google Cloud Platform、OpenStack 和 Microsoft Azure 等。

你還需要掌握各種 Unix 工具,如 cat、grep、find、awk、sed、sort、cut、tr 等。因為機器學習基本上都是在 Unix 系統上運行的,所以需要掌握這些工具,知道它們的作用以及如何使用它們。

3、在掌握編程語言和算法的同時,不要忽略了數據可視化的作用。如果無法讓你自己或別人理解數據,那么它們就變得毫無意義。數據可視化就是指如何在正確的時間向正確的人展示數據,以便讓他們從中獲得價值。主要的數據可視化工具包括:Tableau、QlikView、Someka Heat Maps、FusionCharts、Sisense、Plotly、Highcharts、Datawrapper、D3.js、ggplot 等。

4、要成為數據科學家,不一定非要拿到數據科學方面的學位。事實上,你完全不需要這么做,這樣做反而不是個好主意。如果你能拿到計算機學位、工程學學位、經濟學學位、數學學位、統計學學位、精算師學位、金融學學位或者自然科學學位(物理、化學或生物)都是可以的。甚至是人文科學(包括社會科學)也是可以的。

2018年跳槽指南:如何找到一份人工智能相關的工作?

AI前線 ? 7小時前 ? 技能Get

大數據把 AI 推向了技術炒作的舞臺正中央,數據科學和機器學習在各行各業開始嶄露頭角

本文由 【AI前線】原創,原文鏈接:http://t.cn/RHqaB5p

作者|Tanmoy Ray,譯者|薛命燈,編輯|Emily

AI 前線導讀:“2017 年,大數據把 AI 推向了技術炒作的舞臺正中央,數據科學和機器學習在各行各業開始嶄露頭角。機器學習開始被應用于解決數據分析問題。機器學習、AI 和預測分析成為 2017 年的熱門話題。我們見證了基于數據的價值創新,包括數據科學平臺、深度學習和主要幾個廠商提供的機器學習云服務,還有機器智能、規范性分析、行為分析和物聯網。

2018 年,AI 的發展腳步會加快,這一年將是 AI 技術重生和數據科學得以重新定義的一年。對于雄心勃勃的數據科學家來說,他們如何在與數據科學相關的工作市場中脫穎而出?2018 年會有足夠多的數據科學相關工作嗎?還是說有可能出現萎縮?接下來,讓我們來分析一下數據科學的趨勢,并一探如何在未來的大數據和機器學習 /AI 領域獲得一份不錯的工作。”

增強技術實力

編程語言和開發工具

365 Data Science 收集了來自 LinkedIn 的 1001 數據科學家的信息,發現需求量最大的編程語言為 R 語言、Python 和 SQL。另外,還要求具備 MATLAB、Java、Scala 和 C/C++ 方面的知識。為了能夠脫穎而出,需要熟練掌握 Weka 和 NumPy 這類工具。

概率統計學、應用數學和機器學習算法

你需要牢固掌握概率統計學,并學習和掌握一些算法,比如樸素貝葉斯、高斯混合模型、隱馬爾可夫模型、混淆矩陣、ROC 曲線、P-Value 等。

不但要理解這些算法,還要知道它們的工作原理。你需要牢固掌握梯度下降、凸優化、拉各朗日方法論、二次規劃、偏微分方程、求積法等相關算法。

如果你想找一份高薪的工作,還需要掌握機器學習技術和算法,比如 k-NN、樸素貝葉斯、SVM 和決策森林等。

分布式計算和 Unix 工具

現在大部分機器學習都需要海量數據,所以你無法在單臺機器上進行機器學習。所以,你需要用到集群,需要掌握 Apache Hadoop 和一些云服務,如 Rackspace、Amazon EC2、Google Cloud Platform、OpenStack 和 Microsoft Azure 等。

你還需要掌握各種 Unix 工具,如 cat、grep、find、awk、sed、sort、cut、tr 等。因為機器學習基本上都是在 Unix 系統上運行的,所以需要掌握這些工具,知道它們的作用以及如何使用它們。

查詢語言和 NoSQL 數據庫

傳統關系型數據庫已經老去。除了 Hadoop 之外,你還需要掌握 SQL、Hive 和 Pig,以及 NoSQL 數據庫,如 MongoDB、Casssandra、HBase。

基于 NoSQL 分布式數據庫的基礎設施已經成為大數據倉庫的基礎。原先在一個中心關系型數據庫上需要 20 個小時才能處理完的任務,在一個大型的 Hadoop 集群上可能只需要 3 分鐘時間。當然,你也可以使用 MapReduce、Cloudera、Tarn、PaaS、Chef、Flume 和 ABAP 這些工具。

數據可視化工具

在掌握編程語言和算法的同時,不要忽略了數據可視化的作用。如果無法讓你自己或別人理解數據,那么它們就變得毫無意義。數據可視化就是指如何在正確的時間向正確的人展示數據,以便讓他們從中獲得價值。主要的數據可視化工具包括:Tableau、QlikView、Someka Heat Maps、FusionCharts、Sisense、Plotly、Highcharts、Datawrapper、D3.js、ggplot 等。

正確選擇教育背景和專業

要成為數據科學家,不一定非要拿到數據科學方面的學位。事實上,你完全不需要這么做,這樣做反而不是個好主意。如果你能拿到計算機學位、工程學學位、經濟學學位、數學學位、統計學學位、精算師學位、金融學學位或者自然科學學位(物理、化學或生物)都是可以的。甚至是人文科學(包括社會科學)也是可以的。

但或許你會在其他領域得到更好的發展,比如經濟、應用數學或工程領域。首先要確定數據科學這條路是不是適合自己。2018 年絕對不會讓那些有志在數據科學領域一展身手的人失望。不過還是那句話,一個具備分析能力的大腦、熟練的編程技能、誠摯的熱情和持續自我提升的毅力將決定你的數據科學家之路會走多遠。

?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 228,238評論 6 531
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,430評論 3 415
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 176,134評論 0 373
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 62,893評論 1 309
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,653評論 6 408
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 55,136評論 1 323
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,212評論 3 441
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,372評論 0 288
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 48,888評論 1 334
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,738評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 42,939評論 1 369
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,482評論 5 359
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,179評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,588評論 0 26
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,829評論 1 283
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,610評論 3 391
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 47,916評論 2 372

推薦閱讀更多精彩內容