如今是2017年,我們大圣眾包的小編經(jīng)過(guò)長(zhǎng)期和用戶打交道取得不少收獲,了解了想入行或轉(zhuǎn)行數(shù)據(jù)分析的熱愛(ài)學(xué)習(xí)朋友們的關(guān)心問(wèn)題,下面一起盤點(diǎn)下問(wèn)得最多的問(wèn)題,推薦給大家看看,你有不同的答案看法歡迎留言!
1.學(xué)習(xí)統(tǒng)計(jì)有沒(méi)有用?
肯定是有用的。決策需要數(shù)據(jù)支撐,而統(tǒng)計(jì)學(xué)是數(shù)據(jù)分析的方法論。另一很有用的學(xué)科是運(yùn)籌學(xué),主要做優(yōu)化方面的東西,但是就LZ經(jīng)驗(yàn)來(lái)看,運(yùn)用的廣度和企業(yè)的接受度不急統(tǒng)計(jì)學(xué)(LZ公司統(tǒng)計(jì)背景vs運(yùn)籌背景大概是10:1的比例)。
2.學(xué)什么軟件好?
SPSS是上手最快的;SAS是最強(qiáng)大的;R是最靈活且最有潛力的;MATLAB運(yùn)用的企業(yè)很少(有幾個(gè)特定的行業(yè)比如投行之類的很喜歡它)。
如果你是統(tǒng)計(jì)背景的學(xué)生,那這幾個(gè)軟件應(yīng)該都會(huì),就不多說(shuō)了。
如果是非非統(tǒng)計(jì)背景,且這幾個(gè)都沒(méi)接觸過(guò),那我建議你用SPSS,這樣可以把精力專注于統(tǒng)計(jì)算法的學(xué)習(xí)上,而非軟件本身的使用。而且就國(guó)內(nèi)的情況而言,用SAS的公司主要集中于銀行與藥廠(如果說(shuō)錯(cuò)了歡迎SAS公司的朋友指正),這樣的企業(yè)非統(tǒng)計(jì)背景也很難擠進(jìn)去。
3.報(bào)學(xué)習(xí)班有沒(méi)有用?
大部分的學(xué)習(xí)班都是3,4天這樣的,課程大綱大概是LZ上學(xué)時(shí)候1-2年學(xué)的東西。想在3-4天學(xué)會(huì)1-2年的東西,困難可想而知。所以想通過(guò)一個(gè)學(xué)習(xí)班學(xué)會(huì)統(tǒng)計(jì)是不可能的。踏踏實(shí)實(shí)選本書(shū)學(xué)是正道。(LZ的公司每年也會(huì)舉辦很多次SPSS培訓(xùn),雖然象征性地收幾百塊錢,但LZ覺(jué)得對(duì)學(xué)生而言也算一筆負(fù)擔(dān)了。學(xué)生時(shí)間比較多,強(qiáng)烈建議自學(xué),不會(huì)的問(wèn)題到這里或者人大經(jīng)濟(jì)論壇問(wèn),基本上問(wèn)的靠譜的問(wèn)題LZ都會(huì)幫助解答的。)(補(bǔ)充:什么叫做靠譜的問(wèn)題?比如你要蓋一個(gè)房子,”房子要怎么蓋啊“就是不個(gè)靠譜的問(wèn)題;”非承重墻的磚頭要用空心的還是實(shí)心的“算是個(gè)靠譜的問(wèn)題。)
4.數(shù)學(xué)背景弱的人能自學(xué)統(tǒng)計(jì)嗎?
沒(méi)問(wèn)題的,LZ很多同事(包括LZ本人)都是本科商科/工科然后碩士轉(zhuǎn)統(tǒng)計(jì)的。對(duì)于不懂微積分、矩陣運(yùn)算的同學(xué),可能有些算法理解起來(lái)有困難,但是LZ覺(jué)得基本不礙大事。進(jìn)行一個(gè)分析有四個(gè)很重要的環(huán)節(jié):算法的使用前提條件(即assumption),算法的運(yùn)算邏輯是什么樣子的,如何在軟件中操作,如何解讀軟件的輸出結(jié)果。除了第二點(diǎn)以外,高中數(shù)學(xué)背景完全可以滿足。
弄懂一三四就可以勝任大部分企業(yè)的分析工作了,很多業(yè)內(nèi)人士都沒(méi)弄清楚。(親身經(jīng)歷,國(guó)內(nèi)某一線市場(chǎng)調(diào)研公司的研究員打來(lái)電話問(wèn)算法的時(shí)候順便提了下她正在進(jìn)行的一個(gè)產(chǎn)品測(cè)試(A/Btest)的問(wèn)題,LZ告訴她按照她的數(shù)據(jù)要用配對(duì)t檢驗(yàn),她驚呼她們過(guò)去10年中一直對(duì)這種數(shù)據(jù)在用獨(dú)立樣本t檢驗(yàn)。這就是典型的沒(méi)弄清楚算法的使用前提條件。)
5.做數(shù)據(jù)挖掘需要精通統(tǒng)計(jì)算法嗎?
數(shù)據(jù)挖掘主要的應(yīng)用是預(yù)測(cè)(分類目標(biāo)、連續(xù)目標(biāo))、聚類(客戶細(xì)分)、關(guān)聯(lián)規(guī)則。LZ個(gè)人覺(jué)得略懂統(tǒng)計(jì)就可以了。因?yàn)楦鱾€(gè)模型都有評(píng)估指標(biāo),建模完了直接看模型的效果就可以,當(dāng)然熟悉算法的話可以幫你去優(yōu)化模型(但是就是錦上添花的東西了)。
LZ個(gè)人覺(jué)得做數(shù)據(jù)挖掘比做統(tǒng)計(jì)分析容易,因?yàn)槟悴恍枰浅6惴ā?/p>
6.做數(shù)據(jù)挖掘需要懂編程嗎?
看企業(yè)和應(yīng)用。
比如互聯(lián)網(wǎng)企業(yè),做自然語(yǔ)言相關(guān)的,不懂編程就沒(méi)法做。很多電商,做數(shù)據(jù)挖掘,要跟現(xiàn)有的系統(tǒng)做對(duì)接,也需要編程。
以上這兩種企業(yè)特別適合計(jì)算機(jī)背景的同學(xué)。
但是也有很多企業(yè)(尤其是企業(yè)中做客戶關(guān)系管理或者營(yíng)銷的部門),需要數(shù)據(jù)分析和數(shù)據(jù)挖掘來(lái)支持企業(yè)決策,主定期分析數(shù)據(jù)然后寫報(bào)告。這種企業(yè)是各位看見(jiàn)編程就頭大的同學(xué)最理想的選擇。
原文地址:http://www.dashengzb.cn/articles/a-367.html
(更多大數(shù)據(jù)與商業(yè)智能領(lǐng)域干貨、或電子書(shū),可添加個(gè)人微信號(hào)(dashenghuaer))