我們可能因?yàn)橄嘈盘摷俣茯_,自然,我們也會(huì)因?yàn)橄嘈耪鎸?shí)而受騙
互聯(lián)網(wǎng)數(shù)據(jù)最重要的部分是用戶的行為分析,挖掘用戶偏好能更好的實(shí)現(xiàn)商業(yè)的價(jià)值,同時(shí),異常的行為分析也是對(duì)用戶的一種安全防護(hù)措施。用戶行為簡(jiǎn)單的可以分為五個(gè)要素:時(shí)間、地點(diǎn)、人物、交互和內(nèi)容。在獲得網(wǎng)站或APP等平臺(tái)訪問(wèn)量基本數(shù)據(jù)的情況下,對(duì)有關(guān)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)、分析,從中發(fā)現(xiàn)用戶訪問(wèn)網(wǎng)站或APP等平臺(tái)的規(guī)律,并將這些規(guī)律與網(wǎng)絡(luò)營(yíng)銷策略等相結(jié)合,從而發(fā)現(xiàn)目前網(wǎng)絡(luò)營(yíng)銷活動(dòng)中可能存在的問(wèn)題,并為進(jìn)一步修正或重新制定網(wǎng)絡(luò)營(yíng)銷策略提供依據(jù)。
只有做了用戶行為分析才能知道用戶畫(huà)像、才能對(duì)用戶各種行為做一個(gè)初步的預(yù)判,進(jìn)而對(duì)行為產(chǎn)生一個(gè)長(zhǎng)效的統(tǒng)計(jì)分析。分析目的的一種是關(guān)注流失,尤其是對(duì)轉(zhuǎn)化有要求的網(wǎng)站。用戶行為分析幫助分析用戶怎么流失、為什么流失、在哪里流失。當(dāng)你有了很多用戶行為數(shù)據(jù)、定義事件之后,你可以把用戶數(shù)據(jù)做成一個(gè)按小時(shí)、按天,或者按用戶級(jí)別、事件級(jí)別拆分的一個(gè)表,從而為后期的商務(wù)行為做一個(gè)參考。
正常行為分析
正常行為分析的目的在于數(shù)據(jù)驅(qū)動(dòng)增長(zhǎng),數(shù)據(jù)驅(qū)動(dòng)增長(zhǎng)的關(guān)鍵在于指標(biāo)。
硅谷公司用數(shù)據(jù)去實(shí)現(xiàn)驅(qū)動(dòng)業(yè)務(wù)增長(zhǎng),主要有三個(gè)目標(biāo):
1)提升關(guān)鍵指標(biāo)
2)改變產(chǎn)品體驗(yàn)
3)優(yōu)化運(yùn)營(yíng)流程
如果細(xì)分,還可以分為:拉新、轉(zhuǎn)化、促活、留存和變現(xiàn)。
拉新的場(chǎng)景在于分析SEM(search engine marketing) 和 SEO (search engine optimizing) 的每個(gè)關(guān)鍵詞的 ROI(投資回報(bào)率:return on invest)。同時(shí)還有 各個(gè)合作伙伴的渠道導(dǎo)流情況。尤其是搜索引擎,關(guān)鍵詞帶來(lái)的流量是可觀的。這些流量只能帶來(lái)用戶,至于是否達(dá)成商務(wù)行為,還要結(jié)合自身的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)。
轉(zhuǎn)化率是一個(gè)數(shù)據(jù)分析的重要指標(biāo),與之相對(duì)應(yīng)的一個(gè)詞是流失率。定義入口,統(tǒng)計(jì)事件只是一個(gè)起點(diǎn),對(duì)于最終的結(jié)果只是一個(gè)借鑒,落地的還是決策。一種提高轉(zhuǎn)化率的決策是,分析用戶從進(jìn)入-注冊(cè)-驗(yàn)證-登陸-使用的整個(gè)過(guò)程,通過(guò)漏斗分析,檢驗(yàn)每個(gè)環(huán)節(jié)的流失率,優(yōu)化流程,提高用戶轉(zhuǎn)化。
促活是對(duì)產(chǎn)品內(nèi)容及流暢度的一個(gè)檢驗(yàn)。通過(guò)分析用戶行為,統(tǒng)計(jì)用戶頁(yè)面停留,完善用戶畫(huà)像,進(jìn)而精準(zhǔn)分析定位,從而個(gè)性化推薦愈加精準(zhǔn)。
用戶流失,在時(shí)間的長(zhǎng)河中是一種自然而然的事情。每個(gè)產(chǎn)品都有自己的壽命,我們所做的只是延緩或者重生。這也是分析留存的一個(gè)主要的目的。通過(guò)對(duì)用戶行為的一個(gè)長(zhǎng)期的追蹤,有了這些數(shù)據(jù)的支撐,分析哪些使用造成了流失,哪些使用更好的維護(hù)了用戶關(guān)系,便能更好的維護(hù)一個(gè)商業(yè)的變現(xiàn)。
商業(yè)變現(xiàn)是檢驗(yàn)一款產(chǎn)品是否成功的一個(gè)重要指標(biāo),當(dāng)然非盈利機(jī)構(gòu)除外。一款產(chǎn)品會(huì)有它獨(dú)特的盈利點(diǎn),找到并有效的接入才能維護(hù)產(chǎn)品的正常迭代。商業(yè)變現(xiàn)有直接變現(xiàn)和間接變現(xiàn)之分,直接變現(xiàn)以直接打成交易為主,例如O2O等。間接變現(xiàn)通過(guò)廣告、導(dǎo)流等產(chǎn)生可觀資金流。
至于手段,我們后面會(huì)說(shuō)。
增長(zhǎng)黑客
數(shù)據(jù)驅(qū)動(dòng)增長(zhǎng),關(guān)鍵在于提升關(guān)鍵指標(biāo)、改善產(chǎn)品體驗(yàn)、優(yōu)化運(yùn)營(yíng)流程。如果沒(méi)有長(zhǎng)期的數(shù)據(jù)統(tǒng)計(jì)分析,對(duì)于這些無(wú)異于盲人摸象。這也即是我們常說(shuō)的,數(shù)據(jù)是一切的基石。
提升關(guān)鍵指標(biāo),最好是一個(gè)轉(zhuǎn)化率,而不是UV、PV這種簡(jiǎn)單的數(shù)字,因?yàn)檫@些肯定會(huì)提升;改變用戶體驗(yàn),主要在于細(xì)節(jié)的把控,人以貌相,除非是大家不得不用的工具型壟斷軟件,大部分軟件,UI是留住客戶的第一步,然后是產(chǎn)品使用體驗(yàn),流暢度、響應(yīng)速度等;優(yōu)化運(yùn)營(yíng)流程,重點(diǎn)在于簡(jiǎn)化,如無(wú)必要,勿增實(shí)體,把那些太過(guò)于復(fù)雜的功能重新梳理,有些事直接一點(diǎn)反而更好。
產(chǎn)品決定了你獲取用戶數(shù)據(jù)的基本面。不同的用戶層面和產(chǎn)品形態(tài)也可能導(dǎo)致不論怎么努力就是無(wú)法快速獲取用戶的結(jié)果。那么,什么樣的產(chǎn)品或者功能能快速獲取用戶呢?
1)用戶使用頻率高
2)用戶密度大
3)一個(gè)動(dòng)作所覆蓋的人數(shù)
滿足了以上條件的產(chǎn)品,想要快速獲取用戶就很容易了,下面是一個(gè)互聯(lián)網(wǎng)產(chǎn)品的用戶增長(zhǎng)模型:AARRR模型。
所謂AARRR用戶模型其實(shí)就是“獲取(Acquisition)”、“激活(Activation)”、“留存(Retention)”、“傳播(Referral)”、“收入(Revenue)”。從上面的AARRR模型圖我們也可以看到,其實(shí)它是一個(gè)漏斗,從用戶獲取到激活到留存,留存到傳播和收入就是一個(gè)自上而下的漏斗,越往下越窄。理想的境況下,我們都希望這是一個(gè)圓柱體,但顯然這是比較困難的,而我們要做的就是精細(xì)化分析用戶獲取到收入的整個(gè)過(guò)程。
常用手段簡(jiǎn)單介紹如下:
創(chuàng)造更多的著陸頁(yè)
付費(fèi)廣告應(yīng)該有針對(duì)性的鏈接到相應(yīng)的著陸頁(yè)上,而不是主頁(yè)
建立定向的LINK-TRACKING(鏈路跟蹤)
刪除著陸頁(yè)上不重要的鏈接
使用qualaroo等調(diào)查工具得到客戶反饋
購(gòu)買統(tǒng)計(jì)數(shù)據(jù)的工具
拆分用戶需求
大量的A/B Test
CTA(Call to Action 期望用戶進(jìn)行的操作)使用更強(qiáng)的對(duì)比色
將CTA放在右側(cè)
在頁(yè)面的最下方重復(fù)你的CTA
在頁(yè)面上寫(xiě)上你對(duì)用戶做出的保證(不會(huì)透露用戶信息等)
立刻顯示驗(yàn)證(如填寫(xiě)表單時(shí))
……
增長(zhǎng)黑客,簡(jiǎn)單來(lái)說(shuō)就是建立一個(gè)增長(zhǎng)黑客的坐標(biāo)系。增長(zhǎng)黑客是通過(guò)快速的迭代試驗(yàn)找到實(shí)現(xiàn)產(chǎn)品增長(zhǎng)的有效方法。我們的終點(diǎn)是實(shí)現(xiàn)產(chǎn)品有效增長(zhǎng),為了到達(dá)這個(gè)終點(diǎn),我們需要在三個(gè)方面努力,第一點(diǎn)是找到努力的起點(diǎn),第二點(diǎn)是找到努力的方向,第三點(diǎn)是加快努力的程度。
用一個(gè)等式表示就是:起點(diǎn)+方向+行動(dòng)=終點(diǎn)。增長(zhǎng)黑客的革命性方法就在行動(dòng)上。增長(zhǎng)黑客的核心實(shí)際上類似于敏捷開(kāi)發(fā),只不過(guò)增長(zhǎng)黑客是以運(yùn)營(yíng)人員為中心,敏捷開(kāi)發(fā)是以產(chǎn)品經(jīng)理為中心。
異常行為分析
基于深度學(xué)習(xí)的Action Recognition(行為識(shí)別)是目前AI研究的一個(gè)方向,也是當(dāng)下發(fā)表論文比較多的一個(gè)領(lǐng)域。
目前談?wù)摫容^多的大概有以下幾個(gè)方向:
混合代理方法檢測(cè)擁擠場(chǎng)景中異常行為
老年人動(dòng)作識(shí)別和異常行為檢測(cè)
基于視頻的異常檢測(cè)
行人檢測(cè)和路徑分析
導(dǎo)航,包括監(jiān)控行為和檢測(cè)異常
醫(yī)療健康和其他相關(guān)領(lǐng)域異常行為的識(shí)別
人類活動(dòng)識(shí)別(HAR)
智能家居行為預(yù)測(cè)
籠統(tǒng)的概括可分為:Structure、Inputs和Connection。
行為可分為個(gè)人行為和群體交互行為,在真實(shí)情境下,異常行為的發(fā)生經(jīng)常伴隨猛烈的動(dòng)作,例如,突然速度加快;或是在恐慌情境下,在一個(gè)局限的區(qū)域中混亂的運(yùn)動(dòng),與周圍人動(dòng)作的對(duì)比。將人群行為作為一個(gè)Bag-of-words模型,通過(guò)靜態(tài)和動(dòng)態(tài)代理的信息整合,來(lái)確定人群行為的異常。靜態(tài)代理用來(lái)處理某個(gè)特定的點(diǎn),用來(lái)分析該點(diǎn)周圍的動(dòng)作信息。動(dòng)態(tài)代理用來(lái)處理一個(gè)移動(dòng)的目標(biāo),分析目標(biāo)運(yùn)動(dòng)和周圍人的動(dòng)作信息。即是所謂的混合代理模型。
其他如活動(dòng)識(shí)別被認(rèn)為是一個(gè)序列標(biāo)簽問(wèn)題,而異常行為是基于與正常模式脫離標(biāo)記的。
基于視頻異常檢測(cè)最基本的方面,即視頻特征表示。大部分研究工作都是在尋找一種合適的表示方法,以便在視頻流中,以可接受的誤報(bào)率,準(zhǔn)確的檢測(cè)異常。然而,由于環(huán)境和人類動(dòng)作的大量變化,這是個(gè)巨大的挑戰(zhàn),由于高維度的數(shù)據(jù)特征帶來(lái)了較高的空間時(shí)間復(fù)雜度。深度學(xué)習(xí)算法的弱監(jiān)督特性可以幫助從視頻數(shù)據(jù)本身中學(xué)到表示方法,而不用手動(dòng)地從某個(gè)特定場(chǎng)景下設(shè)計(jì)合適的特征,以此對(duì)視頻表示建模。
關(guān)于導(dǎo)航,深度學(xué)習(xí)這方面最近的研究已經(jīng)證實(shí)了從數(shù)據(jù)中直接學(xué)習(xí)特征的能力,并且循環(huán)神經(jīng)網(wǎng)絡(luò)相關(guān)的研究已經(jīng)表明了序列到序列問(wèn)題的典型結(jié)果,例如神經(jīng)機(jī)器翻譯和神經(jīng)圖像標(biāo)題生成。受到這些方法的激勵(lì),在給定一段較短的關(guān)于某個(gè)行人的歷史數(shù)據(jù)、其周圍的人和過(guò)去的行為,來(lái)預(yù)測(cè)行人的下一步動(dòng)作。這個(gè)方法的創(chuàng)新點(diǎn)在于其結(jié)合了關(guān)注模型,這種模型使用了軟關(guān)注和硬關(guān)注,來(lái)映射從局部鄰域到關(guān)注的行人的未來(lái)位置的軌跡信息。關(guān)注權(quán)重(如硬連線)的一個(gè)簡(jiǎn)單的近似值是如何與軟關(guān)注權(quán)重混合一起,在有著幾百相鄰人的真實(shí)世界情境下使得模型更可靠。此外,這個(gè)架構(gòu)可以直接應(yīng)用于異常事件檢測(cè)中而不需要手工特征。
異常行為識(shí)別在醫(yī)療健康和其他相關(guān)領(lǐng)域也引起了很大的關(guān)注,特別是對(duì)老年人的身心健康,墜落及其他疾病、衰老等方面引起了越來(lái)越多的關(guān)注。基于墜落檢測(cè)技術(shù)的設(shè)備可以有效實(shí)時(shí)地監(jiān)控墜落事件的發(fā)生,并幫助受傷人員接受急救。然而,對(duì)于墜落檢測(cè)和監(jiān)控,傳統(tǒng)方法的內(nèi)置分類器盡管可以達(dá)到一個(gè)相對(duì)高的檢測(cè)正確率,但是其誤報(bào)率過(guò)高,進(jìn)一步地,由于異常行為的傳感器數(shù)據(jù)在真實(shí)應(yīng)用中很稀少,這種方法必須面對(duì)這種不平衡問(wèn)題。為了處理這個(gè)難題,使用一種對(duì)于眼睛、手表等可穿戴物品的two-stage adaptive weighted extreme learning machine(AWELM)的方法來(lái)檢測(cè)和監(jiān)控墜落。這種方法,通過(guò)兩階段識(shí)別計(jì)劃,實(shí)現(xiàn)了高檢測(cè)準(zhǔn)確度和誤檢率之間的平衡;其次,通過(guò)兩階段自適應(yīng)權(quán)重方法,使得對(duì)于稀少的異常行為數(shù)據(jù)的不平衡學(xué)習(xí)方法變得有效;第三,使用極值學(xué)習(xí)機(jī),提出一種輕型的分類方法,處理可穿戴設(shè)備的資源限制,來(lái)加速訓(xùn)練和更好的泛化,這使得大范圍的健康應(yīng)用成為可能,特別是最終幫助老年人減少墜落事件的風(fēng)險(xiǎn)。
人類活動(dòng)識(shí)別(HAR)在健康和社會(huì)保健領(lǐng)域也是一個(gè)相對(duì)活躍的研究課題。基于HAR的深度攝像機(jī),從人類深度輪廓,通過(guò)傳統(tǒng)的分類器,比如Hidden Markov Model (HMM),Conditional Random Fields等抽取的特征,識(shí)別人類活動(dòng)。另外,使用循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN,深度學(xué)習(xí)算法的一種)的HAR系統(tǒng),利用多個(gè)隨時(shí)間變化的關(guān)節(jié)角度,來(lái)表示時(shí)空特征矩陣(即時(shí)間上的多個(gè)身體關(guān)節(jié)角度),能夠可靠地識(shí)別12種人類活動(dòng),并且比HMM和DBN的性能要好。
行為識(shí)別是深度學(xué)習(xí)還未完全攻克的領(lǐng)域,雖然現(xiàn)在已經(jīng)有了一些特殊的手段來(lái)統(tǒng)計(jì)分析,但還有很大的空間。在沒(méi)有找到更好的模式去表達(dá)時(shí),最妥帖的方式是真實(shí)記錄。