分類(lèi)是根據(jù)輸入的樣本屬性值,在已有標(biāo)記的數(shù)據(jù)集條件下,將每個(gè)樣本映射到先定義好的類(lèi)別上。分類(lèi)有很多經(jīng)典的算法:決策樹(shù)、回歸、貝葉斯、支持向量機(jī)等等....
關(guān)聯(lián)分析是在交易數(shù)據(jù)、關(guān)系數(shù)據(jù)或其他信息載體中,查找存在于項(xiàng)目集合或?qū)ο蠹现g的頻繁模式、關(guān)聯(lián)、相關(guān)性或因果結(jié)構(gòu),是發(fā)現(xiàn)商品之間的關(guān)聯(lián)聯(lián)系
當(dāng)然關(guān)聯(lián)分析也可以用于分類(lèi),發(fā)現(xiàn)事物之間的關(guān)聯(lián)性,吧相互有聯(lián)系的分到一類(lèi),但是在實(shí)際運(yùn)用中,關(guān)聯(lián)分析一般用來(lái)進(jìn)行事物推薦,比如人和人之間喜歡的電影相同,那么就把一個(gè)人喜歡的另一個(gè)電影推薦給另外一個(gè)人,同時(shí),關(guān)聯(lián)分析還可進(jìn)行變量篩選,比如在進(jìn)行聚類(lèi)之前,如果變量過(guò)多,假設(shè)有200個(gè),但是有的變量之間存在高度相關(guān)性,則就相當(dāng)于在一個(gè)特征上面的權(quán)重放大,當(dāng)然這個(gè)篩選過(guò)程還可以根據(jù)主成分分析來(lái)實(shí)現(xiàn)。
分類(lèi)則是根據(jù)一個(gè)人的行為數(shù)據(jù)觀察另一個(gè)人和這個(gè)人的行為是否相似來(lái)決定是否屬于同一個(gè)類(lèi)別,分類(lèi)一般是建立在已經(jīng)知道一部分類(lèi)別的特征的情況下進(jìn)行分類(lèi),而關(guān)聯(lián)規(guī)則則是只能知道事物是相關(guān)的,但不知道具體的類(lèi)別,這點(diǎn)有點(diǎn)像聚類(lèi)分析了其實(shí)
總之,為了這個(gè)問(wèn)題我是糾結(jié)了一下,但后來(lái)想想,還是利用算法的有點(diǎn)進(jìn)行場(chǎng)景選擇比較好,比如我有已知的類(lèi)別,對(duì)未知的進(jìn)行分類(lèi),那就選擇分類(lèi)算法,若是進(jìn)行產(chǎn)品推薦就選擇關(guān)聯(lián)分析,用算法的長(zhǎng)板來(lái)選擇使用的場(chǎng)景,就像制作excel圖表的時(shí)候,一個(gè)占比的數(shù)據(jù)我們可以用柱狀圖、條形圖等所有圖表進(jìn)行表示,但是我們最終還是會(huì)選擇餅圖,因?yàn)閳D表都可以做,但是每個(gè)圖表的優(yōu)勢(shì)所在和表達(dá)的主要含義不同。