16.聚類分析

一。簡單介紹

按照特征來分;

目的在于人士能夠同一個(gè)類別內(nèi)的個(gè)體之間具有較高的相似度,而不同的相似度,而不同類別 之間具有較大的差異性,

對(duì)變量進(jìn)行聚類分析

并定制出使用與不同的類別的解決方案

我們?yōu)榱撕侠淼倪M(jìn)行聚類,需要次用適當(dāng)?shù)念~指標(biāo)來衡量研究對(duì)象之間的練習(xí)緊密程度

常用的指標(biāo)有距離和相似系數(shù)

相似系數(shù)--相關(guān)系數(shù)

托尼蓋的聚類分析方法可能得到不同的分類結(jié)果,或者聚類分析方法但是所分析的便令不同,

對(duì)于聚類結(jié)果的合理性判斷比較主觀,只要類別內(nèi)相似性類別建差異性都能得到合理的解釋和判斷,就認(rèn)為聚類結(jié)果是可行的。但是這樣可能會(huì)忽略掉一些小眾的群體的存在

的道具類結(jié)果后,還必須結(jié)合行業(yè)特點(diǎn)和實(shí)際業(yè)務(wù)發(fā)展情況,對(duì)結(jié)果進(jìn)行綜合Fenix和有前瞻性的解讀

聚類分析應(yīng)用場(chǎng)景

------------

二。分析步驟

1.確定需要參數(shù)與聚類分析的變量

2.對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理

3.選擇聚類方法和類別的個(gè)數(shù)

4.聚類分析個(gè)數(shù)解讀

2.1聚類方法

快速聚類(k-means cluster):也稱k均值聚類,他是按照一定的方法選取一批聚類中心點(diǎn),讓個(gè)案向最近的聚類中心點(diǎn)聚集形成初始分類,然后按照最近距離原則調(diào)整不合理的分類,直到分類合理為止

系統(tǒng)聚類(HIerarchical Cluster):也稱層次聚類,首先將參與聚類的個(gè)案(或變量)各視為一類,然后根據(jù)倆個(gè)類別之間的距離或相似性逐步合并,知道所有個(gè)案(或變量)合并為一個(gè)大類為止

二階聚類:也稱倆步聚類,一種智能聚類方法,分為倆個(gè)步驟1.預(yù)聚類,根據(jù)定義的最大了別數(shù)歲個(gè)案進(jìn)行初步歸類2.正式聚類:根據(jù)第一步中得到的初步歸類進(jìn)行在聚類并確定最終聚類的結(jié)果,并且在這一部中,會(huì)根據(jù)一定的統(tǒng)計(jì)標(biāo)準(zhǔn)確定聚類的類別數(shù)

-----------

三。案例分析

1.快速聚類分析

分析--分類--k-均值分類

k-均值分類對(duì)話框

將溝通的分,業(yè)務(wù)得分,領(lǐng)導(dǎo)能力得分變量移置變量中--員工ID移置個(gè)案標(biāo)注依據(jù)

聚類樹種可輸入期望值,預(yù)計(jì)將員工分為3組,因此輸入3

k均值聚類分析

保存--勾選聚類成員--繼續(xù)--k均值聚類分析對(duì)話框--繼續(xù)--確定

保存新變量對(duì)話框

1.2快速聚類分析解讀:

01 初始聚類分析

初始聚類中心

3個(gè)數(shù)據(jù)作為快速聚類的初始位置

本例中分別選擇了員工ID為1001 1012 1003三人作為初始聚類的初始位置

第二個(gè)輸出結(jié)果是“迭代歷史記錄”該結(jié)果顯示了本次快速聚類分析的一共迭代的次數(shù)。迭代的過程可以理解為每個(gè)類別與初始位置之間單位距離改變情況,當(dāng)這個(gè)距離變動(dòng)非常小的時(shí)候,迭代就完成了、本例中一共迭代了4次,初始位子最小是82.158

快速聚類分析輸出結(jié)果(2)迭代歷史記錄

第三個(gè)輸出結(jié)果:“最終聚類中心”,該最終聚類中心和初始聚類中心相比;在數(shù)值上發(fā)生了變化,說明通過迭代的計(jì)算過程,每個(gè)類別的位置都發(fā)生了偏移

最終聚類中心

第四個(gè)輸出結(jié)果“每個(gè)聚類中心得個(gè)案項(xiàng)目”,如圖10-9所示,該結(jié)果顯示了每個(gè)類別中所包含的數(shù)據(jù)量,本例中類別1?

每個(gè)聚類中的個(gè)案數(shù)

本案例中聚類1 包含了4 個(gè)員工

類別2 中包含了6個(gè)員工

類別三種包含了21個(gè)員工

數(shù)據(jù)文件中也新城了一個(gè)名為Qcl_1的變量,如下圖所示,其中變量值表示每個(gè)案例所屬的類別

應(yīng)該講這個(gè)分類結(jié)果和參與聚類分析的變量制作交叉表,計(jì)算元工各類別員工在溝通過,業(yè)務(wù),領(lǐng)導(dǎo)三方面的各自的平均值,一遍了解每一類別員工的特征

生成分類變量的數(shù)據(jù)文件

3.計(jì)算交叉表

分析--表--定制表--將QCL_1拖動(dòng)到右側(cè)的列區(qū)域上,將溝通能力和也無能李得分領(lǐng)導(dǎo)得分這三個(gè)變量拖動(dòng)大右側(cè)(行)區(qū)域上,摘要統(tǒng)計(jì)中的匯總方式采用默認(rèn)的平均值--確定

定制表(對(duì)話框)

----------

二.交叉表

快速聚類結(jié)果交叉表

從交叉表中可以看出:

1.類別1的員工在各績效評(píng)估指標(biāo)的平均得分都比較低,可以認(rèn)為是“工作表表現(xiàn)較弱”的組別

2.類別2 的員工在各級(jí)評(píng)估指標(biāo)的平均分得分處于中間水平,則認(rèn)為是“工作表現(xiàn)較強(qiáng)”的組別

3.類別3的員工在各績效評(píng)估指標(biāo)的平均分處于中間水平,則認(rèn)為是“工作保險(xiǎn)中等”的組別

-----------

三.系統(tǒng)聚類分析操作

分析--分類--系統(tǒng)聚類--系統(tǒng)聚類分析

系統(tǒng)聚類分析

將溝通能力,業(yè)務(wù)能力,領(lǐng)導(dǎo)能力得分移入變量--統(tǒng)計(jì)--

系統(tǒng)聚類分析(統(tǒng)計(jì))

將解的范圍調(diào)整到3-4--繼續(xù)--圖--勾譜系圖--在冰柱圖下方選擇【無】--繼續(xù)

系統(tǒng)聚類分析(對(duì)話框)

系統(tǒng)聚類分析和快速聚類分析的第二個(gè)不同之處

1.譜系圖:也稱樹狀圖,以樹狀的形式展現(xiàn)個(gè)案被分類的過程

2.冰柱圖:以“X"的形式顯示全部類別或指定類別的數(shù)的分類過程

在實(shí)際應(yīng)用中,倆種圖形選擇其一種輸出即可,但是從應(yīng)用范圍和可讀性來看,譜系圖更加直觀

----

系統(tǒng)聚類方法:方法(對(duì)話框)

方法--(聚類分析:方法)--組件聯(lián)結(jié)--瓦爾德法--組間聯(lián)結(jié)--測(cè)量--平方歐氏距離--計(jì)數(shù)--卡方測(cè)量--平方歐式距離--轉(zhuǎn)換值--一般用z得分--測(cè)量應(yīng)選擇區(qū)間想--平方歐式距離--z得分--按變量(每個(gè)變量進(jìn)行標(biāo)準(zhǔn)化)-繼續(xù)

----------

3.2 系統(tǒng)聚類分析結(jié)果解讀

1.“個(gè)案處理摘要”:該結(jié)果主要提供了數(shù)據(jù)量,缺失值信息和測(cè)量方法,本例中,該表顯示了21個(gè),無確實(shí)個(gè)案,采用的測(cè)量方法為“平方歐式距離”

個(gè)案處理摘要

2.“集中計(jì)劃”--聚類過程

集中計(jì)劃

第一步聚類是編號(hào)8 和21 的個(gè)案合并

第二步聚類是編號(hào)8和18的個(gè)案合并

3.”聚類成員“將所有個(gè)案對(duì)應(yīng)的分類結(jié)果集中展示。實(shí)際上以結(jié)果已經(jīng)心啊是在數(shù)據(jù)文件中,用clu3_1,clu4_1倆個(gè)變量表示(clu是系統(tǒng)局了我i的分類結(jié)果變量的前綴,后面的數(shù)字為類別數(shù),下劃線后免得數(shù)字為系統(tǒng)聚類分析結(jié)果保存的次數(shù)

col3_1,clu4_1

4."譜系圖“該圖形能直觀地表示出整個(gè)聚類的全過程,另外分類姐果用一個(gè)相對(duì)距離25 的刻度來表示,如果要看某一類別所包含的數(shù)據(jù),只要從上面王下切,劃過幾條橫線,對(duì)應(yīng)的個(gè)案就分了幾類


譜系圖

如果要看2個(gè)類別的分組結(jié)果,只需要藏刻度為20的地方往下切,第一組編號(hào):8-12,第二組:5-16

------

3.3繼續(xù)將分類結(jié)構(gòu)和參與聚類分析的變量制作交叉表,計(jì)算各個(gè)類別元共公共在溝通,業(yè)務(wù),領(lǐng)導(dǎo)三方面呢能李的平均值,一邊了解每一類別員工的特征,此外,還要顯示出一類別所包含的個(gè)案數(shù)

分析--描述統(tǒng)計(jì)--頻率-將clu3_1clu4_1 拖到右側(cè)的變量區(qū)域上

各類別頻率表

顯示分類結(jié)果和三個(gè)變量的交叉表,單機(jī)分析--表--定制表--將clu3_1和clu4_1 移入列變量中,將溝通能力,業(yè)務(wù)能力得分,領(lǐng)導(dǎo)能力得分移入行中--生成交叉表

系統(tǒng)聚類結(jié)果交叉表

從頻率表可知clu3的類別2和clu4的類別2,clu3的類別3,clu3的類別4的人數(shù)一致

clu3與clu4的區(qū)別在于,clu4的類別1和類別4 合起來就是clu3的類別1

從交叉表結(jié)合頻率表可知

1)clu3的類別2和clu4的類別2為同一批員工,業(yè)務(wù)能李得分是最高的,也就是說,這一類的員工也無能力很強(qiáng),但是另外倆個(gè)能力較為薄弱

2)clu3的類別2分值整體較高,屬于表現(xiàn)良好的員工,此類個(gè)指標(biāo)分支均較低,可以認(rèn)為這一類的員工整體能力較差

3)clu3的類別2分支整體較高,屬于表現(xiàn)良好的一批員工,而clu4將其細(xì)分為呢能力優(yōu)秀的類別2 和能力一般的類別3

----------

二階聚類分析

分析--分類--二階聚類--二階聚類分析--將學(xué)歷/性別變量一致【分類變量框中】--將溝通能力得分,業(yè)務(wù)能力得分,領(lǐng)導(dǎo)能力得分三個(gè)變量移至連續(xù)變量中--輸出--二階聚類:輸出--勾選輸出下面的透視表,工作數(shù)據(jù)文件下的【創(chuàng)建聚類了成員變量】--繼續(xù)--確定

二階聚類分析【對(duì)話框】


二階聚類:輸出【對(duì)話框】

二階聚類會(huì)自動(dòng)分析并輸出最有聚類數(shù)

二階聚類分析輸出結(jié)果【自動(dòng)聚類】
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 227,401評(píng)論 6 531
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 98,011評(píng)論 3 413
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 175,263評(píng)論 0 373
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經(jīng)常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 62,543評(píng)論 1 307
  • 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 71,323評(píng)論 6 404
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 54,874評(píng)論 1 321
  • 那天,我揣著相機(jī)與錄音,去河邊找鬼。 笑死,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 42,968評(píng)論 3 439
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 42,095評(píng)論 0 286
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 48,605評(píng)論 1 331
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 40,551評(píng)論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 42,720評(píng)論 1 369
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,242評(píng)論 5 355
  • 正文 年R本政府宣布,位于F島的核電站,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 43,961評(píng)論 3 345
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,358評(píng)論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,612評(píng)論 1 280
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 51,330評(píng)論 3 390
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 47,690評(píng)論 2 370

推薦閱讀更多精彩內(nèi)容

  • RFM分析只能對(duì)客戶的行為進(jìn)行分析,包含的信息量有點(diǎn)少。一般來說,對(duì)人群進(jìn)行分類,要綜合考慮其行為、態(tài)度、模式以及...
    黃成甲閱讀 8,710評(píng)論 0 36
  • 原理篇 定義 聚類分析也稱群分析或點(diǎn)群分析,它是研究多要素事物分類問題的數(shù)量方法,是一種新興的多元統(tǒng)計(jì)方法,是當(dāng)代...
    ux2017閱讀 12,347評(píng)論 1 25
  • SAA SAA需要在會(huì)議開始時(shí),宣告會(huì)議規(guī)則。中文會(huì)議可以參考以下術(shù)語: 歡迎大家參加意酷頭馬俱樂部第xx次會(huì)議!...
    半城_37cb閱讀 642評(píng)論 0 0
  • 一、相見恨晚,你還好嗎 “呼~”,飛機(jī)降落在h市的機(jī)場(chǎng),晚上的h市顯得格外美麗,“安...
    繶笥閱讀 691評(píng)論 0 3
  • 今天下雪,我們應(yīng)該心情好,不能唐突了這雪。
    皎月踏歌閱讀 160評(píng)論 0 0