一。簡單介紹
按照特征來分;
目的在于人士能夠同一個(gè)類別內(nèi)的個(gè)體之間具有較高的相似度,而不同的相似度,而不同類別 之間具有較大的差異性,
對(duì)變量進(jìn)行聚類分析
并定制出使用與不同的類別的解決方案
我們?yōu)榱撕侠淼倪M(jìn)行聚類,需要次用適當(dāng)?shù)念~指標(biāo)來衡量研究對(duì)象之間的練習(xí)緊密程度
常用的指標(biāo)有距離和相似系數(shù)
相似系數(shù)--相關(guān)系數(shù)
托尼蓋的聚類分析方法可能得到不同的分類結(jié)果,或者聚類分析方法但是所分析的便令不同,
對(duì)于聚類結(jié)果的合理性判斷比較主觀,只要類別內(nèi)相似性類別建差異性都能得到合理的解釋和判斷,就認(rèn)為聚類結(jié)果是可行的。但是這樣可能會(huì)忽略掉一些小眾的群體的存在
的道具類結(jié)果后,還必須結(jié)合行業(yè)特點(diǎn)和實(shí)際業(yè)務(wù)發(fā)展情況,對(duì)結(jié)果進(jìn)行綜合Fenix和有前瞻性的解讀
------------
二。分析步驟
1.確定需要參數(shù)與聚類分析的變量
2.對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理
3.選擇聚類方法和類別的個(gè)數(shù)
4.聚類分析個(gè)數(shù)解讀
2.1聚類方法
快速聚類(k-means cluster):也稱k均值聚類,他是按照一定的方法選取一批聚類中心點(diǎn),讓個(gè)案向最近的聚類中心點(diǎn)聚集形成初始分類,然后按照最近距離原則調(diào)整不合理的分類,直到分類合理為止
系統(tǒng)聚類(HIerarchical Cluster):也稱層次聚類,首先將參與聚類的個(gè)案(或變量)各視為一類,然后根據(jù)倆個(gè)類別之間的距離或相似性逐步合并,知道所有個(gè)案(或變量)合并為一個(gè)大類為止
二階聚類:也稱倆步聚類,一種智能聚類方法,分為倆個(gè)步驟1.預(yù)聚類,根據(jù)定義的最大了別數(shù)歲個(gè)案進(jìn)行初步歸類2.正式聚類:根據(jù)第一步中得到的初步歸類進(jìn)行在聚類并確定最終聚類的結(jié)果,并且在這一部中,會(huì)根據(jù)一定的統(tǒng)計(jì)標(biāo)準(zhǔn)確定聚類的類別數(shù)
-----------
三。案例分析
1.快速聚類分析
分析--分類--k-均值分類
將溝通的分,業(yè)務(wù)得分,領(lǐng)導(dǎo)能力得分變量移置變量中--員工ID移置個(gè)案標(biāo)注依據(jù)
聚類樹種可輸入期望值,預(yù)計(jì)將員工分為3組,因此輸入3
保存--勾選聚類成員--繼續(xù)--k均值聚類分析對(duì)話框--繼續(xù)--確定
1.2快速聚類分析解讀:
01 初始聚類分析
3個(gè)數(shù)據(jù)作為快速聚類的初始位置
本例中分別選擇了員工ID為1001 1012 1003三人作為初始聚類的初始位置
第二個(gè)輸出結(jié)果是“迭代歷史記錄”該結(jié)果顯示了本次快速聚類分析的一共迭代的次數(shù)。迭代的過程可以理解為每個(gè)類別與初始位置之間單位距離改變情況,當(dāng)這個(gè)距離變動(dòng)非常小的時(shí)候,迭代就完成了、本例中一共迭代了4次,初始位子最小是82.158
第三個(gè)輸出結(jié)果:“最終聚類中心”,該最終聚類中心和初始聚類中心相比;在數(shù)值上發(fā)生了變化,說明通過迭代的計(jì)算過程,每個(gè)類別的位置都發(fā)生了偏移
第四個(gè)輸出結(jié)果“每個(gè)聚類中心得個(gè)案項(xiàng)目”,如圖10-9所示,該結(jié)果顯示了每個(gè)類別中所包含的數(shù)據(jù)量,本例中類別1?
本案例中聚類1 包含了4 個(gè)員工
類別2 中包含了6個(gè)員工
類別三種包含了21個(gè)員工
數(shù)據(jù)文件中也新城了一個(gè)名為Qcl_1的變量,如下圖所示,其中變量值表示每個(gè)案例所屬的類別
應(yīng)該講這個(gè)分類結(jié)果和參與聚類分析的變量制作交叉表,計(jì)算元工各類別員工在溝通過,業(yè)務(wù),領(lǐng)導(dǎo)三方面的各自的平均值,一遍了解每一類別員工的特征
3.計(jì)算交叉表
分析--表--定制表--將QCL_1拖動(dòng)到右側(cè)的列區(qū)域上,將溝通能力和也無能李得分領(lǐng)導(dǎo)得分這三個(gè)變量拖動(dòng)大右側(cè)(行)區(qū)域上,摘要統(tǒng)計(jì)中的匯總方式采用默認(rèn)的平均值--確定
----------
二.交叉表
從交叉表中可以看出:
1.類別1的員工在各績效評(píng)估指標(biāo)的平均得分都比較低,可以認(rèn)為是“工作表表現(xiàn)較弱”的組別
2.類別2 的員工在各級(jí)評(píng)估指標(biāo)的平均分得分處于中間水平,則認(rèn)為是“工作表現(xiàn)較強(qiáng)”的組別
3.類別3的員工在各績效評(píng)估指標(biāo)的平均分處于中間水平,則認(rèn)為是“工作保險(xiǎn)中等”的組別
-----------
三.系統(tǒng)聚類分析操作
分析--分類--系統(tǒng)聚類--系統(tǒng)聚類分析
將溝通能力,業(yè)務(wù)能力,領(lǐng)導(dǎo)能力得分移入變量--統(tǒng)計(jì)--
將解的范圍調(diào)整到3-4--繼續(xù)--圖--勾譜系圖--在冰柱圖下方選擇【無】--繼續(xù)
系統(tǒng)聚類分析和快速聚類分析的第二個(gè)不同之處
1.譜系圖:也稱樹狀圖,以樹狀的形式展現(xiàn)個(gè)案被分類的過程
2.冰柱圖:以“X"的形式顯示全部類別或指定類別的數(shù)的分類過程
在實(shí)際應(yīng)用中,倆種圖形選擇其一種輸出即可,但是從應(yīng)用范圍和可讀性來看,譜系圖更加直觀
----
方法--(聚類分析:方法)--組件聯(lián)結(jié)--瓦爾德法--組間聯(lián)結(jié)--測(cè)量--平方歐氏距離--計(jì)數(shù)--卡方測(cè)量--平方歐式距離--轉(zhuǎn)換值--一般用z得分--測(cè)量應(yīng)選擇區(qū)間想--平方歐式距離--z得分--按變量(每個(gè)變量進(jìn)行標(biāo)準(zhǔn)化)-繼續(xù)
----------
3.2 系統(tǒng)聚類分析結(jié)果解讀
1.“個(gè)案處理摘要”:該結(jié)果主要提供了數(shù)據(jù)量,缺失值信息和測(cè)量方法,本例中,該表顯示了21個(gè),無確實(shí)個(gè)案,采用的測(cè)量方法為“平方歐式距離”
2.“集中計(jì)劃”--聚類過程
第一步聚類是編號(hào)8 和21 的個(gè)案合并
第二步聚類是編號(hào)8和18的個(gè)案合并
3.”聚類成員“將所有個(gè)案對(duì)應(yīng)的分類結(jié)果集中展示。實(shí)際上以結(jié)果已經(jīng)心啊是在數(shù)據(jù)文件中,用clu3_1,clu4_1倆個(gè)變量表示(clu是系統(tǒng)局了我i的分類結(jié)果變量的前綴,后面的數(shù)字為類別數(shù),下劃線后免得數(shù)字為系統(tǒng)聚類分析結(jié)果保存的次數(shù)
4."譜系圖“該圖形能直觀地表示出整個(gè)聚類的全過程,另外分類姐果用一個(gè)相對(duì)距離25 的刻度來表示,如果要看某一類別所包含的數(shù)據(jù),只要從上面王下切,劃過幾條橫線,對(duì)應(yīng)的個(gè)案就分了幾類
如果要看2個(gè)類別的分組結(jié)果,只需要藏刻度為20的地方往下切,第一組編號(hào):8-12,第二組:5-16
------
3.3繼續(xù)將分類結(jié)構(gòu)和參與聚類分析的變量制作交叉表,計(jì)算各個(gè)類別元共公共在溝通,業(yè)務(wù),領(lǐng)導(dǎo)三方面呢能李的平均值,一邊了解每一類別員工的特征,此外,還要顯示出一類別所包含的個(gè)案數(shù)
分析--描述統(tǒng)計(jì)--頻率-將clu3_1clu4_1 拖到右側(cè)的變量區(qū)域上
顯示分類結(jié)果和三個(gè)變量的交叉表,單機(jī)分析--表--定制表--將clu3_1和clu4_1 移入列變量中,將溝通能力,業(yè)務(wù)能力得分,領(lǐng)導(dǎo)能力得分移入行中--生成交叉表
從頻率表可知clu3的類別2和clu4的類別2,clu3的類別3,clu3的類別4的人數(shù)一致
clu3與clu4的區(qū)別在于,clu4的類別1和類別4 合起來就是clu3的類別1
從交叉表結(jié)合頻率表可知
1)clu3的類別2和clu4的類別2為同一批員工,業(yè)務(wù)能李得分是最高的,也就是說,這一類的員工也無能力很強(qiáng),但是另外倆個(gè)能力較為薄弱
2)clu3的類別2分值整體較高,屬于表現(xiàn)良好的員工,此類個(gè)指標(biāo)分支均較低,可以認(rèn)為這一類的員工整體能力較差
3)clu3的類別2分支整體較高,屬于表現(xiàn)良好的一批員工,而clu4將其細(xì)分為呢能力優(yōu)秀的類別2 和能力一般的類別3
----------
二階聚類分析
分析--分類--二階聚類--二階聚類分析--將學(xué)歷/性別變量一致【分類變量框中】--將溝通能力得分,業(yè)務(wù)能力得分,領(lǐng)導(dǎo)能力得分三個(gè)變量移至連續(xù)變量中--輸出--二階聚類:輸出--勾選輸出下面的透視表,工作數(shù)據(jù)文件下的【創(chuàng)建聚類了成員變量】--繼續(xù)--確定
二階聚類會(huì)自動(dòng)分析并輸出最有聚類數(shù)