改进模糊聚类算法及其在人力资源管理中的应用_王浩

上传者：陈建华
|
上传时间：2015-04-24
|
密次下载

改进模糊聚类算法及其在人力资源管理中的应用_王浩

第28卷第3期天津师范大学学报(自然科学版)

2008年7月JournalofTianjinNormalUniversity(NaturalScienceEdition)

Vol.28No.3

Jul.2008

文章编号:1671-1114(2008)03-0077-04

改进模糊聚类算法及其在人力资源管理中的应用

王浩,都忠诚

(天津师范大学管理学院,天津300387)

摘要:对传统的模糊聚类算法进行了改进,考虑了各评价指标的相关性及不同评价指标对所分析问题的重要程度,使模型能够更准确地反映实际问题.运用改进算法对人力资源问题进行了分析,验证了该算法的有效性.关键词:模糊聚类分析;相关性;人力资源管理中图分类号:O159 文献标识码:A

Improvedfuzzyclusteringalgorithmanditsapplicationtohumanresourcemanagement

WANGHao,DUZhongcheng

(CollegeofManagement,TianjinNormalUniversity,Tianjin300387,China)

Abstract:Thetraditionalfuzzyclusteringalgorithmisimproved.Intheimprovedalgorithmthecorrelativitybetween

differentevaluatingindicatorsanddifferenceinimportanceofevaluatingindicatorsareconsidered,andthefactsarereflectedmoreexactly.Byusingtheimprovedalgorithmaproblemofhumanresourcemanagementisanalyzed,andthevalidityoftheimprovedalgorithmisverified.

Keywords:fuzzyclusteringanalysis;correlativity;humanresourcemanagement

传统的聚类分析是一种硬划分,它按照一定的要求和规律将事物进行分类,这种分类的界限是分明的,具有非此即彼的性质.但实际应用中存在大量界限并不分明的聚类问题,它们的类属和性态存在着中介性,适合软划分.美国计算机与控制论专家L.A.Zadeh教授提出的模糊集理论是一种研究模糊性或不确定性问题的理论方法,人们用模糊的方法来处理聚类问题并称之为模糊聚类分析.将模糊聚类分析应用于数据挖掘中可以显著提高计算效率,同时可以根据不同的要求获得不同的聚类结果,这样极大地提高了聚类的灵活性并有效地降低了计算量.在数据挖掘中,模糊聚类分析已经得到了广泛的应用.目前运用模糊聚类对人力资源问题进行分析已经有了一些研究[1-2],但他们在分析时大多没有考虑各因素的相关性及不同评价指标对所分析问题的重要性,所以往往不能很好地反映现实问题.本研究针对这两个问题,在对属性进行加权的同时选择Ma-halanobis距离来代替传统的欧氏距离、隶属度等算法,降低了由于属性相关关系对模型准确性的影响,

从而使模型能够更准确地反映现实问题.

1 传统模糊聚类的步骤及其关键算法

对于待分类的一个样本集U={u1,u2, ,un},设其中的每个元素有m项指标,则ui可以用m维向量描述,即

ui=(ui1,ui2, ,uim),i=1,2, ,n.其相应的模糊聚类步骤如下:

1)标准化处理.将数据压缩至[0,1]区间上,ui

标准化后的数据记为

xi=(xi1,xi2, ,xim),i=1,2, ,n.

2)建立模糊关系.这是比较重要的环节之一,根据距离或其他比较的方法建立模糊相似矩阵. 距离的计算方法很多,其中欧式距离在聚类分析中应用最广,xi到xj的欧式距离定义为

d(xi,xj)=xj夹角的余弦为

1(xik-xjk).

非距离方法中,最经典的是夹角余弦法,xi与

收稿日期:2007-12-27.

基金项目:国家自然科学基金项目(70072039)第一作者:王浩(1983 ),男,硕士研究生.

通讯作者:都忠诚(1956 ),男,教授,主要从事供应链管理等方面的研究.

天津师范大学学报(自然科学版)

2008年7月

cos(xi,xj)=

k=1

xjk/

x x

2ikk=1

2jk

xi=(xi1, ,xim),xj=(xj1, ,xjm),则xi和xj的Mahalanobis距离为

dij=

xi-xj)

最终进行模糊聚类分析的矩阵是一个模糊等价矩阵,由相似变换得到的等价矩阵已满足对称性及自反性,但并不一定满足传递性,所以要对矩阵进行变换使其满足传递性,这类矩阵变换的算法中,最著名的是Washall算法,又称传递闭包法.

3)聚类过程.模糊等价矩阵建立后,取阈值0< <2 < <(p-1) <1=p ,在每一轮聚类过程中,凡是等价矩阵中相似度大于阈值的元素均置1,而其余都置0.若有相同的两列或多列,即表示这些列彼此之间接近,则列的标号即代表原来的元素,作为一组中的元素加以记录.不断重复上述过程直至所有样本归为一类.

4)绘制系统聚类谱系图.按不同的分类标准或不同的分类原则,可得到不同的分类结果.

(xi-xj)T,

其中为样本的协方差矩阵;差矩阵的逆矩阵,令

dij=

-1

为样本的协方

,rij=1- dij,

max{dij}i,jr11

r12r22 rn2

r1n r2n

rnn

(4)

则模糊相似矩阵为

r21 rn1

本研究采用系统聚类的方法进行聚类分析,系统聚类法的基本思想是:先将所研究的n个样品(或变量)各自归为一类;计算它们之间的相似程度或距离,选择最相似的或距离最小的两类归为新的一类;计算新类与其他类之间的相似程度或距离,选择

最相似的或距离最小的两类归为一个新类;每次归类就减少一个类,直到所有样品(或变量)归为一个类.然后取截集( [0,1]),即去掉那些权数rij 的边,这样就把经过聚类后作为整体的一个类分为了若干个类.

本算法过程是一个有监督学习的过程,其中截集反映对人员分类的情况,它的确定采用专家群决策的方法,不同专家意见权重的确定采用委托过程法[3].具体方法如下:

设有p个专家,每个专家都为其委托人 (除自身以外的所有专家)赋权wij,wij为第i个专家对第j个专家给出的权重,其中i,j=1,2, ,p.每个专家都像在自己缺席的情况下,委托其他专家去估计群体专家的权重,而自己又作为委托人去判定其他各专家的权重.wij反映了专家i对专家j的权威和信赖程度进行的估计和赋值,说明了专家i认为专

2 改进模型

通过层次分析法对数据进行加权来体现不同数据之间的重要性差异,并引入Mahalanobis距离进行聚类分析来消除不同因素之间的相关性影响,具体改进方法如下:

设样本集为U={u1,u2, ,un},每个样本有m项指标,则ui可以用m维向量描述,即ui=(ui1,ui2, ,uim),i=1,2, ,n,通过层次分析法确定的m个指标的权重向量为

=( 1, , m),满足赋予权重后的样本为

ui=(ui1, ,uim).

由于实际数据往往不在[0,1]区间,所以应将这些数据标准化,并压缩至[0,1]区间.首先对n个样本的第k项指标求平均值(u k)和标准差(Sk),k=1, ,m,

u k=

k=1

=1,

i=1

*ik

,Sk=

i=1

*ik

- uk),

(1)

家j对决策的影响程度.每个专家都有一组相应的委托人,用委托人的群体决策代替自己的决策.wij满足

(2)

j=1

然后对数据标准化,

ikk

u=,

Sk||

=1,wii=0,i=1, ,p.由以上可得

最后使用归一化公式将数据压缩至[0,1]区间,

xik=

u-min{u}k

ik ik

权重计算方程为:

m1+m2+ +mp=1,

w11m1+w21m2+ +wp1mp=m1,

w1pm1+w2pm2+ +wppmp=mp,

mii.

max{u}-min{u}kk

.(3)

第28卷第3期王浩,等:改进模糊聚类算法及其在人力资源管理中的应用

表3

指标12345678910

知识水平1.280.801.120.960.640.961.601.120.961.12

通过求解线性方程组可得专家意见的权重向量

k,(m1,m2, ,mp).设第k个专家所确定的值为

则利用求得的权重对专家意见进行综合评定确定

经过加权处理后的样本数据

工作能力1.801.201.201.401.201.401.601.601.201.40

道德水平1.201.051.050.751.051.201.050.601.051.05

团队精神0.901.350.900.901.201.051.050.601.201.50

业绩水平3.062.382.042.381.702.722.383.062.382.38

k=1

m .

设将n个样本分为s个类,即s个模式,第l个模式所包含样本的集合为Ml,Ml中的样本数为Nl,第l个模式的第j个指标的平均值为

Modelj=

u M

(5)

qNl

由式(1) (2)计算得标准化矩阵:

0.851.901.040.641.460.970.950.241.100.160.240.950.240.640.980.370 1.360.640.161.580.950.240.521.79

0.370 1.040.060.652.070.950.240.060.160.240.952.061.801.460.370.950.240.520.160.240 0.241.680.16由式(3)计算得归一化矩阵:0.331 0.420.330.800.400.500 0.600 0 0.500 0.330.500.070 0.580.330.500.730.500 0.271

0.070 0.420 0.301 0.500 0 0 0 0.501 1 0.800.070.500 0.270 0 0 0 0.930

利用式(4)求得相似矩阵,此时得到的相似矩阵具有自反性、对称性,但还不具有传递性,要对矩阵进行处理,令模糊矩阵自乘使其满足R*R=R时,R即为所求作.

内容需要下载文档才能查看

模糊相似矩阵为:

1 0.340.410.190.160.150.190.310.420

1 0.350.330.160.130.430.240.520.46

1 0.24

1 0.15

1 0.261

0.100.01

0.270.06

其中q为各指标满分数,第l个模式可表示为

Model=(Model1, ,Modelm).

设待测样本D=(d1, ,dm),对D处理得待测数据D =(d 1, ,d m)=(d1 1/q, ,dm m/q).将待测数据与数据库中的已分类的模式作比较,利用贴近度[4]的概念反映待测数据与第l个模式的贴近程度:

(D ,Model)=

(D Model+(1-D Model))/2,合间的外积,根据择近原则,设

max{(D ,Model)}=(D ,Modec),l

则可判断待测数据与第c个模式最接近,可从这一模式的整体情况进行预测.

(6)

其中, 表示模糊集合间的内积, 表示模糊集

3 实证分析

以某公司人才为例进行分析,利用层次分析法求得的各指标的相对权重见表1,表2为该公司10名人才的评价数据(各指标满分为10分),经过加权处理后的样本数据见表3.

表1 各指标的相对权重

指标权重

知识水平0.16

工作能力0.20

道德水平0.15

团队精神0.15

业绩水平0.34

表2 某公司10名人才的评价数据

指标12345678910

知识水平

85764610767

工作能力

9667678867

道德水平

8775787477

团队精神

69668774810

业绩水平

9767587977

0.360.580.190.060.290.160.110.310.070.600.350.040.300.250.15

0.300.220.090.120.050.16

内容需要下载文档才能查看

满

内容需要下载文档才能查看

足传递性的模糊相似矩阵为:

1 0.420.420.360.270.360.420.310.420.42

1 0.52

1 0.270.580.360.310.360.36

1 0.27

1 0.310.430.43

0.270.360.270.310.270.360.270.36

0.360.360.270.270.360.360.430.430.310.110.520.600.460.46

天津师范大学学报(自然科学版) 2008年7月

结合专家的意见确定 =0.4,则此时样本(人才)被分为4个模式,即模式1:{1,2,3,7,9,10};模式2:{4,6};模式3:{8};模式4:{5}.则由式(5)得各模式的平均指标见表5.

表5 各模式的平均指标

指标模式1模式2模式3模式4

知识水平工作能力0.120.140.100.140.110.160.060.12

道德水平团队精神

0.110.120.100.100.060.060.110.12

业绩水平

0.240.260.310.17

0.311

0.310.46

运用系统聚类的方法得到聚类树如图1.

待测数据D=(7,8,6,7,8)经处理后为D =(0.11,0.16,0.09,0.11,0.27).由式(6)得D 与各模式的贴近度见表6.

表6 D 与各模式的贴近度

模式

贴近度

模式10.565

模式20.580

模式30.590

模式40.530

由表6可知,待测人员数据与模式3的贴近度最大,说明他与模式3中的人员综合素质最接近.

4 小结

图1 聚类树

运用群决策确定截集时,专家数量为4人,具体方程如下:

m1+m2+m3+m4=1,

0m1+0.4m2+0.25m3+0.1m4=m1,0.2m1+0m2+0.25m3+0.2m4=m2,0.4m1+0.5m2+0m3+0.7m4=m3,0.4m1+0.1m2+0.5m3+0m4=m4,求得4个专家意见的权重及他们的取值见表4.

表4 4个专家意见的权重及取值

专家1234

权重0.190.180.360.27

取值0.50.40.40.5

传统的模糊聚类分析在对一些模糊性或不确定性问题的研究中有着十分显著的优势,但其在现实应用中都没有考虑不同因素对所分析问题的重要性以及各因素之间的相关性.本研究通过层次分析法对多个指标进行加权来体现各指标不同的重要性程度,同时引入Mahalanobis距离消除各指标间的相关性影响,对传统的模糊聚类分析算法进行了改进,使模型能够更加准确地反映人力资源管理的现实问题.参考文献:

[1] 肖进,贺昌政,杨华.人力资源绩效考核分析[J].商业研究,

2005(21):123-127.

[2] 胡洁纹,魏军,胡涛.模糊数据挖掘算法在人力资源管理中的

应用[J].计算机与数字工程,2002,30(5):25-29.[3] 李怀祖.决策理论导引[M].北京:机械工业出版社,1993.[4] 常大勇,张丽丽.经济管理中的模糊数学方法[M].北京:北

京经济学院出版社,1995.

(责任编校马新光)

(上接第76页)参考文献:

[1] 魏权龄.评价相对有效性的DEA方法运筹学的新领域[M].

北京:中国人民大学出版社,1988.

[2] 杜栋,庞庆华.现代综合评价方法与案例精选[M].北京:

清华大学出版社,2005.

[3] KattaGMutry.LinearProgramming[M].NewYork:John