教育资源为主的文档平台

当前位置: 查字典文档网> 所有文档分类> 经管营销> 人力资源管理> 改进模糊聚类算法及其在人力资源管理中的应用_王浩

改进模糊聚类算法及其在人力资源管理中的应用_王浩

上传者:陈建华
|
上传时间:2015-04-24
|
次下载

改进模糊聚类算法及其在人力资源管理中的应用_王浩

第28卷 第3期天津师范大学学报(自然科学版)

2008年7月JournalofTianjinNormalUniversity(NaturalScienceEdition)

Vol.28No.3

Jul.2008

文章编号:1671-1114(2008)03-0077-04

改进模糊聚类算法及其在人力资源管理中的应用

王 浩,都忠诚

(天津师范大学管理学院,天津300387)

摘 要:对传统的模糊聚类算法进行了改进,考虑了各评价指标的相关性及不同评价指标对所分析问题的重要程度,使模型能够更准确地反映实际问题.运用改进算法对人力资源问题进行了分析,验证了该算法的有效性.关键词:模糊聚类分析;相关性;人力资源管理中图分类号:O159 文献标识码:A

Improvedfuzzyclusteringalgorithmanditsapplicationtohumanresourcemanagement

WANGHao,DUZhongcheng

(CollegeofManagement,TianjinNormalUniversity,Tianjin300387,China)

Abstract:Thetraditionalfuzzyclusteringalgorithmisimproved.Intheimprovedalgorithmthecorrelativitybetween

differentevaluatingindicatorsanddifferenceinimportanceofevaluatingindicatorsareconsidered,andthefactsarereflectedmoreexactly.Byusingtheimprovedalgorithmaproblemofhumanresourcemanagementisanalyzed,andthevalidityoftheimprovedalgorithmisverified.

Keywords:fuzzyclusteringanalysis;correlativity;humanresourcemanagement

传统的聚类分析是一种硬划分,它按照一定的要求和规律将事物进行分类,这种分类的界限是分明的,具有 非此即彼 的性质.但实际应用中存在大量界限并不分明的聚类问题,它们的类属和性态存在着中介性,适合软划分.美国计算机与控制论专家L.A.Zadeh教授提出的模糊集理论是一种研究模糊性或不确定性问题的理论方法,人们用模糊的方法来处理聚类问题并称之为模糊聚类分析.将模糊聚类分析应用于数据挖掘中可以显著提高计算效率,同时可以根据不同的要求获得不同的聚类结果,这样极大地提高了聚类的灵活性并有效地降低了计算量.在数据挖掘中,模糊聚类分析已经得到了广泛的应用.目前运用模糊聚类对人力资源问题进行分析已经有了一些研究[1-2],但他们在分析时大多没有考虑各因素的相关性及不同评价指标对所分析问题的重要性,所以往往不能很好地反映现实问题.本研究针对这两个问题,在对属性进行加权的同时选择Ma-halanobis距离来代替传统的欧氏距离、隶属度等算法,降低了由于属性相关关系对模型准确性的影响,

从而使模型能够更准确地反映现实问题.

1 传统模糊聚类的步骤及其关键算法

对于待分类的一个样本集U={u1,u2, ,un},设其中的每个元素有m项指标,则ui可以用m维向量描述,即

ui=(ui1,ui2, ,uim),i=1,2, ,n.其相应的模糊聚类步骤如下:

1)标准化处理.将数据压缩至[0,1]区间上,ui

标准化后的数据记为

xi=(xi1,xi2, ,xim),i=1,2, ,n.

2)建立模糊关系.这是比较重要的环节之一,根据 距离 或其他比较的方法建立模糊相似矩阵. 距离 的计算方法很多,其中欧式距离在聚类分析中应用最广,xi到xj的欧式距离定义为

d(xi,xj)=xj夹角的余弦为

1(xik-xjk).

2

非距离方法中,最经典的是夹角余弦法,xi与

收稿日期:2007-12-27.

基金项目:国家自然科学基金项目(70072039)第一作者:王 浩(1983 ),男,硕士研究生.

通讯作者:都忠诚(1956 ),男,教授,主要从事供应链管理等方面的研究.

78

天津师范大学学报(自然科学版)

m

2008年7月

cos(xi,xj)=

k=1

x

ik

xjk/

1

x x

2ikk=1

2jk

.

xi=(xi1, ,xim),xj=(xj1, ,xjm),则xi和xj的Mahalanobis距离为

dij=

xi-xj)

最终进行模糊聚类分析的矩阵是一个模糊等价矩阵,由相似变换得到的等价矩阵已满足对称性及自反性,但并不一定满足传递性,所以要对矩阵进行变换使其满足传递性,这类矩阵变换的算法中,最著名的是Washall算法,又称传递闭包法.

3)聚类过程.模糊等价矩阵建立后,取阈值0< <2 < <(p-1) <1=p ,在每一轮聚类过程中,凡是等价矩阵中相似度大于阈值的元素均置1,而其余都置0.若有相同的两列或多列,即表示这些列彼此之间接近,则列的标号即代表原来的元素,作为一组中的元素加以记录.不断重复上述过程直至所有样本归为一类.

4)绘制系统聚类谱系图.按不同的分类标准或不同的分类原则,可得到不同的分类结果.

(xi-xj)T,

其中 为样本的协方差矩阵;差矩阵的逆矩阵,令

dij=

-1

为样本的协方

ij

,rij=1- dij,

max{dij}i,jr11

r12r22 rn2

r1n r2n

rnn

.

(4)

则模糊相似矩阵为

r21 rn1

R=

本研究采用系统聚类的方法进行聚类分析,系统聚类法的基本思想是:先将所研究的n个样品(或变量)各自归为一类;计算它们之间的相似程度或距离,选择最相似的或距离最小的两类归为新的一类;计算新类与其他类之间的相似程度或距离,选择

最相似的或距离最小的两类归为一个新类;每次归类就减少一个类,直到所有样品(或变量)归为一个类.然后取 截集( [0,1]),即去掉那些权数rij 的边,这样就把经过聚类后作为整体的一个类分为了若干个类.

本算法过程是一个有监督学习的过程,其中 截集反映对人员分类的情况,它的确定采用专家群决策的方法,不同专家意见权重的确定采用委托过程法[3].具体方法如下:

设有p个专家,每个专家都为其 委托人 (除自身以外的所有专家)赋权wij,wij为第i个专家对第j个专家给出的权重,其中i,j=1,2, ,p.每个专家都像在自己缺席的情况下,委托其他专家去估计群体专家的权重,而自己又作为委托人去判定其他各专家的权重.wij反映了专家i对专家j的权威和信赖程度进行的估计和赋值,说明了专家i认为专

2 改进模型

通过层次分析法对数据进行加权来体现不同数据之间的重要性差异,并引入Mahalanobis距离进行聚类分析来消除不同因素之间的相关性影响,具体改进方法如下:

设样本集为U={u1,u2, ,un},每个样本有m项指标,则ui可以用m维向量描述,即ui=(ui1,ui2, ,uim),i=1,2, ,n,通过层次分析法确定的m个指标的权重向量为

=( 1, , m),满足赋予权重后的样本为

ui=(ui1, ,uim).

由于实际数据往往不在[0,1]区间,所以应将这些数据标准化,并压缩至[0,1]区间.首先对n个样本的第k项指标求平均值(u k)和标准差(Sk),k=1, ,m,

u k=

n

n

*

*

*

k=1

m

k

=1,

i=1

u

*ik

,Sk=

i=1

(u

*ik

- uk),

(1)

2

家j对决策的影响程度.每个专家都有一组相应的委托人,用委托人的群体决策代替自己的决策.wij满足

(2)

j=1

然后对数据标准化,

ikk

u=,

Sk||

ik

*

w

p

ij

=1,wii=0,i=1, ,p.由以上可得

最后使用归一化公式将数据压缩至[0,1]区间,

xik=

u-min{u}k

ik ik

ik

权重计算方程为:

m1+m2+ +mp=1,

w11m1+w21m2+ +wp1mp=m1,

w1pm1+w2pm2+ +wppmp=mp,

mii.

max{u}-min{u}kk

ik

.(3)

第28卷 第3期 王 浩,等:改进模糊聚类算法及其在人力资源管理中的应用

表3

指标12345678910

知识水平1.280.801.120.960.640.961.601.120.961.12

79

通过求解线性方程组可得专家意见的权重向量

k,(m1,m2, ,mp).设第k个专家所确定的 值为

则利用求得的权重对专家意见进行综合评定确定

经过加权处理后的样本数据

工作能力1.801.201.201.401.201.401.601.601.201.40

道德水平1.201.051.050.751.051.201.050.601.051.05

团队精神0.901.350.900.901.201.051.050.601.201.50

业绩水平3.062.382.042.381.702.722.383.062.382.38

=

k=1

m .

k

k

p

设 将n个样本分为s个类,即s个模式,第l个模式所包含样本的集合为Ml,Ml中的样本数为Nl,第l个模式的第j个指标的平均值为

Modelj=

u M

i

u

l

ij

j

,

(5)

qNl

由式(1) (2)计算得标准化矩阵:

0.851.901.040.641.460.970.950.241.100.160.240.950.240.640.980.370 1.360.640.161.580.950.240.521.79

.

0.370 1.040.060.652.070.950.240.060.160.240.952.061.801.460.370.950.240.520.160.240 0.241.680.16由式(3)计算得归一化矩阵:0.331 0.420.330.800.400.500 0.600 0 0.500 0.330.500.070 0.580.330.500.730.500 0.271

.

0.070 0.420 0.301 0.500 0 0 0 0.501 1 0.800.070.500 0.270 0 0 0 0.930

利用式(4)求得相似矩阵,此时得到的相似矩阵具有自反性、对称性,但还不具有传递性,要对矩阵进行处理,令模糊矩阵自乘使其满足R*R=R时,R即为所求作.

内容需要下载文档才能查看

模糊相似矩阵为:

1 0.340.410.190.160.150.190.310.420

1 0.350.330.160.130.430.240.520.46

1 0.24

1

1

1 0.15

1

1

1 0.261

0.100.01

.

0.270.06

其中q为各指标满分数,第l个模式可表示为

Model=(Model1, ,Modelm).

设待测样本D=(d1, ,dm),对D处理得待测数据D =(d 1, ,d m)=(d1 1/q, ,dm m/q).将待测数据与数据库中的已分类的模式作比较,利用贴近度[4]的概念反映待测数据与第l个模式的贴近程度:

(D ,Model)=

(D Model+(1-D Model))/2,合间的外积,根据择近原则,设

max{(D ,Model)}=(D ,Modec),l

则可判断待测数据与第c个模式最接近,可从这一模式的整体情况进行预测.

(6)

其中, 表示模糊集合间的内积, 表示模糊集

3 实证分析

以某公司人才为例进行分析,利用层次分析法求得的各指标的相对权重见表1,表2为该公司10名人才的评价数据(各指标满分为10分),经过加权处理后的样本数据见表3.

表1 各指标的相对权重

指标权重

知识水平0.16

工作能力0.20

道德水平0.15

团队精神0.15

业绩水平0.34

表2 某公司10名人才的评价数据

指标12345678910

知识水平

85764610767

工作能力

9667678867

道德水平

8775787477

团队精神

69668774810

业绩水平

9767587977

0.360.580.190.060.290.160.110.310.070.600.350.040.300.250.15

0.300.220.090.120.050.16

内容需要下载文档才能查看

80

内容需要下载文档才能查看

足传递性的模糊相似矩阵为:

1 0.420.420.360.270.360.420.310.420.42

1 0.52

1

1 0.270.580.360.310.360.36

1 0.27

1

1 0.310.430.43

1

0.270.360.270.310.270.360.270.36

0.360.360.270.270.360.360.430.430.310.110.520.600.460.46

天津师范大学学报(自然科学版) 2008年7月

结合专家的意见确定 =0.4,则此时样本(人才)被分为4个模式,即模式1:{1,2,3,7,9,10};模式2:{4,6};模式3:{8};模式4:{5}.则由式(5)得各模式的平均指标见表5.

表5 各模式的平均指标

.

指标模式1模式2模式3模式4

知识水平工作能力0.120.140.100.140.110.160.060.12

道德水平团队精神

0.110.120.100.100.060.060.110.12

业绩水平

0.240.260.310.17

0.311

1

0.310.46

运用系统聚类的方法得到聚类树如图1.

待测数据D=(7,8,6,7,8)经处理后为D =(0.11,0.16,0.09,0.11,0.27).由式(6)得D 与各模式的贴近度见表6.

表6 D 与各模式的贴近度

模式

贴近度

模式10.565

模式20.580

模式30.590

模式40.530

由表6可知,待测人员数据与模式3的贴近度最大,说明他与模式3中的人员综合素质最接近.

4 小结

图1 聚类树

运用群决策确定 截集时,专家数量为4人,具体方程如下:

m1+m2+m3+m4=1,

0m1+0.4m2+0.25m3+0.1m4=m1,0.2m1+0m2+0.25m3+0.2m4=m2,0.4m1+0.5m2+0m3+0.7m4=m3,0.4m1+0.1m2+0.5m3+0m4=m4,求得4个专家意见的权重及他们的 取值见表4.

表4 4个专家意见的权重及 取值

专家1234

权重0.190.180.360.27

取值0.50.40.40.5

传统的模糊聚类分析在对一些模糊性或不确定性问题的研究中有着十分显著的优势,但其在现实应用中都没有考虑不同因素对所分析问题的重要性以及各因素之间的相关性.本研究通过层次分析法对多个指标进行加权来体现各指标不同的重要性程度,同时引入Mahalanobis距离消除各指标间的相关性影响,对传统的模糊聚类分析算法进行了改进,使模型能够更加准确地反映人力资源管理的现实问题.参考文献:

[1] 肖进,贺昌政,杨华.人力资源绩效考核分析[J].商业研究,

2005(21):123-127.

[2] 胡洁纹,魏军,胡涛.模糊数据挖掘算法在人力资源管理中的

应用[J].计算机与数字工程,2002,30(5):25-29.[3] 李怀祖.决策理论导引[M].北京:机械工业出版社,1993.[4] 常大勇,张丽丽.经济管理中的模糊数学方法[M].北京:北

京经济学院出版社,1995.

(责任编校马新光)

(上接第76页)参考文献:

[1] 魏权龄.评价相对有效性的DEA方法 运筹学的新领域[M].

北京:中国人民大学出版社,1988.

[2] 杜栋,庞庆华.现代综合评价方法与案例精选[M].北京:

清华大学出版社,2005.

[3] KattaGMutry.LinearProgramming[M].NewYork:John

Wiley&SonsInc,1983.

[4] 天津市科学技术委员会,天津市统计局,天津市教育委员会.

天津科技统计年鉴(2001-2007)[M].北京:中国统计出版社,2008.

[5] 吴文江,用数据包络分析研究规模收益分析[J].系统工程理

论与实践,2001,21(9):85-89.

[6] 郭立夫,李北伟.决策理论与方法[M].北京:高等教育出版社,

2005.

(责任编校马新光)

版权声明:此文档由查字典文档网用户提供,如用于商业用途请与作者联系,查字典文档网保持最终解释权!

下载文档

热门试卷

2016年四川省内江市中考化学试卷
广西钦州市高新区2017届高三11月月考政治试卷
浙江省湖州市2016-2017学年高一上学期期中考试政治试卷
浙江省湖州市2016-2017学年高二上学期期中考试政治试卷
辽宁省铁岭市协作体2017届高三上学期第三次联考政治试卷
广西钦州市钦州港区2016-2017学年高二11月月考政治试卷
广西钦州市钦州港区2017届高三11月月考政治试卷
广西钦州市钦州港区2016-2017学年高一11月月考政治试卷
广西钦州市高新区2016-2017学年高二11月月考政治试卷
广西钦州市高新区2016-2017学年高一11月月考政治试卷
山东省滨州市三校2017届第一学期阶段测试初三英语试题
四川省成都七中2017届高三一诊模拟考试文科综合试卷
2017届普通高等学校招生全国统一考试模拟试题(附答案)
重庆市永川中学高2017级上期12月月考语文试题
江西宜春三中2017届高三第一学期第二次月考文科综合试题
内蒙古赤峰二中2017届高三上学期第三次月考英语试题
2017年六年级(上)数学期末考试卷
2017人教版小学英语三年级上期末笔试题
江苏省常州西藏民族中学2016-2017学年九年级思想品德第一学期第二次阶段测试试卷
重庆市九龙坡区七校2016-2017学年上期八年级素质测查(二)语文学科试题卷
江苏省无锡市钱桥中学2016年12月八年级语文阶段性测试卷
江苏省无锡市钱桥中学2016-2017学年七年级英语12月阶段检测试卷
山东省邹城市第八中学2016-2017学年八年级12月物理第4章试题(无答案)
【人教版】河北省2015-2016学年度九年级上期末语文试题卷(附答案)
四川省简阳市阳安中学2016年12月高二月考英语试卷
四川省成都龙泉中学高三上学期2016年12月月考试题文科综合能力测试
安徽省滁州中学2016—2017学年度第一学期12月月考​高三英语试卷
山东省武城县第二中学2016.12高一年级上学期第二次月考历史试题(必修一第四、五单元)
福建省四地六校联考2016-2017学年上学期第三次月考高三化学试卷
甘肃省武威第二十三中学2016—2017学年度八年级第一学期12月月考生物试卷

网友关注视频

8 随形想象_第一课时(二等奖)(沪教版二年级上册)_T3786594
外研版英语三起6年级下册(14版)Module3 Unit1
苏科版数学八年级下册9.2《中心对称和中心对称图形》
外研版英语三起6年级下册(14版)Module3 Unit2
第五单元 民族艺术的瑰宝_16. 形形色色的民族乐器_第一课时(岭南版六年级上册)_T3751175
沪教版牛津小学英语(深圳用) 四年级下册 Unit 7
外研版英语七年级下册module3 unit1第二课时
外研版英语七年级下册module3 unit2第一课时
【部编】人教版语文七年级下册《泊秦淮》优质课教学视频+PPT课件+教案,广东省
【获奖】科粤版初三九年级化学下册第七章7.3浓稀的表示
沪教版牛津小学英语(深圳用) 四年级下册 Unit 3
沪教版牛津小学英语(深圳用) 四年级下册 Unit 8
冀教版小学数学二年级下册第二周第2课时《我们的测量》宝丰街小学庞志荣
沪教版牛津小学英语(深圳用) 五年级下册 Unit 7
化学九年级下册全册同步 人教版 第18集 常见的酸和碱(二)
二年级下册数学第一课
青岛版教材五年级下册第四单元(走进军营——方向与位置)用数对确定位置(一等奖)
冀教版小学英语四年级下册Lesson2授课视频
3.2 数学二年级下册第二单元 表内除法(一)整理和复习 李菲菲
精品·同步课程 历史 八年级 上册 第15集 近代科学技术与思想文化
冀教版小学英语五年级下册lesson2教学视频(2)
七年级英语下册 上海牛津版 Unit3
第五单元 民族艺术的瑰宝_15. 多姿多彩的民族服饰_第二课时(市一等奖)(岭南版六年级上册)_T129830
二年级下册数学第三课 搭一搭⚖⚖
苏科版八年级数学下册7.2《统计图的选用》
北师大版数学 四年级下册 第三单元 第二节 小数点搬家
六年级英语下册上海牛津版教材讲解 U1单词
【部编】人教版语文七年级下册《老山界》优质课教学视频+PPT课件+教案,安徽省
苏科版数学 八年级下册 第八章第二节 可能性的大小
七年级下册外研版英语M8U2reading