血常规数据挖掘对白血病的初筛作用_赵华
上传者:孟吉红|上传时间:2017-06-06|密次下载
血常规数据挖掘对白血病的初筛作用_赵华
第36卷第3期2013年
JournalofLuzhouMedicalCollegeVol.36No.32013泸州医学院学报251
论著
血常规数据挖掘对白血病的初筛作用
赵华,李代渝1,蒋大勇2
(泸州医学院:附属医院检验科;1附属医院输血科;2检验系,四川泸州646000)
摘要目的:根据血常规检验的结果并结合临床信息进行数据挖掘,预测各型白血病发生率,提高血常规数据对白血病初筛作用的价值。方法:对泸州医学院1328份血常规26项指标进行回顾性分析;结合医院信息系统(HIS)与实验信息系统(LIS)信息,运用SPSS11.0统计软件构建评估白血病ROC数据集,并建立可行人工神经网络模型(ANN);验证模型可行性。用验后概率来解释血常规检验结果。结果:血常规中26项检测指标中,对白血病有评估意义的ROC数据集(P<0.05)是HGB(P=6.95E-23)、PLT(P=1.79E-16)、IG%(P=7.24E-15)、MONO(P=1.47E-12)、EOS(P=1.03E-08)、LYM(P=1.81E-06)、PCT(P=4.68E-05)。其中HGB、PLT、IG%、MONO等P值最小对临床筛查白血病具有明显的价值,以P<0.05的指标建立的人工神经网络筛检模型,用验后概率来解释血常规结果。结论:用血常规检验结果对白血病筛检进行数据挖掘,建立评估模型,为初筛白血病提供了重要的检验数据。
关键词血常规;数据挖掘;人工神经网络模型(ANN);白血病初筛
中图分类号R446文献标识码Adoi:10.3969/j.issn.1000-2669.2013.03.013
Reportofbloodroutinedataminingforearlyscreeningofleukemia
ZhaoHua,LiDaiyu1,JiangDayong2
DepartmentofClinicalLaboratory,1DepartmentofBloodTransfusion,theAffiliatedHospitalofLuzhouMedicalCollege;2DepartmentofInspection,LuzhouMedicalCollege
AbstractObjective:Tominethebloodroutinedatacombinedwithclinicalinformationforimprovingthevalueofbloodroutinedatatoscreenearlyleukaemiaandpredictingitsincidence.Methods:Basedonretrospectiveanalysisof26indexesof1328bloodroutinedata,combinedwiththeinformationoftheexperimentinformation4system(LIS)andthehospitalinformationsysem(HIS),SPSS11.0wasusedtoconstructreceive-roperatingcharacteristiccurvedatasetforevaluatingleukamia,andbuildartificialneuralnetwork(ANN)modelforcheckingthefeasibility.Results:Among26indexesofbloodroutinetest,theROCdatasetwithleukemia-evaluatingsignificance(P<0.05)wasNEU(6.95E-23),LYM(1.79E-16),EOS(7.24E-15),IG%(1.47E-1),MONO(1.03E-08),PLT(1.81E-06),PCT(4.68E-05),HGB(0.0015),PDW(0.0063),andRBC(0.0075).Conclusion:Combinedwithroutineanalysisofbloodandclinicaldatamining,anevaluationmodelisestablishedfortheinitialscreeningofleukemia.
KeywordsBloodroutine;Datamining;ANNmodel;Earlyleukaemiascreen
白血病是造血系统的恶性肿瘤,是国内十大高
发恶性肿瘤之一,占肿瘤发病率的第六位,在儿童和挖掘,运用SPSS11.0统计软件构建评估白血病ROC数据集,并建立可行人工神经网络模型
(ANN),更好地给临床提供白血病初筛查的有用数
据。35岁以下的人群中占首位[1]。其严峻形势已让白血病成为临床研究和治疗的重点对象。广为接受而又
最少争议的诊断方法是骨髓穿刺细胞学镜检[2]、免疫
学、细胞遗传学、分子生物学(MICM)。但是骨髓穿刺
毕竟具有创伤性不适合对白血病的筛检,血常规检
查标本来源简单,提供的数据信息对白血病筛检具
有重要意义。本文即对血常规五分类结果进行数据
作者简介:赵华(1958-),女,主任技师1材料和方法1.1材料1.1.1仪器系日本SysmexXE2000i五分类全自动血球分析仪[3],配套试剂均有日本Sysmex公司提供。实验期
252
间仪器高、中、低质控均在控。
第36卷第3期2013年
JournalofLuzhouMedicalCollegeVol.36No.32013泸州医学院学报
和“0”作为输出赋值。应用模型仿真计算上述检验数据的预测输出值,预测输出值同方法1.2.1制作
1.1.2信息系统
医院信息系统(HIS)与实验信息系统(LIS)信息。
ROC曲线。1.2.3临床实践
患病率即验前概率由标本来源决定,即为
1.1.3模型框架
SPSS11.0统计软件和人工神经网络模型。以上
两种方法已广泛用于大量数据的统计与处理。
0.15813(210/1328)。根据以下公式计算其阳性预测值
(可视为验后概率)。
患病率灵敏度
验后概率(PPV)=患病率灵敏度+(1-患病率)(1-特异度)根据患者“血常规”检测结果计算针对白血病方面的咨询用验后概率解释报告,并进行随访。
1.1.4标本选择
纳入标准临床诊断明确系我院(2011年1月1日至2012年1月1日)入院第一次检测HGB100g/L,
PLT109/L且临床诊断明确的血常规结果,共计1328例。纳入统计病例为2245例,排除病例为917
例。按照张之南血液病诊断及疗效第三版[4]分组:“1”组为白血病210例。“0”组为其它疾病1118例。
2实验结果
2.1白血病组与其它疾病组“血常规检查”统计结果
和ROC曲线(表1,图1)
1.2方法1.2.1价值评估
将纳入统计的1328份病例的分组信息和26项血常规检查结果数据制作ROC曲线分析,输出
AUC,按照AUC大小排序。ROC曲线的灵敏度计算
如下。
灵敏度=真阳性率=特异度=1-假阳性率=1-1.2.2模型建立及验证
人工神经网络BP插件NNX2.0的输入节点为
AUC具有显著性意义(P<0.05)的项目[4],分组数值“1”
图126项血常规检查ROC曲线
表1血常规26项白血病组与其它疾病组平均值比较和ROC分析(P<0.05)
检测项目
面积
标准误
P值6.95E-231.79E-167.24E-151.47E-121.03E-081.81E-064.68E-050.0015310380.0063860140.0075623438
95%
可性线
下线值
上线值
HGBPLTIG%MONOEOSLYMPCTNEUPDWRBC
0.2869490.6781460.3316950.6530970.3761540.3967280.4119280.4314520.4410020.442219
0.0231590.0234850.02190.0235880.0285050.0205450.0218220.0211990.0210030.022213
0.2415590.6321170.2887730.6068660.3202850.3564610.3691580.3899020.3998360.398682
0.3323390.7241750.3746170.6993290.4320220.4369960.4546980.4730020.4821680.485756
2.2血常规10项参数对白血病的初筛人工神经网
络诊断模型
根据ROC分析具有统计学意义的HGB、PLT、
IG%、MONO、EOS、LYM、PCT、NEU、PDW和RBC共10个参数作为人工神经网络诊断模型的输入节点。
建模参数:输入节点10,隐含层4层分别为10、8、4、
第3期赵华等:血常规数据挖掘对白血病的初筛作用
253
表3ANN模型预测白血病的ROC数据集临界值
灵敏度
特异性阳性预测值
验后概率/验前概率
1个节点,输出节点1。训练参数:样本数1328,起始
行号2,起始列号2,训练次数500,常规计算。训练后误差推移见图2,存储为matlab文件。10个参数和
ANN模型的ROC曲线图见图2。ANN模型和其它项
目的AUC见表2和图3。存储ANN诊断模型对白血病疾病的ROC数据集部分数据见表3(包含灵敏度和特异度)。
学习误差推移
2502001501005000
50
100150
200250
300350
400450500
0.0016117060.0049434260.0101420950.0105486790.0113993220.0120033010.0134461080.0147394110.0150203450.015651440.0156566710.016111879
0.6980.6890.6790.670.670.6650.6460.6230.6130.5520.5520.528
0.9910.9880.9760.9680.9470.9250.8740.8120.7860.7240.7230.693
0.2690.4160.4210.4250.4180.4150.4110.2430.4510.2120.2120.41
1.7032.6342.6642.6912.6482.6262.6041.5382.8541.341.3422.598
学习步数
图2ANN误差推移图
表2ANN模型及其10个参数的AUC
检测项目
面积
标准误
2.3临床实践
依据ANN模型对血常规检查与白血病方面的
上线值
P值000000.0080.002000.0060
95%可性线
下线值
报告咨询过程:①提取病人信息:包括通过电子病历、HIS、LIS、临床医师、病人等多途径获得病历信息和检验结果;②该检验报告的可信程度和异常情况评估,例如相关指标有无干扰和异常;③将有意义的指标输入ANN模型,仿真计算预测输出值[5];④假定该预测输出值为CUTOFF,查阅ANN模型的ROC数据集,得到其灵敏度、假阳性率和阳性预测值,用验后概率或验后概率与验前概率比值解释[6]该血常规报告预测白血病的意义和价值;⑤随访。
举例说明血常规报告解读过程:罗某,女,3岁,
HGBPLTIG%MONOEOSLYMPCTNEUPDWRBC
0.3680.0230.6780.0230.3760.0290.3320.0220.6530.0240.4430.0220.4320.0210.3960.0210.4120.022
0.3220.6320.320.2890.6070.3990.3910.3560.3690.40.241
0.4140.7240.4320.3750.6990.4860.4740.4360.4550.4820.332
0.4410.021
预测输出0.2870.023
NEU:0.1,LYM:0.5,MONO:0.09,EOS:0,IG%:0,RBC:3.17,HGB:90,PLT:62,PCT:0.07,PDW:16.3;①患者
为本院血液内科病人并第一次做血常规检验,符合诊断模型适用范围,入院诊断:“重度贫血?”;②ANN模型预测输出值:0.152;③以ANN预测输出值
0.152为诊断阈值时,查表3,验后概率为0.451,验
后概率与验前概率之比为2.854,即该病人白血病的概率比其他病人高2.854倍;⑤随访:最后诊断为急性白血病。
3讨论
本实验结论显示:血常规中26项检测指标中,对白血病有评估意义指标是HGB(P=6.95E-23)、
PLT(P=1.79E-16)、IG%(P=7.24E-15)、MONO(P=1.47E-12)、EOS(P=1.03E-08)、LYM(P=1.81E-06)、PCT(P=4.68E-05)。其中HGB、PLT、IG%、MONO等P值最小对临床筛查白血病具有明显的价值。
图3ANN和10个参数的ROC曲线
白血病本身发病原因和过程至今还无准确定
254
论,单纯依靠血常规数据分析不能准确诊断白血病及其分型和分期。如本文临床实践中白血病病人血常规数据异常其患白血病的概率比其他病人高
第36卷第3期2013年
JournalofLuzhouMedicalCollegeVol.36No.32013泸州医学院学报
的桥梁,需要说明的是由于收集数据标本有限,共收集1328份,标本量的多少对数据统计和处理有一定影响[9],在今后的数据挖掘研究中,增加标本量和实验数据收集的条件,以使结果更具有说服力和准确性。
参考文献
1.2.
郭霞,李强.急性白血病发病机制研究进展[J].实用儿科临床杂志,2005,20(7):690~693
2.854,这就为临床医生在诊断白血病过程中提供了
重要的筛检数据,根据临床表现,及时对病人进行骨髓细胞学、免疫学、细胞遗传学、分子生物学[7]等检查达到准确诊断,早期治疗提高缓解率和治愈率。
在进行数据挖掘过程中,由于采用概率论原理,因而数据的采集、纳入标准、排除标准、项目取舍、预测/诊断/评估模型的适用范围显得非常重要,从数据挖掘、建立模型、移动阈值和报告解读方面着手,试图从技术层面推动医学检验向检验医学学科发展。否则将会导致错误结论。SPSS软件处理数据结果,不仅准确有效,同时对于输出结果用于实际研究具有不可替代的实用性;人工神经网络是一种大规模并行非线性处理系统,它根据数据本身的内在联系进行建模,其抗干扰能力、适应性、自学习能力很好,是一种反向传递并能自行修正误差的多层映射网络,不仅可以逼近任意一个连续函数,而且能够收敛到较小的均方差[8]。本文采用以上分析手段,进一步保证了数据结果的可靠性,保证了用于实验室研究的准确性。
本实验是通过收集收集2011一年中住院病人的血常规检查数据,且血常规条件满足HGB100g/L,
[6]
ShenZX,ShiZZ,FangJ,etal.All-transretinoicacid/As203combinationyieldsahighqualityremissionandsurvivalinnewlydiagnosedacutepromyelocyticleukemia
[J].ProcNatlAcadSciUSA,2004,101(15):28~35
3.4.5.6.7.8.9.
姚立腾,叶秀娟.两台血细胞分析仪性能评估与结果对比
[J].国际检验医学杂志,2011,19(32):2255~2257
张之南,沈悌.血液病诊断及疗效标准[M].第3版.北京:科学出版社,2007,8:150~230
于长春,贺佳,范思昌,等.数据挖掘技术在医学领域的应用[J].第二军医大学学报,2003,24(11):1250~1252郑旅芳,王开正.血清胃肠肿瘤标志物诊断大肠癌的数据挖掘[J].现代检验医学杂志,2010,25(2):270~272
LewisSM,EnglandJM,RowanRM,etal.Standardizationforhaemocytometry[J].Labpract,1998,38(3):68~69
崔雷.医学数据挖掘[M].北京:高等教育出版社,2006:
50~53
王开正,陶华林主编.检验医学信息学[M].成都:四川科学技术出版社,2010,2:180~185
(2013-01-08收稿)
PLT10/L,通过本医院的LIS和HIS系统,再结
9
合数据分析软件得出结论。提炼成为有临床价值的重要信息是检验医学临床实践的关键为临床疾病研究探明了方向,对检验工作与临床结合搭建了连接
作者投稿系统http://www.wendangwang.com/
下载文档
热门试卷
- 2016年四川省内江市中考化学试卷
- 广西钦州市高新区2017届高三11月月考政治试卷
- 浙江省湖州市2016-2017学年高一上学期期中考试政治试卷
- 浙江省湖州市2016-2017学年高二上学期期中考试政治试卷
- 辽宁省铁岭市协作体2017届高三上学期第三次联考政治试卷
- 广西钦州市钦州港区2016-2017学年高二11月月考政治试卷
- 广西钦州市钦州港区2017届高三11月月考政治试卷
- 广西钦州市钦州港区2016-2017学年高一11月月考政治试卷
- 广西钦州市高新区2016-2017学年高二11月月考政治试卷
- 广西钦州市高新区2016-2017学年高一11月月考政治试卷
- 山东省滨州市三校2017届第一学期阶段测试初三英语试题
- 四川省成都七中2017届高三一诊模拟考试文科综合试卷
- 2017届普通高等学校招生全国统一考试模拟试题(附答案)
- 重庆市永川中学高2017级上期12月月考语文试题
- 江西宜春三中2017届高三第一学期第二次月考文科综合试题
- 内蒙古赤峰二中2017届高三上学期第三次月考英语试题
- 2017年六年级(上)数学期末考试卷
- 2017人教版小学英语三年级上期末笔试题
- 江苏省常州西藏民族中学2016-2017学年九年级思想品德第一学期第二次阶段测试试卷
- 重庆市九龙坡区七校2016-2017学年上期八年级素质测查(二)语文学科试题卷
- 江苏省无锡市钱桥中学2016年12月八年级语文阶段性测试卷
- 江苏省无锡市钱桥中学2016-2017学年七年级英语12月阶段检测试卷
- 山东省邹城市第八中学2016-2017学年八年级12月物理第4章试题(无答案)
- 【人教版】河北省2015-2016学年度九年级上期末语文试题卷(附答案)
- 四川省简阳市阳安中学2016年12月高二月考英语试卷
- 四川省成都龙泉中学高三上学期2016年12月月考试题文科综合能力测试
- 安徽省滁州中学2016—2017学年度第一学期12月月考高三英语试卷
- 山东省武城县第二中学2016.12高一年级上学期第二次月考历史试题(必修一第四、五单元)
- 福建省四地六校联考2016-2017学年上学期第三次月考高三化学试卷
- 甘肃省武威第二十三中学2016—2017学年度八年级第一学期12月月考生物试卷
网友关注
- 电影调侃语的常用技巧——以冯小刚的电影为例
- 浅析社会主义市场经济下的生态文明建设_张克克
- religiousca
- 人民币的学问
- 大历史的失踪者
- 对中华民族伟大复兴“中国梦”的十点理解
- 破茧为出蚕
- 论政府公信力的提高
- 分形理论:非线性科学哲学观和方法论综述
- 《肖申克的救赎》影评:不放弃,不怯懦
- “翠微”原来是山腰
- 《幸福终点站》影评:幸福就在偶然间
- 从人类航天科技发展的角度思索人与自然的关系
- 安庆市十一五期间经济分析
- 非政府组织对社会资本构建的作用
- 爱心人士捐助
- 把权力关进制度笼子里论 文
- 大学生网购问卷调查统计分析
- 大学生对环境污染认知的调查分析
- 碎矿运输作业区柴树林等3人群体违章分析报告
- 2014-2015年度福建省少先队辅导员网络培训在线考试4
- 《音乐会》影评:一曲战斗民族的赞歌
- 2012_MOOC元年_蔡文璇
- 泰国退休签证
- 大数据及其科学问题与方法的探讨
- 18世纪末英国工人阶级激进主义运动_刘金源
- EJ1013931
- 关于现阶段我国政府公信力缺失的思考
- 2008年9月15日
- 电商务服务商评价选择的问卷调查
网友关注视频
- 化学九年级下册全册同步 人教版 第22集 酸和碱的中和反应(一)
- 化学九年级下册全册同步 人教版 第18集 常见的酸和碱(二)
- 冀教版小学数学二年级下册第二单元《有余数除法的竖式计算》
- 【部编】人教版语文七年级下册《泊秦淮》优质课教学视频+PPT课件+教案,天津市
- 北师大版数学四年级下册第三单元第四节街心广场
- 沪教版牛津小学英语(深圳用) 四年级下册 Unit 7
- 冀教版英语四年级下册第二课
- 外研版英语三起6年级下册(14版)Module3 Unit1
- 【部编】人教版语文七年级下册《逢入京使》优质课教学视频+PPT课件+教案,安徽省
- 【部编】人教版语文七年级下册《老山界》优质课教学视频+PPT课件+教案,安徽省
- 七年级英语下册 上海牛津版 Unit5
- 冀教版小学数学二年级下册第二周第2课时《我们的测量》宝丰街小学庞志荣
- 青岛版教材五年级下册第四单元(走进军营——方向与位置)用数对确定位置(一等奖)
- 第4章 幂函数、指数函数和对数函数(下)_六 指数方程和对数方程_4.7 简单的指数方程_第一课时(沪教版高一下册)_T1566237
- 冀教版英语三年级下册第二课
- 【部编】人教版语文七年级下册《老山界》优质课教学视频+PPT课件+教案,安徽省
- 第8课 对称剪纸_第一课时(二等奖)(沪书画版二年级上册)_T3784187
- 沪教版牛津小学英语(深圳用) 四年级下册 Unit 4
- 沪教版八年级下册数学练习册20.4(2)一次函数的应用2P8
- 第19课 我喜欢的鸟_第一课时(二等奖)(人美杨永善版二年级下册)_T644386
- 外研版英语七年级下册module3 unit2第一课时
- 小学英语单词
- 第五单元 民族艺术的瑰宝_16. 形形色色的民族乐器_第一课时(岭南版六年级上册)_T1406126
- 外研版英语七年级下册module3 unit1第二课时
- 【部编】人教版语文七年级下册《泊秦淮》优质课教学视频+PPT课件+教案,广东省
- 沪教版牛津小学英语(深圳用) 六年级下册 Unit 7
- 【部编】人教版语文七年级下册《泊秦淮》优质课教学视频+PPT课件+教案,辽宁省
- 30.3 由不共线三点的坐标确定二次函数_第一课时(市一等奖)(冀教版九年级下册)_T144342
- 3月2日小学二年级数学下册(数一数)
- 北师大版数学四年级下册3.4包装
精品推荐
- 2016-2017学年高一语文人教版必修一+模块学业水平检测试题(含答案)
- 广西钦州市高新区2017届高三11月月考政治试卷
- 浙江省湖州市2016-2017学年高一上学期期中考试政治试卷
- 浙江省湖州市2016-2017学年高二上学期期中考试政治试卷
- 辽宁省铁岭市协作体2017届高三上学期第三次联考政治试卷
- 广西钦州市钦州港区2016-2017学年高二11月月考政治试卷
- 广西钦州市钦州港区2017届高三11月月考政治试卷
- 广西钦州市钦州港区2016-2017学年高一11月月考政治试卷
- 广西钦州市高新区2016-2017学年高二11月月考政治试卷
- 广西钦州市高新区2016-2017学年高一11月月考政治试卷
分类导航
- 互联网
- 电脑基础知识
- 计算机软件及应用
- 计算机硬件及网络
- 计算机应用/办公自动化
- .NET
- 数据结构与算法
- Java
- SEO
- C/C++资料
- linux/Unix相关
- 手机开发
- UML理论/建模
- 并行计算/云计算
- 嵌入式开发
- windows相关
- 软件工程
- 管理信息系统
- 开发文档
- 图形图像
- 网络与通信
- 网络信息安全
- 电子支付
- Labview
- matlab
- 网络资源
- Python
- Delphi/Perl
- 评测
- Flash/Flex
- CSS/Script
- 计算机原理
- PHP资料
- 数据挖掘与模式识别
- Web服务
- 数据库
- Visual Basic
- 电子商务
- 服务器
- 搜索引擎优化
- 存储
- 架构
- 行业软件
- 人工智能
- 计算机辅助设计
- 多媒体
- 软件测试
- 计算机硬件与维护
- 网站策划/UE
- 网页设计/UI
- 网吧管理