教育资源为主的文档平台

当前位置: 查字典文档网> 所有文档分类> 工程科技> 兵器/核科学> 基于数字图像识别的算法设计_吴元林

基于数字图像识别的算法设计_吴元林

上传者:司虎
|
上传时间:2015-05-05
|
次下载

基于数字图像识别的算法设计_吴元林

图像;识别;视觉

内容需要下载文档才能查看

基于数字图像识别的算法设计

华北电力大学自动化系 吴元林 金秀章

【摘要】本文以数字识别系统的基本流程为主线,从数据的提取与预处理、特征的提取与选择,到分类器的设计等部分都进行了较为详尽的分析与研究。着重研究了几个主要的用于分类的算法如最小距离法、近邻法、K-近邻法和BP神经网络,并通过MATLAB仿真实验分析了不同算法的识别率。为工程应用提供了可靠的理论依据和实际的使用经验。

【关键词】最小距离法;近邻法;K-近邻法;BP神经网络

1.引言

模式识别是人类的一项基本智能,人们每时每刻都在进行着“模式识别”。随着计算机技术的普及和发展,让计算机拥有识别能力收到越来越多的研究学者的重视,也是人工智能和机器人技术发展的前提。

模式识别是指对表征事物或现象的各种形式的(数值的、文字的和逻辑关系的)信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程,是信息科学和人工智能的重要组成部分[1]。生活中最简单的事物无过于简单的数字0-9,同时,数字在各个方向领域应用广泛,如:车牌识别,邮政编码识别等。因此,数字字符识别是一项有实际应用的课题。

2.数字识别基本步骤

数字识别是通过读取所需识别的数字图片的特征值输入到某个已经定义好的识别算法中进行识别,并输出识别结果,其基本步骤如图2-1所示。

如图2-1所示,数字识别步骤主要有:数据提取、数据预处理、特征值提取和选择以及分类器和分类决策。下面分别对这几个步骤进行分析。

2.1 数据提取

本文所处理的为0-9的灰度图片,总共有400组图片,分为0-9的数字十组,每组40个,分为30个训练样本和10个测试样本。本文借助matlab软件自带的imread函数和dir函数对“数字”文件夹下的所有图片进行读取,获得一个包含图片数据的36*20*40*10的四维数组。每幅图片的数据为36*20的数据矩阵。

2.2 预处理

内容需要下载文档才能查看 内容需要下载文档才能查看

图2-1?数字识别步骤图2-2?图像预处理

应操作,以便使处理时间和正确率两者结合起来。一般而言,预处理的目的是为了去除图像中所包含的干扰噪声,增强有用信息,对退化的信息进行复原。图像预处理包含以下一系列操作:图像去噪处理、图像二值化处理、分割处理和归一化处理等。具体步骤如图2-2所示。

2.2.1 二值化

一般设备读取得到的数字图像均为灰度图像,需对其进行二值化处理,使之变为仅含黑(1)、白(0)两种颜色的二值图像,这对于加强图像对比具有很好的效果。二值化后的图像其字符与背景对比更为强烈,更加突显字符的结构特征。对灰度图像二值化能减小数据存储的容量,降低处理的复杂性。对数字字符图像二值化,要求二值化后的图像能真实地再现原本数字,要求笔画中不出现空白点,并且二值化的笔画基本保持原来文字的结构特征。本文采用matlab自带的二值化处理函数:im2bw,阙值选择0.5。

2.2.2 去噪处理

噪声的存在恶化了图像质量,使图像模糊,更严重的甚至是图像的特征完全被淹没,以致于给图像识别和分析带来了困难。因此,对图像进行去噪处理是为了去除图像中包含的干扰噪声,加强图像有用信息的对比,为获取更好的特征值打下良好的基础。

2.2.3 分割和归一化

为了得到每个图像的特征,需要对二值矩阵进行分割和归一化。图像分割算法一般是基于亮度值的两个基本特性之一:不连续性和相似性。第一类性质的应用途径是基于亮度的不连续变化分割图像,比如图像的边缘。第二类性质的主要应用途径是依据事先制定的准则将图像分割为相似的区域。图像分割是大多数识别步骤中的一个基本的预备性步骤。选择一种分割技术而不选择另一种主要是由所面对问题的特点决定的[2]。本文针对数字图像的特性:阿拉伯数字不存在左右型和上下型结构,每个数字都是独立的个体,所以在分割时可先进行行切分,再进行列切分。初次切分是把矩阵按行分成两部分,列分成两部分。针对错误率后期再进行优化。

2.3 特征值提取与选择

特征值的提取与选择主要是针对已经分割好的矩阵块进行特征值的统计,其主要目的是从分析数字的拓扑结构入手,把它的某些结构特征提取出来,使数字的位移、大小变化、字形畸变等干扰相对减

作者简介:

王健(1965—),男,辽宁沈阳人,硕士,沈阳化工大学信息工程学院副教授,研究方向:微机电系统设计。

小,而把那些反映数字特征的关键信息提供给分类器。特征的选择一般有以下原则:首先是充分性原则,即所抽取的特征要能充分保持原模式的信息量;其次在满足充分性的基础上,尽量减小特征维数;此外,抽取特征时所花费的计算量不能太大,否则将影响识别速度。本文就实际情况,统计分割后的每个矩阵块中的黑像素的数量作为该矩阵块的特征值,并以此作为表征该图像的特征值。

3.数字识别方法

从模式识别作为一项学科开始至今,研究学者们提出了各种各样的识别方法。本文主要针对最小距离法、近邻法、K-近邻法和BP神经网络进行了理论研究,并通过matlab进行实验分析。

3.1 最小距离法

最小距离法是一种简单的模式识别方法,它基于对模式的采样来估计各类模式的统计参数并完全由各类的均值和方差确定。当两类均值间的距离比类中对应均值的分布要大时,最小距离分类器能很好地工作。

最小距离法在程序实现中可以直接求取待测试样本与各模式样本均值之间的距离,并将待测样本归为距离最小的一类模式中。

3.2 近邻法

最小距离法是一种简单而直观的模式识别方法。然而,当各模式样本的均值(“代表点”)无法很好的代表各个模式的情况下,结果会使得所设计的分类器出现较大的错误率。

近邻法[3]是Cover和Hart针对该问题而提出来的,为了更好的代表各个模式类别,一种极端的方法是将模式类别中的所有样本作为“代表点”,并将待测试样本归为距离最小的一类模式中。

假设有c个类别w1,w2,L,wc的模式识别问题,每类有样本Ni个,i=1,2,L,c,规定wi的判别函数为:

f(x)=minx?x k=1,2,LN

(3-1)

其中x的角标i表示wi类,k表示wi类Ni个样本中的第k个。则可得决策规则如下:

gj(x)=minfi(x) i=1,2,L,c

(3-2)i

则决策:x∈wj

这一决策为最近邻法,对未知样本x,我们只要比较x与N=∑N个已知样本的距离,并决策x为与离它最近的样本同类。

3.3 K-近邻法

k-近邻法是上节近邻法的一种推广形

i

k

ki

i

ki

c

=1

应用[J].中国电力教育,2012,31:50-51.

[6]Hastings,A.模拟电路版图的艺术[M].北京:电子工业出版社,2008.

张大为(1983—),男,辽宁沈阳人,硕士,沈阳航空职业技术学院讲师,研究方向:电路设计。徐洪伟(1990—),男,内蒙古赤峰人,学士,现就读于沈阳化工大学2009级电子科学与技术专业。

-3-

内容需要下载文档才能查看

图像;识别;视觉

内容需要下载文档才能查看 内容需要下载文档才能查看

基于云平台的移动应用软件智能监控与支撑技术研究

中国移动天津公司 张恩海 王 铎

【摘要】本文针对当前移动智能终端上第三方应用软件存在的诸多问题,提出了构建移动应用软件智能监控系统的解决方案。该系统充分结合了移动互联网技术、移动智能终端技术。通过分析云计算的强大优势作用,依托于云平台,实现智能监控系统高效的后端数据处理,使得系统可以发挥出最佳性能。同时,通过对监控数据进一步分析可以在一定程度上为决策者提供决策依据。【关键词】云计算;云平台;移动应用软件;智能监控

1.引言

随着互联网的发展,作为信息技术变革的焦点和热点,云受到了越来越多的重视。云是一种广泛的概念,它可以包罗万象,但这种包罗万象是以互联网为基础的,即云是整合了互联网资源,互联网服务,并将其作为一个庞大的整体提供给接入互联网的用户使用。通过云的整合,用户能够仅以低廉的成本享用高速的计算能力、海量的数据存储、分布式软件及硬件基础设施[1]。云同时也赋予了用户与互联网资源在交互层面上更多的移动性,用户将个人生活办公资料同步到云端,即可随时随地选择多种设备使用存储的内容[2],摆脱物理位置的约束。因此,随着云的发展,云将为工作方式、企业的商业模式乃至国家战略产业带来极大的变革。

基于互联网云的云计算将信息处理迁移到云端。云计算包含几个层次的服务,主要分为IaaS、PaaS、SaaS,分别为基础设施即服务、平台即服务、软件即服务[3][4]。IaaS为用户提供了网络可以互联的基本计算资源,例如物理及虚拟计算机、云存储设备等等,用户可以从巨大的设施资源库中制定个性化订单,并依据使用的资源数量付费,降低了IT开发者管理者的劳动复杂度,以及较大幅度削减了成本。PaaS在平台基础上提供服务[5],通过云平台开发者可以进行应用开发,在线部署和测试应用程序的功能,并可以对应用进行监控,为开发者节约了许多配置基础环境的时间并提高了软件开发的效率。SaaS通过云向最终的用户提供软件的使用权,用户无需式,与近邻法的区别在于,近邻法决策x为与离它最近的样本同类,而k-近邻法则取未知样本的k个近邻,并将x归为k个近邻中多数的一类。k-近邻法可以避免在样本中出现另类的样本点时的识别错误,但同时,也是以增加计算量为代价的。

3.4 BP神经网络

由BP(Back Propagation)神经网络的英文名称可以看出BP神经网络的主要思想:输入学习样本,使用反向传播算法对网络的权值和偏差进行反复的调整训练,使输出的向量与期望向量尽可能的接近,当网络输出层的误差平方和小于指定的误差时训练完成,保存网络的权值和偏差。并运用保存的权值和偏差对待测样本进行测试。

神经网络网络的输入、输出应根据应用的具体要求来设定。输入层节点数目取决于数据的维数,采用的输入数据为已经提取的特征数据,输入训练样本的特征数据为9*4*30*10的矩阵,转换成36*1*300的矩阵,因此神经网络输入神经元数目为36。要识别0-9这10个数字,本文采用

下载应用软件,通过浏览器或是客户端等接入互联网即可按需使用软件[6],同时用户的数据和程序状态由云端统一管理,提高了可靠性和扩展了易用性。

2.移动应用软件智能监控

无线通讯技术与移动智能终端均是当今信息技术的发展热点,二者相辅相成,促成了当今智能终端几近一统天下的格局。各式平板电脑以其便携易用的性质逐渐改变了传统PC机不可撼动的地位。智能手机的发展使得手机从最初的仅可以打电话发短信到现如今的集快速接入互联网、个人信息管理、多媒体娱乐应用、多任务处理、扩展第三方软件等功能于一体。Android和iOS两大阵营已经占据了的智能手机市场的绝大部分份额。

移动智能终端的迅猛发展也带来了第三方应用市场的火爆,全球有无数大大小小的公司或开发团队加入到智能终端应用软件的大军中。然而如此庞大的开发大军研制的软件质量层次不齐,如存在恶意扣费、盗取用户通讯信息、上报用户地理位置等等问题;另一方面,如何从众多的应用软件中找准市场定位,预测即将推入市场的应用可以受到用户的欢迎对于许多企业来说是不小的难题。

移动应用软件智能监控可在一定程度上帮助解决以上的问题。智能监控主要通过采集安装在移动智能终端上的第三方软件信息,监控第三方软件的运行动态,获取其通讯端口号信息,当出现异常时上报异常并追踪异常目的地址。同时智能监控将监控到的各类信息进行汇总、分类整合8421码来识别,即对于输出“0”,采用(0,0,0,0)主要的目标向量来表示,对于输入“1”,采用(0,0,0,1)这样的输出向量来表示,以此类推,对于输入“9”,采用(1,0,0,1)这样的输出向量来表示。因此,就可以确定输出层的神经元数目为4,也就是输出向量的维数[4]。

4.结果和结论

本文所做的识别为0-9的数字。训练样本选取为每一类的前30个,共300个,测试样本为后100个。再将训练样本经过本文提到的预处理和四种方法的识别,得到识别率如表1所示:

表1?识别率比较

3*59*49*5

最小距离法近邻法K-近邻法BP神经网络

95%99%96%95%95%96%95%90%95%100%98%94%

并对信息进行处理,最终提供给决策者有

效的决策数据。

3.基于云平台的智能监控

移动应用软件智能监控是建立在对第三方应用软件监控的基础上的,最终对监控结果进行分析并提供一定的决策依据。因而智能监控需要对大量第三方应用软件进行监控,并且这些软件由于依托其移动智能终端载体而具有地理位置上的分散性,并且监控需大量时间的累积,在监控过程中也会产生大量的数据,这就对智能监控的后端平台提出了很高的要求,云平台恰好以其独有的优势与智能监控可进行无缝结合并实现优势互补。

3.1 当前发展现状

当前基于移动智能终端的应用软件发展繁荣,但应用软件智能监控却发展滞后。一方面,如窃取用户个人通讯信息的软件其操作均隐藏于后台,用户很难察觉,这在一定程度上导致了用户对于智能监控迫切性的认识不足;另一方面,智能监控需要采集数量众多的位于移动智能终端上的软件信息,监控难度大,且从大量的数据中分析出有用的信息需要高性能的计算以及强大的后端处理平台,这也给智能监控额外增加了不少难度。

3.2 云平台优势

●通过搭建云平台,在最大程度上将分散的计算资源整合为一体构建平台服务器集群,可实现资源的统筹并且将计算资源的能力发挥到最佳。

●云平台可作为移动应用软件智能监控系统的后端处理平台,可兼备海量数最高的识别率,达到100%。BP神经网络作为一个智能算法,识别效果理论上应该比较好,然而没有达到应有的效果,这与实验中BP神经网络中学习和训练函数的选取以及其各个参数的调试有关,这也是需要进一步研究的方向。

参考文献

[1]杨光正,吴岷,张晓莉等.模式识别[M].合肥:中国科学技术大学出版社,2001,7.

[2]王勃飞.基于Pseudo-Zernike矩的数字识别研究[D].武汉:华中科技大学,2007.

[3]边肇祺,张学工等.模式识别[M].北京:清华大学出版社,1999,12.

[4]卜富清,王茂芝,于庆刚.基于BP神经网络的数字识别[J].长江大学学报,2009,6(6):293-294.

作者简介:

吴元林(1989—),女,安徽黄山人,华北电力大学自动化系硕士研究生。

金秀章(1969—),男,河北衡水人,博士,华北电力大学自动化系副教授。

由比较结果可以发现,矩阵的分割块数在一定程度上可以提高识别率,但增加分割块数会大大增加计算量,延长识别时间。同时,在四种方法中,近邻法能得到

-4-

版权声明:此文档由查字典文档网用户提供,如用于商业用途请与作者联系,查字典文档网保持最终解释权!

下载文档

热门试卷

2016年四川省内江市中考化学试卷
广西钦州市高新区2017届高三11月月考政治试卷
浙江省湖州市2016-2017学年高一上学期期中考试政治试卷
浙江省湖州市2016-2017学年高二上学期期中考试政治试卷
辽宁省铁岭市协作体2017届高三上学期第三次联考政治试卷
广西钦州市钦州港区2016-2017学年高二11月月考政治试卷
广西钦州市钦州港区2017届高三11月月考政治试卷
广西钦州市钦州港区2016-2017学年高一11月月考政治试卷
广西钦州市高新区2016-2017学年高二11月月考政治试卷
广西钦州市高新区2016-2017学年高一11月月考政治试卷
山东省滨州市三校2017届第一学期阶段测试初三英语试题
四川省成都七中2017届高三一诊模拟考试文科综合试卷
2017届普通高等学校招生全国统一考试模拟试题(附答案)
重庆市永川中学高2017级上期12月月考语文试题
江西宜春三中2017届高三第一学期第二次月考文科综合试题
内蒙古赤峰二中2017届高三上学期第三次月考英语试题
2017年六年级(上)数学期末考试卷
2017人教版小学英语三年级上期末笔试题
江苏省常州西藏民族中学2016-2017学年九年级思想品德第一学期第二次阶段测试试卷
重庆市九龙坡区七校2016-2017学年上期八年级素质测查(二)语文学科试题卷
江苏省无锡市钱桥中学2016年12月八年级语文阶段性测试卷
江苏省无锡市钱桥中学2016-2017学年七年级英语12月阶段检测试卷
山东省邹城市第八中学2016-2017学年八年级12月物理第4章试题(无答案)
【人教版】河北省2015-2016学年度九年级上期末语文试题卷(附答案)
四川省简阳市阳安中学2016年12月高二月考英语试卷
四川省成都龙泉中学高三上学期2016年12月月考试题文科综合能力测试
安徽省滁州中学2016—2017学年度第一学期12月月考​高三英语试卷
山东省武城县第二中学2016.12高一年级上学期第二次月考历史试题(必修一第四、五单元)
福建省四地六校联考2016-2017学年上学期第三次月考高三化学试卷
甘肃省武威第二十三中学2016—2017学年度八年级第一学期12月月考生物试卷

网友关注

特岗教师招聘体育《运动训练学》备考:运动技术与运动员技术能力
特岗教师招考地理核心考点:主要农业地域类型的特点(一)
特岗教师招聘英语备考:句子的种类之祈使句
2015特岗教师招聘考试《政治学原理》高频考点(二十六)
特岗教师招聘生物知识点:细胞的能量供应和利用(四)
特岗教师招考地理核心考点:农业区位因素
特岗教师招考语文备考重点:文言文常见固定句式(三)
2015特岗教师招考音乐基本乐理强化练习题(一)
特岗教师招聘生物知识点:细胞的能量供应和利用(二)
2015特岗教师招考物理“物态变化”精选试题(一)
特岗教师招聘体育《运动训练学》备考:技术训练常用方法
2015特岗教师招聘考试《政治学原理》高频考点(二十四)
特岗教师招考语文备考重点:文言文常见固定句式(二)
2015特岗教师招考化学“燃料及其利用”测试题(2)
2015特岗教师招考化学“燃料及其利用”测试题(1)
2015特岗教师招考化学“燃料及其利用”测试题(3)
特岗教师招考语文备考重点:文言文常见固定句式(六)
特岗教师招考语文备考重点:文言文常见固定句式(四)
2015特岗教师招考物理“物态变化”精选试题(三)
2015特岗教师招考物理“物态变化”精选试题(二)
特岗教师招考语文备考重点:文言文常见固定句式(一)
特岗教师招考语文备考重点:文言文常见固定句式(五)
特岗教师招考地理核心考点:主要农业地域类型的特点(二)
特岗教师招考数学备考——不等式知识点详解
2015特岗教师招聘历史备考要点之新民主主义革命的兴起(一)
特岗教师招考物理备考资料:质量与密度(二)
2015特岗教师招考音乐基本乐理强化练习题(二)
特岗教师招聘生物知识点:细胞的能量供应和利用(一)
特岗教师招考化学知识点精讲:燃料及其利用(三)
2015特岗教师招考物理“质量与密度”专项练习题(2)

网友关注视频

外研版英语三起6年级下册(14版)Module3 Unit1
河南省名校课堂七年级下册英语第一课(2020年2月10日)
人教版历史八年级下册第一课《中华人民共和国成立》
3月2日小学二年级数学下册(数一数)
二年级下册数学第三课 搭一搭⚖⚖
化学九年级下册全册同步 人教版 第25集 生活中常见的盐(二)
苏科版数学八年级下册9.2《中心对称和中心对称图形》
沪教版牛津小学英语(深圳用) 五年级下册 Unit 10
【部编】人教版语文七年级下册《泊秦淮》优质课教学视频+PPT课件+教案,天津市
8 随形想象_第一课时(二等奖)(沪教版二年级上册)_T3786594
苏科版八年级数学下册7.2《统计图的选用》
每天日常投篮练习第一天森哥打卡上脚 Nike PG 2 如何调整运球跳投手感?
小学英语单词
《小学数学二年级下册》第二单元测试题讲解
8.对剪花样_第一课时(二等奖)(冀美版二年级上册)_T515402
沪教版八年级下册数学练习册21.3(2)分式方程P15
19 爱护鸟类_第一课时(二等奖)(桂美版二年级下册)_T3763925
沪教版牛津小学英语(深圳用) 五年级下册 Unit 12
沪教版八年级下次数学练习册21.4(2)无理方程P19
19 爱护鸟类_第一课时(二等奖)(桂美版二年级下册)_T502436
沪教版八年级下册数学练习册21.3(3)分式方程P17
【部编】人教版语文七年级下册《泊秦淮》优质课教学视频+PPT课件+教案,广东省
第19课 我喜欢的鸟_第一课时(二等奖)(人美杨永善版二年级下册)_T644386
冀教版小学数学二年级下册第二单元《余数和除数的关系》
冀教版小学数学二年级下册第二单元《有余数除法的简单应用》
冀教版小学数学二年级下册第二单元《有余数除法的竖式计算》
沪教版牛津小学英语(深圳用) 四年级下册 Unit 8
第12章 圆锥曲线_12.7 抛物线的标准方程_第一课时(特等奖)(沪教版高二下册)_T274713
北师大版八年级物理下册 第六章 常见的光学仪器(二)探究凸透镜成像的规律
外研版八年级英语下学期 Module3