基于图像处理的人脸检测研究

上传者：网友
|

翻新时间：2023-02-13

收藏到账号

全屏

基于图像处理的人脸检测研究

摘要：针对人脸识别的预处理，采用图像处理技术解决了人脸检测问题。首先建立输入图像的肤色模型，然后进行开运算处理，以消除图像噪声利于后面的眼睛定位。再对二值图像做灰度投影实现人脸粗分割，定位双眼。最后对细化分割出来的人脸区域进行标准化操作，包括灰度的均衡处理和Mallat算法二维小波分解。灰度均衡把原始图像的直方图变换为均匀分布的形式，增加像素灰度值的范围。小波分解可以压缩图像，以降低算法的复杂度。每个步骤通过处理前后人脸图像的对比彰显所做步骤的意义。人脸检测的最终结果是获得64×64大小的人脸图像。此图像包含了人脸的有效信息，在此图像的基础上才能进行后续的提取特征、设计支持向量机，进而做人脸识别。

关键词：图像处理；人脸检测；灰度均衡；小波分解；肤色建模

要识别图像中的人脸，首要的一点就是要找到人脸。人脸检测与跟踪就是研究如何从静态图片或者视频序列中找出人脸的所在区域，如果存在人脸，则输出人脸的位置及其大小。人脸跟踪就是要在检测到人脸的基础上，在后续的人脸图像中继续捕获人脸的位置及其大小等性质。人脸检测是人脸身份识别的前期工作。同时，人脸检测作为完整的单独功能模块，在智能视频监控、视频检索和视频内容组织等方面有直接的应用[1]。

目前做人脸检测的方法大致有：神经网络的方法、基于特征的方法和基于图像的方法等。其中，神经网络的方法是用许多的训练数据（一部份是脸部的、一部份是非脸部的）去训练神经网络，使其可以辨识出什么图像是脸、什么图像不是脸。基于特征的方法是利用人脸部的一些特征来检测人脸，例如：人脸上有眼睛、鼻子、嘴巴，而这些器官都有固定的相对位置；就整张脸而言，大概是呈椭圆形，而脸和背景之间大致会有边缘线；诸如此类，有许许多多的特征可利用。而基于图像的方法，则是利用人脸部的颜色来判断某图像是否是脸，若图像是彩色的，知道脸的颜色是黄、白、褐、深褐色，若图像是灰度的，人脸的灰度颜色的变化并不会太大，而眼睛、嘴巴、头发会是较黑的部份[2]。

同灰度图像相比，彩色图像能够提供更多有关于目标物体的信息，彩色图像处理方法具有比灰度图像处理方法更大的优越性。基于图像的方法运算量小，肤色是人脸的重要信息，不依赖于面部的细节特征，对于旋转、表情等变化情况都能适用，具有相对的稳定性并且和大多数背景物体的颜色相区别，因此肤色特征在人脸检测中是最常用的一种特征[3]。

本课题设计了一套人脸识别的技术路线，仅探讨标准化处理前的人脸检测部分。

人的皮肤颜色分布在颜色空间中很小的一个范围内，呈聚类特性，特别是在排除了光照亮度和在经过某种变换的色彩空间中。所以利用肤色这一线索，可以排除掉在灰度图像中很像人脸而对应到彩色图像中根本不是肤色的区域，这在人脸检测中会起到积极的作用，肤色模型正是建立在此基础之上的，并且人们提出了不同色彩空间的肤色模型表示方法。常见的色彩表示方法是基于三基色理论的RGB空间，由RGB空间经过变换，可以得到各种色度空间表示，有HIS，YCbCr等[4]。

CbCr分量组成的二维聚类区域排除了大部分非人脸区域，但由于CbCr是直接由RGB色彩格式通过线性变换得到，没有完全分离出亮度信息，因此对光照比较敏感。肤色聚类呈两头尖的纺锤形状。若只采用二维的肤色CbCr模型，在值较大和较小的部分，被错误检测为肤色的区域将大大增加。在进行肤色建模的时候，YCbCr空间中的亮度和色度的分离度越大越好，但是实际操作中这二者总是存在一定的依赖关系，要做的就是尽量消除它们之间的依赖关系，分段的非线性转换就是为了这一目的。

2 二值图像开运算和闭运算

形态学变换膨胀采用向量加法对两个集合进行合并。膨胀XB是所有可能向量加之和的集合，向量加法的两个操作数分别来自于X和B，并且取到任意可能的组合[6]。

膨胀用来填补物体中小的空洞和狭窄的缝隙，它使物体的尺寸增大。

腐蚀Θ对集合元素采用向量减法，将两个集合合并，腐蚀是膨胀的对偶运算。

腐蚀简化了物体的结构，某些物体或物体的部分将被去掉，腐蚀和膨胀不是互逆变换。

开运算是对图像先腐蚀后再膨胀，得到的不是原始图像。

根据开启和闭合的特点，通常可以利用开启删除图像中的小分支，利用闭合填补图像中的空穴。用B=111111

将经过肤色建模的图像进行开运算处理，消除部分噪声以利于下面的眼睛定位（见图4），可见眼睛所在的区域非常清晰[7]。

图像分割是一种基本的计算机视觉技术，是从图像处理到图像分析的关键步骤。有效合理的图像分割能够为基于内容的图像检索、对象分析等抽象出十分有用的信息，从而使得更高层的图像理解成为可能[8]。

对于经过肤色建模后的二值图像，很容易分割出人脸区域，本文采用灰度积分投影的方法，利用人脸图像的垂直灰度投影确定左右边界，利用水平灰度投影确定上下边界。设人脸灰度图像为f（x，y），其大小为m×n，定义图像的水平灰度投影为

选择适当的投影阈值即可实现人脸的粗分割（见图5）。在本文中分割人脸的目的在于减小搜索区域，更加方便地定位双眼，因此分割区域选择首先要包含双眼在内，其次尽量排除其他对双眼定位有干扰的区域，如头发等，所以没有实现人脸的完全分割，而是实现的部分分割，以包括双眼在内为首要目的。

眼睛定位对于能否自动有效地实现识别算法起着重要的作用，由于人脸是非刚性的，同一人的脸因表情变化会差异很大，但同一人的两眼间距相对变化是较小的，并且双眼对于人脸中线对称，因此双眼的位置及其间距自然成为人脸图像几何归一化的依据[9]。

3）在左右眼每个半区中，当出现把眉毛误认为眼睛的时候，可以按照眉毛在眼睛上方这一先验知识予以取舍；

4）左右半区都筛选了一个区域以后，就可以得到左右眼睛的中心点。

使用移动窗口的好处是它相当于一个噪声消除装置，可以将满足条件的孤立区域连接起来得到更大的区域，利于确定眼睛中心点。

5 细化分割

6.1 灰度均衡处理

细化分割后还应做灰度均衡处理，此处采用直方图的灰度均衡方法（见图8）。这个方法的基本思想是把原始图像的直方图变换为均匀分布的形式，这样就增加了像素灰度值的动态范围，增强了靠近直方图极大值附近的亮度对比度，减小了极小值附近的对比度。原始图像的直方图用H（p）表示，输入的灰度级范围是[p0，pk]。

1）对于有G个灰度级大小为M×N的图像，创建一个长为G的数组H，并初始化为0；

2）形成直方图。扫描每个像素，增加相应的H成员，当像素p具有亮度gp时，做H[gp]=H[gp]+1；

3）形成累积直方图HC。 HC[0]=H[0]， HC[p]=HC[p-1]+H[p]；

4）设置T[p]=round（G-1M×NHc[p]），并重新扫描图像得到一个具有灰度级gp的输出图像，设置gp=T[gp]。

（a）均衡前（b）均衡后

均衡后的图像，仍包含较多冗余信息，图像容量较大。可以采用小波变换，压缩图像，以降低后续算法的复杂度。小波变换是一种信号的时间-尺度分析方法，它具有多分辨率分析的特点，而且在时频两域都具有表征信号局部特征的能力，是一种窗口大小固定不变，但其形状可变（时间窗和频率窗都可变）的时频局部化分析方法。即在低频部分具有较高的频率分辨率和较低时间分辨率，在高频部分具有较高的时间分辨率和较低的频率分辨率，很适合探测正常信号中夹带的瞬态反常现象并展示其成分，所以被誉为分析信号的显微镜[11]。

二维小波函数是通过一维小波函数经过张量积变换得到的，二维小波函数分解是把尺度j的低频部分分解成四部分：尺度j+1的低频部分和三个方向（水平、垂直、斜线）的高频部分。可以将二维小波分解应用于人脸图像的表示，经过适当层次的小波分解后得到的低频子带图像有以下特点：经k层小波分解后得到的像素点数是原图的1/4k，分解后的低频子带图像对表情变化不敏感。

在多分辨率分析的基础上，Mallat算法是基于滤波器组的小波分解和小波重构算法，通过它可以实现信号多分辨的快速分解。

Mallat算法通过一组分解滤波器h⌒（低通滤波器）和g⌒（高通滤波器）对信号进行滤波，然后对输出结果进行下二采样来实现小波分解，分解的结果是产生长度减半的两个部分，一个是经低通滤波器产生的原始信号的平滑部分；另外一个是由高通滤波器产生的原始信号的细节部分。重构时使用一组h和g合成滤波器对小波分解的结果滤波，再进行上二采样来重构信号。多级小波分解通过级联的方式进行，每一级的小波变换都是在前一级分解产生的低频分量上的继续，合成是分解的逆运算。低频分量上的信息比较丰富，能量集中；高频分量上的信息分量多为零，细节信息丰富，能量较少。Mallat小波使得复杂的小波变成了简单的滤波器系数，大大降低了其应用的复杂度。利用Mallat算法进行信号的正交小波分解与合成如图9所示。

图9 Mallat算法小波分解层数过多，虽然冗余度降低，但丢失较多信息。本文采用二层小波分解。在对图像进行二维分解时，先对一个方向（水平方向或垂直方向）进行滤波，再对另一个方向进行滤波。通过滤波，将图像分解为四个子图，LL表示水平方向和垂直方向都是低频滤波。对一幅图像来说，其高频信息主要集中在边缘、轮廓和某些纹理的法线方向上，低频信息占据图像大部分内容，所以分解主要做低频处理。

经过两层小波分解后的LL人脸图像，其大小为64×64（见图10）。

7 结论

经过该算法，人脸检测后可以在采集的图像中搜索出人脸，最终获得了64×64大小的人脸图像，该图像去除了人脸中的冗余信息，且最大限度的保留了人脸中的有效成分，图像容量较小，可以降低后续算法的复杂度。每幅被采集人脸图像都将重复上述过程，以获得多幅图像。该图像是计算特征脸和设计支持向量机的基础，基于该图可以做人脸识别。