@基于小训练样本的AdaBoost人脸检测

基于小训练样本的AdaBoost 人脸检测

师 黎,吴 敏,张 娟

(郑州大学电气工程学院,郑州 450001)

摘 要:AdaBoost 算法已被广泛地应用于人脸检测系统中,但往往需要大量的训练样本。针对其训练过程复杂冗长的缺陷,选择研究基于少量训练样本的人脸检测问题。采用协方差特征代替图像统计的直方图进行特征提取。为达到更好的分类效果,应用基于Fisher 判别式分析的线性超平面分类器,通过AdaBoost 算法构成多层级联分类器进行人脸检测。在小数据库里可以看到,与目前用于多数人脸检测系统的类Haar 特征相比,该算法在减少训练样本的同时能获得更好的检测效果。 关键词:人脸检测;协方差特征;Fisher 判别式分析;训练样本

AdaBoost Face Detection Based on Few Training Samples

SHI Li, WU Min, ZHANG Juan

(School of Electrical Engineering, Zhengzhou University, Zhengzhou 450001, China)

【Abstract 】Aiming at the complex and long training process of face detection, this paper addresses the problem of learning to detect faces from a small set of training samples. It proposes to use covariance features to extract the facial features. For better classification performance, linear hyperplane classifier based on Fisher Discriminant Analysis(FDA) is proffered. AdaBoost algorithm is used to construct cascade classifier. It shows that the detection can be significantly improved with the algorithm on a small dataset, compared with Haar-like features used in current most face detection systems.

【Key words 】face detection; covariance feature; Fisher Discriminant Analysis(FDA); training sample DOI: 10.3969/j.issn.1000-3428.2011.08.069

计 算 机 工 程 Computer Engineering 第37卷 第8期

V ol.37 No.8 2011年4月

April 2011

·人工智能及识别技术· 文章编号:1000—3428(2011)08—0199—03文献标识码:A

中图分类号:TP391.41

1 概述

人脸检测(face detection)是指在输入的图像中判断是否存在人脸,并确定人脸的位置、大小。它是人脸识别系统的首要环节,检测算法的优劣直接影响识别的准确性,在动态监视、智能人机交互等诸多领域均具有广泛的应用价值。人脸检测是一个复杂的模式分类问题,主要有两方面难点[1]。(1)由人脸内在变化所引起:1)人脸复杂细节的变化,如肤色、表情等;2)人脸的遮挡,如眼镜等。(2)由外在条件变化所引起:1)成像角度的不同造成人脸的多姿态;2)光照的影响;3)图像的成像条件。这些困难都为人脸检测造成难度。

目前,人脸检测主要使用的是文献[2]提出的AdaBoost 算法,即在一系列矩形特征(Haar 特征)的基础上,通过Boosting 算法将一连串“弱”分类器进行线性组合而形成“强”分类器。AdaBoost 算法在解决实际应用问题时较有效,但还存在一定的局限性,因此出现了许多改进工作。例如文献[3]采用带回溯过程的Float Boost 特征选择算法,并结合了简单的块特征和金字塔的分级结构,使其可以检测多视角人脸图像。文献[4]针对AdaBoost 算法选择特征训练时间长的缺点,提出了前向特征选择算法,人脸成像的多姿态也会增加结果的误检率。为了得到精确的检测结果,上述各种AdaBoost 改进算法常会加大训练样本的数量,使得计算的复杂度也迅速增加。

针对上述问题,本文提出了Fisher 判别式分析(Fisher Discriminating Analysis, FDA)和AdaBoost 相结合的小训练样本检测算法。用协方差特征提取图像的感兴趣区域,再用FDA 代替决策树作为弱分类器以获得更多的可用信息。实验结果说明该方法有效减少了训练样本的数量,简化了分类过程,同时保持检测结果的准确性。

2 基于小训练样本的FDA 与AdaBoost 结合算法

2.1 基于协方差的特征提取以及FDA 弱分类器的实现

在图像预处理中,输入样本首先进行灰度图转化和图像平滑去噪,然后用局部协方差代替直方图直接从图像统计的感兴趣区域计算,使所得结果限定在一个更小的维数里。设图像大小表示为n 维向量,对于给定的人脸图像训练集i h (1,2,,)i N =",则有N 幅人脸的图像训练集12{,,,}n x x x ",由式(1)计算其协方差:

T

01

1()n n n i i i g N ×==

??∑C x g (1) 其中,i g 是(,)i h x y 平均灰度的N 维向量;01

1()n

i i i g N ==?∑X g 。

本实验用到7维的图像统计量,将一个区域的协方差描述为77×的矩阵。根据对称性,只有上三角部分被叠加起来作为协方差的描述。

将协方差向量用FDA 算法投影到一维空间。首先,采用FDA 作为弱分类器,将训练数据放在通过最大化分离2类的Fisher 节点的方向上;然后,将模式高维特征向量投影到该最佳判别方向上,构成一个一维判别特征空间,再通过全面搜索[5]的方法获得线性分类器的偏差。具体步骤如下:

(1)根据类内离散度矩阵w S 、类间离散度矩阵b S 和Fisher 鉴别准则函数T T ()b f w =S J S ??

???

(?为任一n 维非零列向

量)求出最佳判别方向,即选取使目标函数()f J ?达到最大值

基金项目:国家自然科学基金资助项目(60841004, 60971110) 作者简介:师 黎(1964-),女,教授、博士生导师,主研方向:控制理论,智能控制,模式识别;吴 敏、张 娟,硕士研究生 收稿日期:2010-10-19 E-mail :wujiayi1215@https://www.360docs.net/doc/301117648.html,

200 计算机工程2011年4月20日

的矢量W作为投影方向,使其投影后具有最小类内离散度和

最大类间离散度。

(2)从n维空间投影到一维空间通过式(2)来完成:

T

i i

=

y w x(1,2,,)

c

i N

="(2)

其中,x是n维样本,共有N个;y为一维的样本。

2.2 AdaBoost构造多层分类器的实现

运用AdaBoost算法选择具有最小分类错误率的弱分类

器,不断将其添加到级联中构成强分类器,再将强分类器级

联成一个多层分类器[6],直到达到预先设定的分类器的精确

度。AdaBoost级联分类器的框图如图1所示。

图1 级联分类器框图

针对决策树忽略其他所有的空间信息,只选择识别力最

好的维数,这种处理方法可能会减少很多对分类器有用的信

息。为显示本算法的优越性,本文在一个人工的二维数据库

上分别用多维决策树和FDA做弱分类器来训练一个

AdaBoost分类器,结果如图2所示。由图可得,多维决策树

的AdaBoost训练误差在1 000次的训练后仍然在0.1左右,

而用FDA训练的AdaBoost误差明显比其低。在300次训练

后,多维决策树的测试误差轻微地增加,出现过匹配现象。

结果说明,FDA做弱分类器可以减小训练误差和测试误差,

得到更多的有用信息。

0.30

0.20

0.15

0.10

0.25

0.00

0.05

250

测试误差

训练误差

(a)FDA训练的弱分类器

(b)决策树训练的弱分类器

图2 多维决策树和FDA训练的AdaBoost弱分类器

3 实验及结果分析

3.1 数据库的选择及参数设定

本实验选择在低分辨率的MIT+CMU正面人脸测试集中

测试人脸检测器,完整的测试集包含507个正面人脸的

130张图片。检测是在真实和预测的边界交叠区域中进行的,

归为正确检测的,在预测边界和实际真实边界的交迭区域必

须超过50%,对图像中同一人脸进行重复检测被认为是误检。

训练集包括样本训练库和1 000张从因特网上获得的正

面人脸图像,这些样本被缩小为24×24像素的图像,用大约

3 500张非人脸做负样本。在本实验中,使用3 000个协方差

滤波器从整个矩形滤波器中一致抽样。在每层的级联都不断

添加弱分类器直到达到设定的目标。在每一级设置最小检测

率为99.5%,最大的正样本错误率定为50%。设置窗口缩放

比例系数为1.2,窗口转换级为1。训练和测试类Haar小波

特征时,用快速AdaBoost方法。

3.2 结果分析

图3是用协方差和类Haar小波特征绘制的ROC(Receiver

Operating Characteristic)曲线比较。ROC曲线[7]能直观地反映

出人脸检测的灵敏度和特异性,它通过在每一级重复不断地

加入节点来构造。结果显示当训练的数据量较少时(小于500

个人脸),协方差特征明显比类Haar小波特征的检测率高。

当数据量较大时,这2种特征的效果就比较相似,即随着样

本数目的增长,2种方法的不同性能就逐渐缩小。结果表明,

本文所用方法对训练样本较少的人脸检测有重要意义。

(a)250幅人脸的ROC曲线

协方差特征检测曲线

类Haar特征检测曲线

0.90

0.85

0.80

0.75

0.70

0.65

0.95

050100150200250300350400

错误节点数

(b)500幅人脸的ROC曲线

图3 本文算法和类Haar小波特征绘制的ROC曲线比较图

为证明以FDA为弱分类器可以快速排除大量的非人脸

信息,图4显示了使用FDA的AdaBoost算法在不同级联的

级中累积的排除率。可见,前3级已经排除了多于90%的非

人脸,而且对于不同大小的训练数据库,累积的排除率在前

6级是非常接近的。

第37卷 第8期 201

师 黎,吴 敏,张 娟:基于小训练样本的AdaBoost 人脸检测 图4 改进AdaBoost 算法在前6级中累积的排除率

图5显示了MIT+CMU 图库正面人脸测试集中250个人脸训练的检测结果,其中戴眼镜和闭眼睛的人脸也被准确定位。可见,使用小训练样本训练的检测器也可以达到较好的检测效果。

(a)图库照片检测效果

(b)自选照片检测效果

图5 本文算法检测效果

4 结束语

本文综合协方差特征和FDA 的优势,提出了一种基于

AdaBoost 小训练样本的人脸检测方法,主要体现在2个方面:(1)采用了多维的协方差,舍弃了简单的决策树;(2)选择FDA 作为弱分类器。实验证明该方法明显地提高了系统训练少量样本的能力,简化了训练过程的复杂度,改善了目前人脸检测器大都依赖于大量训练样本的情况,用少量的训练样本得到了较准确的检测结果。本算法还需结合其他数学模型进一步优化,提高对遮盖、姿势等的鲁棒性。

参考文献

[1] 袁芬萍. 基于人眼定位与SVM 的人脸检测方法研究[D]. 长沙:

中南大学, 2007.

[2] Freund Y . Boosting a Weak Learning Algorithm by Majority[J].

Information and Computation, 1995, 121(2): 256-285.

[3] Li S Z, Zhang Zhenqiu. Statistical Learning of Multi-view Face

Detection[C]//Proc. of the 7th European Conference on Computer Vision. Copenhagen, Denmark: [s. n.], 2002: 67-81.

[4] Wu Jianxin, Rehg J M, Mullin M D. Learning a Rare Event

Detection Cascade by Direct Feature Selection[C]//Proc. of Annual

Conference on Neural Information Processing Systems. Columbia, USA: [s. n.], 2004: 1523-1530.

[5] Wu Jianxin, Brubaker S C, Mullin M D, et al. Fast Asymmetric

Learning for Cascade Face Detection[J]. IEEE Trans. on Pattern Anal. Mach. Intell., 2007, 20(3): 369-382.

[6] 钱志明, 徐 丹. 一种Adaboost 快速训练算法[J]. 计算机工程,

2009, 35(20): 187-188.

[7] 王敬瀚. ROC 曲线在临床医学诊断实验中的应用[J]. 中华高血

压杂志, 2008, 16(2): 175-177.

编辑 任吉慧

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~(上接第198页) =正确检测出的文字区域个数

检测率文字区域N d D r N t

=

错误检测出的文字区域个数

误检率N f Fr N d N f

N td

=+

实际检测出的文字区域总个数实验结果如表1所示。

表1 实验结果(Nt =700)

被检测 的媒体 正确定 位数(Nd ) 误定位数 (Nf ) 正确检测率 (Dr )/(%) 误检率 (Fr )/(%)CD 639 39 91.23 9.56 新闻 624 88 89.12 12.35 广告

575 104 82.12 15.35

从表1和图4的实验结果可以看出,本文提出的基于小波变换的视频图像中维吾尔文字定位的方法,正确检测率较高,误检率较低。另外由于采用多尺度定位,因此可以正确定位不同尺寸的文字。

实验过程中发现误检的主要原因如下:(1)由于维吾尔文字的特殊性,外围书写不规则,出现较多点或出格的字符,很容易当噪声去除,因此定位时扩大了3个像素。(2)对文字区和非文字区的分类只考虑了水平、垂直及对角子带中相应点的信息,未考虑邻域点的信息,并且采用简单的阈值法进行文字点分类,有时会把一些非文字边缘分类为文字点,从而使误检率升高。比如一行较短的文字和一行较长的文字相邻时,较短的文字行很有可能因受影响而漏检。因此,可采用自适应多阈值法来进一步提高正确定位率,降低漏检。笔者将另文详细讨论此算法。

5 结束语

本文提出基于小波变换的视频图像中维吾尔文字定位的方法,该方法具有3个特点:(1)检测方法可以稳健地定位水平方向维吾尔文字。(2)形态学的方法能很大程度上消除噪声。(3)投影法能定位复杂背景下的维吾尔文字区域。实验测试与性能分析表明整个方法对不同文字颜色、字体、大小都保持了较好的鲁棒性,并且正确检测率较高,误检率较低。

参考文献

[1] 朱成军, 蒲菊华, 薛 玲, 等. 基于词组学习的视频文本检测

方法[J]. 计算机工程, 2008, 34(13): 185-187.

[2] Lyu M R, Song Jiqiang. A Comprehensive Method for Multilingual

Video Text Detection, Localization, and Extraction[J]. IEEE Trans. on Circuits and Systems for Video Technology, 2005, 15(2): 243- 255. [3] Gllavata J, Ewerth R, Freisleben B. A Text Detection, Localization

and Segmentation System for OCR in Images[C]//Proc. of the 6th International Symposium on Multimedia Software Engineering. [S. l.]: IEEE Press, 2004: 216-224.

[4] 姜 琳, 房 斌, 唐远炎, 等. 小波域多方向信息融合的纹理

图像检索[J]. 计算机工程, 2010, 36(5): 215-217.

[5] Jung K, Kim K I, Jain A K. Text Information Extraction in Images

and Video: A Survey[J]. Pattern Recognition, 2004, 37(5): 977-997. [6] 田破荒, 彭天强, 李弼程. 基于文字穿越线和笔画连通性的视

频文字提取方法[J]. 电子学报, 2009, 37(1): 72-78.

编辑 任吉慧

相关文档
最新文档