(翻译)嵌入式贝叶斯网络在人脸识别中的应用

(翻译)嵌入式贝叶斯网络在人脸识别中的应用
(翻译)嵌入式贝叶斯网络在人脸识别中的应用

嵌入式贝叶斯网络在人脸识别中的应用

Ara V Nefian

英特尔公司

微处理器研究实验室

Santa Clara ,CA 95052

ara.nefian @ https://www.360docs.net/doc/5016082270.html,

摘要:本文所介绍的嵌入式贝叶斯网络(EBN)是嵌入式隐马尔可夫模型的一种概括,嵌入式隐马尔可夫模型最初应用于人脸和字符识别。一个EBN 递归的被定义为一个层次结构,在这个结构里,“双亲”层节点在嵌入式贝叶斯网络或者描述“孩子”层各节点的观察序列的条件下是一个贝叶斯网络。在嵌入式贝叶斯网络下,可以建立复杂的N 维数据,在保护他们的灵活性和局部尺度不变性的同时避免复杂的贝叶斯网络。在本文中,我们提出了嵌入式贝叶斯网络在人脸识别上的一种应用,并且描述了该方法与特征脸方法以及嵌入式隐马尔可夫模型方法相比的完善之处。

1、 简介:

本文介绍的动机是需要实际的统计模型与n 维的依赖,特别是依赖使用二维图像分析。而隐马尔可夫模型(HMM)是非常成功的应用于语音识别或手势识别,在这个模型里,随着时间的推移数据依赖于一维,相当于一个N 维隐马尔可夫模型已被证明是不切实际的,由于其复杂性会随着数据的大小而成倍增长[1]。对于图像识别,特别是人脸识别[2],其数据本质上是二维的,基于采用主成分分析([3],[4]),线性判别分析([5]),神经网络([6],[7]),和匹配追踪方法的模板与早期的几何特征表现相比有了改进。然而,这些方法不能概括在尺度,方向,或面部表情方面的广泛差异。近年来,几种近似二维隐马尔可夫模型与实际计算模型的方法被研究了,诸如伪二维隐马尔可夫模型或嵌入式隐马尔可夫模型应用于字符识别[1]或人脸识别[10],[11]。这些模型在相当大的程度上降低了早期基于隐马尔可夫模型的人脸识别方法的错误率[11]。在文献[12]中,Jia 和 Gray 制定了一个有效的近似于隐马尔可夫模型的训练和识别的方法,并将其应用于文本图像分析。本文介绍了一个系列嵌入式贝叶斯网络(EBN )并研究它们的人脸识别性能。嵌入式贝叶斯网络通过允许每一个隐马尔可夫模型被任意的贝叶斯网络所代替来概括嵌入式隐马尔可夫模型。本文主要介绍在动态贝叶斯网络如HMM 或耦合HMMs 基础上建立的一系列嵌入式贝叶斯网络,并将他们的人脸识别性能与现有的一些方法相比较。

2、 耦合隐马尔可夫模型

耦合隐马尔可夫模型(CHMM )可以被视为一个HMMs 的集合,一个数据流集合,其中每个HMM 在时间t 时的离散型节点受所有相关HMMs 在时间t-1时的离散型节点的影响。图1显示了一个CHMM ,其中正方形代表隐藏的离散节点而环形代表连续观测节点。用C 表示一个CHMM 通道的数量,并用i =[il,..,,ic]表示状态向量,描述通道1处隐藏节点的状

态,…,在一个特定时间t 的实例。(C 是耦合隐马尔可夫模型(CHMM )的一个通道,i = [i l ,….,i c ]是描述在通道1……C 隐藏节点的状态的状态向量,1q [,...]C t t t q q 代表一个特定的时间例如t 时状态。)耦合隐马尔可夫模型的要素有

,在通道c 里的状态i c 的初始状态概率;

,在通道c里的状态转移概率从状态j到状态,以及

,在通道c里观察概率传给状态ic。

图1:耦合隐马尔可夫模型的图像识别

3、一个嵌入式贝叶斯网络系列

嵌入式贝叶斯网络(EBN)是一个由多层组成的层次统计模型,除最低层外的每一层被定义为一组EBN。最低层有一组观察向量集组成。同层EBN的参数是相互独立的,而他们的参数取决于上层中的“母”EBN。本文所介绍用于人脸识别的EBN有两层构成,每一层代表一个数据维度。每一层用一组HMMs或者CHMMs来描述,如图2所示描述了四个EBNs 系列:嵌入式隐马尔可夫模型(EHMM):其两层都是用HMMs描述,HMM-CHMM:其中上层是一个HMM,下层由一组CHMMs构成,CHMM-HMM:其中上层是一个CHMM,下层由一组HMMs构成,还有嵌入式耦合隐马尔可夫模型(ECHMM):其中两层都由CHMMs 描述。自从隐马尔可夫模型可以被视为一种带有数据流的CHMM,ECHMM是其所属系列的所有模型的一个概括。为了简化,本文仅给出了正式的定义,并描述了所有系列中最常见模型的演算法,也就是ECHMM。以下所给出的双层ECHMM参数的正规定义可以扩展到任何数量的层。在本文中我们将参照“母层”CHMMs中的通道,节点及状态作为ECHMM 的超级通道道,超级节点和超级状态。为了简化起见,假定在层l里的ECHMM有相同数

量的渠道,一个两层ECHMM的要素有:

●在超级通道里的最初超级状态概率

●在超级通道里从状态到状态的状态转移概率

●对超级通道s里的每一个超级状态k来说,CHMM的参数定义如下:

?在超级通道里最初的状态概率

?状态转移概率

?观察概率。在连续混合高斯组成部分里,该观测向量O的概率是由以下

公式给出:

公式里和表示在c通道里的j状态下的m次混合物的均值和协方差矩阵。

表示与c通道里的j状态相应混合物的数量,重量表示相应混合物的重量。

图2:(a)嵌入式HMM,(b)HMM-CHMM结构

(c)CHMM-HMM结构(d)嵌入式CHMM

4、观测向量

图像的观察序列是从大小为的图像块中提取的,如图3所示,图像块是通过从左

到右,从上到下扫描图像获得的。相邻图像块在垂直方向行和水平方向的列处重叠。

具体来说,在行和列处,我们使用六个二维系数(3×2低频阵列)。使用二维系数代替像素值作为观测向量的理由是,具有压缩和去相关特性的二维离散余弦可以转换

为自然图像。由此产生的观测向量的阵列大小为,其中和是从高度为H宽度

为W的图像中提取的观测向量的数量。

图3:人脸图像参数化和块提取

下一个连续的横向和纵向的观测向量在观察块中组合在一起。在本文我们将表示

为在观察块里与c通道对应的观察向量。

5、最优状态序列分割

本节中介绍的算法确定最佳状态和ECHMM.观察序列的超级状态分割。该算法也简称为ECHMM的维特比算法可以通过设置适量的通道和超级通道应用于本文所讨论的EBN系列的所有模型。为了简单,我们在这里所描述用于两层ECHMM的维特比算法。

●对于每个观察块,在给定超级通道s的超级状态下,用HMM [14] 或者

CHMM [15]计算维特比算法。在给定超级通道s的超级状态下的观察块中最

好的超级状态概率与状态最优分割分别表示为和。

●初始值:

●递归式:

●终止式:

●回溯法:

在实际中,为了克服溢出和大量乘法的问题,以上所有的计算可用于对数形式。表1比较了两层EBN维特比搜索的复杂性与任意个BN分别在上,下两层的N0和N1两种状态的每个节点以及CHMM的N0N1的状态。在EBN中复杂性的维特比算法可以并行计算,因为低水平的模型是相互独立的。

表1:CHMM 和EBN间复杂性比较的补充

6、演练(TRAINING)

为了演练EBN,观测向量首先从图像训练集中提取。本文,在训练中我们会指示会员将T 示例图像设置超级脚本。为了演练EBN,我们进行如下程序:

1、在第一次迭代时,观测块的阵列被均匀分割成S的垂直通道,并且在每个超级通道里的向量根据每个超级通道里超级状态的数量均匀分割。然后观测阵列随每个观测块根据每个“孩子”("child")层的通道和状态的数量被均匀分割。为了初始化混合组成成分,被分配到每个通道c,状态j,超级状态k和超级通道s的观测序列被指定为采用k-均值算法的集

群。

2、在下一次迭代时,均匀分割被第5节所述的最优状态分割算法代替。在每一状态j和超

级状态k里的混合成分取决于训练集中第r个示例中的观察值,对于高斯成分,

高斯密度函数是最高的。

3、模型参数通过使用部分K-均值算法的延伸来估算。具体来说,超级状态之间的估计转移概率是通过如下公式获得的:

其中,如果因观察块在超级通道s里发生了由状态序列l到超级状态的转移,则

的值为1,否则为0。

嵌入式状态之间的估计转移概率是由如下公式获得的:

其中,如果在观察块里因观察发生了通道c里的状态j到状态的转移,则

的值为1,否则为0。估计均值,高斯混合物的协方差,和超级状态k里状态j的混合物m的混合系数的值由如下公式获得:

其中,观察被指定到超级通道s里的超级状态k,通道c里的状态j,和混合成分m,

则就等于1,否则等于0。

4、如果在连续迭代时用维特比算法计算的观察概率小于规定的临界值,则迭代停止并且演

练模型中的参数被保存。否则重复步骤2-4。

7、人脸识别

随着EBN的参数被用于数据库里的每张人脸,人脸识别从提取测试人脸图像中的观测向量开始,如第4节所述。然后计算最优状态分割的概率(如5节),用于试验演练模型中给出的观察序列。最后,观察序列和训练模式之间的最高匹配评分显示测试图像的身份。在试验中,所有的HMM和CHMM的底层都有六个状态,每个通道分别有三个状态。对母层来说,HMM和CHMM的每个通道里有五个状态。使用三个混合高斯函数与协方差矩阵对角线的混合物将所有状态模式化。为了降低EBN计算的复杂性,我们试验中所使用的CHMM 只有两个通道。我们已经在佐治亚理工学院的人脸数据库(Georgia Tech database)上测试了基于EBN的人脸识别系统[16]。数据库由50个人组成,每个人都有15种可能的面部表情。对于大多数人来说,在为期三个月的时间里,进行两次或三次的会话以采集照片。在图像平面和垂直图像平面里都允许大小,面部表情,照明和旋转有强烈变化。表2比较了试验中获得的辨别率,在试验中,每个人用10种表情来演练每一层EBN并测试剩余的5种表情。在同一数据库基于“特征脸”方法[3]的人脸识别系统达到了68%的正确率。

表2:EHMM, HMM-CHMM, CHMM-HMM 和ECHMM人脸识别的比较

上表表明CHMM-HMM结构的辨别率最高,但是与数据量小的ECHMM相比,提高不大,至于人脸识别的最好模型是哪一种还没有明确的结论。然而,我们的结果表明,在母层用CHMM能提高在母层用一个HMM的EBNs的辨别率,除了后者的灵活性外,第一种结构在图像平面里是更好的模型转换。本文所使用模型的计算复杂性取决于观察概率的估算,观

察概率在所有模型中都相同。然而,对于包括CHMM在内的模型来说,在较多数量的通道下,计算复杂性取决于表1描述的维特比算法。

8、结论

EBN代表了一种新的具有若干分析应用功能的统计模型,并能建立N维相依的数据模型。本文描述了由最优状态分割得出的EBN的演练和识别算法。尤其是具有两个层次的EBN 能够应用于问题如人脸识别,字符识别的图像识别,其中数据基本上是二维的。我们的人脸识别的实验表明:本文所描述的EBN系列优于现存的一些方法如特征脸法,嵌入式隐马尔可夫模型(也是EBN系列中的一种)。用于脸部识别的EBN在自然脸部变化,缩放,旋转方面继承了HMM 和CHMM的灵活性,同时,在很大程度上降低了全面连接的二维HMM 的复杂性。此外,正如第5节所释,最优状态分割的概率能够有效实施并行机制。我们认为EBN在人脸识别上的成功以及它的普适性能够启发EBN应用于图像识别的其他领域和一般的模式识别。

开题报告:人脸识别

北方工业大学 本科毕业设计(论文)开题报告书 题目:基于直方图差值比较方法的人脸识别系统指导教师: 专业班级: 学号: 姓名: 日期:2013年3月20日

一、选题的目的、意义 近些年来,有关人脸的处理已受到广大研究人员越来越多的重视,如人脸识别、人脸定位、面部表情识别、人脸跟踪等。人脸处理系统在安全系统的身份认证、智能人机接口、图像监控、视频检索等领域有着广泛的应用前景。 此外在进行人工智能的研究中,人们一直想做的事情就是让机器具有像人类一样的思考能力,以及识别事物、处理事物的能力,因此从解剖学、心理学、行为感知学等各个角度来探求人类的思维机制、以及感知事物、处理事物的机制,并努力将这些机制用于实践,如各种智能机器人的研制。 同时,进行人脸图像识别研究也具有很大的使用价依。如同人的指纹一样,人脸也具有唯一性,也可用来鉴别一个人的身份。人脸图像的自动识别系统较之指纹识别系统、DNA鉴定等更具方便性,因为它取样方便,可以不接触目标就进行识别,从而开发研究的实际意义更大。并且与指纹图像不同的是,人脸图像受很多因素的干扰:人脸表情的多样性;以及外在的成像过程中的光照,图像尺寸,旋转,姿势变化等。使得同一个人,在不同的环境下拍摄所得到的人脸图像不同,有时更会有很大的差别,给识别带来很大难度。因此在各种干扰条件下实现人脸图像的识别,也就更具有挑战性。 人脸图像识别除了具有重大的理论价值以及极富挑战性外,还其有许多潜在的应用前景,利用人脸图像来进行身份验证,可以不与目标相接触就取得样本图像,而其它的身份验证手段,如指纹、眼睛虹膜等必须通过与目标接触或相当接近来取得样木,在某些场合,这些识别手段就会有不便之处。

如何使用贝叶斯网络工具箱

如何使用贝叶斯网络工具箱 2004-1-7版 翻译:By 斑斑(QQ:23920620) 联系方式:banban23920620@https://www.360docs.net/doc/5016082270.html, 安装 安装Matlab源码 安装C源码 有用的Matlab提示 创建你的第一个贝叶斯网络 手工创建一个模型 从一个文件加载一个模型 使用GUI创建一个模型 推断 处理边缘分布 处理联合分布 虚拟证据 最或然率解释 条件概率分布 列表(多项式)节点 Noisy-or节点 其它(噪音)确定性节点 Softmax(多项式 分对数)节点 神经网络节点 根节点 高斯节点 广义线性模型节点 分类 / 回归树节点 其它连续分布 CPD类型摘要 模型举例 高斯混合模型 PCA、ICA等 专家系统的混合 专家系统的分等级混合 QMR 条件高斯模型 其它混合模型

参数学习 从一个文件里加载数据 从完整的数据中进行最大似然参数估计 先验参数 从完整的数据中(连续)更新贝叶斯参数 数据缺失情况下的最大似然参数估计(EM算法) 参数类型 结构学习 穷举搜索 K2算法 爬山算法 MCMC 主动学习 结构上的EM算法 肉眼观察学习好的图形结构 基于约束的方法 推断函数 联合树 消元法 全局推断方法 快速打分 置信传播 采样(蒙特卡洛法) 推断函数摘要 影响图 / 制定决策 DBNs、HMMs、Kalman滤波器等等

安装 安装Matlab代码 1.下载FullBNT.zip文件。 2.解压文件。 3.编辑"FullBNT/BNT/add_BNT_to_path.m"让它包含正确的工作路径。 4.BNT_HOME = 'FullBNT的工作路径'; 5.打开Matlab。 6.运行BNT需要Matlab版本在V5.2以上。 7.转到BNT的文件夹例如在windows下,键入 8.>> cd C:\kpmurphy\matlab\FullBNT\BNT 9.键入"add_BNT_to_path",执行这个命令。添加路径。添加所有的文件夹在Matlab的路 径下。 10.键入"test_BNT",看看运行是否正常,这时可能产生一些数字和一些警告信息。(你可 以忽视它)但是没有错误信息。 11.仍有问题?你是否编辑了文件?仔细检查上面的步骤。

人脸识别技术的应用背景及研究现状

1.人脸识别技术的应用 随着社会的不断进步以及各方面对于快速有效的自动身份验证的迫切要求,生物特征识别技术在近几十年中得到了飞速的发展。作为人的一种内在属性,并且具有很强的自身稳定性及个体差异性,生物特征成为了自动身份验证的最理想依据。当前的生物特征识别技术主要包括有:指纹识别,视网膜识别,虹膜识别,步态识别,静脉识别,人脸识别等。与其他识别方法相比,人脸识别由于具有直接,友好,方便的特点,使用者无任何心理障碍,易于为用户所接受,从而得到了广泛的研究与应用。除此之外,我们还能够对人脸识别的结果作进一步的分析,得到有关人的性别,表情,年龄等诸多额外的丰富信息,扩展了人脸识别的应用前景。当前的人脸识别技术主要被应用到了以下几个方面:(1)刑侦破案公安部门在档案系统里存储有嫌疑犯的照片,当作案现场或通过其他途径获得某一嫌疑犯的照片或其面部特征的描述之后,可以从数据库中迅速查找确认,大大提高了刑侦破案的准确性和效率。 (2)证件验证在许多场合(如海口,机场,机密部门等)证件验证是检验某人身份的一种常用手段,而身份证,驾驶证等很多其他证件上都有照片,使用人脸识别技术,就可以由机器完成验证识别工作,从而实现自动化智能管理。 (3)视频监控在许多银行,公司,公共场所等处都设有24小时的视频监控。当有异常情况或有陌生人闯入时,需要实时跟踪,监控,识别和报警等。这需要对采集到的图像进行具体分析,且要用到人脸的检测,跟踪和识别技术。 (4)入口控制入口控制的范围很广,既包括了在楼宇,住宅等入口处的安全检查,也包括了在进入计算机系统或情报系统前的身份验证。 (5)表情分析根据人脸图像中的面部变化特征,识别和分析人的情感状态,如高兴,生气等。此外,人脸识别技术还在医学,档案管理,人脸动画,人脸建模,视频会议等方面也有着巨大的应用前景。 2.人脸识别技术在国外的研究现状 当前很多国家展开了有关人脸识别的研究,主要有美国,欧洲国家,日本等,著名的研究机构有美国MIT的Media lab,AI lab,CMU的Human-Computer I nterface Institute,Microsoft Research,英国的Department of Engineerin g in University of Cambridge等。综合有关文献,目前的方法主要集中在以下几个方面: (1)模板匹配 主要有两种方法,固定模板和变形模板。固定模板的方法是首先设计一个或几个参考模板,然后计算测试样本与参考模板之间的某种度量,以是否大于阈值来判断测试样本是否人脸。这种方法比较简单,在早期的系统中采用得比较

神经网络在人脸识别中的应用

神经网络在人脸识别中的应用 1. 引言 早在上世纪60年代末,人脸识别即引起了研究者的强烈兴趣.但早期的人脸识别一般都需要人的某些先验知识,无法摆脱人的干预。进入上世纪90年代,由于高速度、高性能计算机的出现,人脸识别的方法有了重大突破,进入了真正的机器自动识别阶段,人脸识别研究得到了前所未有的重视。人脸识别方法有很多种: (1) 特征脸方法。这种方法起源于图像描述技术,采用特征脸识别方法有良好的 稳定性、位移不变性、特征向量与图像的高度成比例变化以及转置不变性。不足之处是受表情变化、光照角度强度变化和视角变化等严重影响,鲁棒性较差。(2) 隐马尔可夫模型方法(HiddenMarkovModel) 是用于描述信号统计特征的一 组统计模型。HMM 的基本理论是由Baum和Welch等人在20世纪60年代末70年代初建立,在语音识别中应用较多。 (3) 弹性图匹配方法。弹性图匹配方法是一种基于动态连接结构的方法。它将人脸用格状的稀疏图表示。 (4) 神经网络方法。人工神经网络是由多个神经元按照一定的排列顺序构成的,是一个非线性动力学系统,其特色在于信息的分布式存储和并行协同处理。虽然单个神经元的结构极其简单,功能有限,但由大量冲经元所构成的网络系统却能够 实现复杂丰富的功能。神经网络系统除了具有集体运算的能力和自适应的学习能力外,还有根强的容错性和鲁棒性?善于联想、综合和推广。神经网络模型各种各样。它们是从不同的角度对生物神经系统不同层次的描述和模拟。有代表性的网络模型有感知器、多层映射BP网络、RBF网络等。目前,在人工神经网络的实际应用中,绝大部分的神经网络模型都是采用BP网络及其变化形式,它也是前向网

(完整)人脸识别技术大总结,推荐文档

人脸识别技术大总结 百度《人脸识别技术大总结》,觉得应该跟大家分享,这里给大家转摘到百度。 篇一:人脸识别技术的主要研究方法、绪论人脸识别是通过分析脸部器官的唯一形状和位置来进行身份鉴别。 人脸识别是一种重要的生物特征识别技术,应用非常广泛。 与其它身份识别方法相比,人脸识别具有直接、友好和方便等特点,因而,人脸识别问题的研究不仅有重要的应用价值,而且在模式识别中具有重要的理论意义,目前人脸识别已成为当前模式识别和人工智能领域的研究热点。 本章将简单介绍几种人脸识别技术的研究方法。 关键词:人脸识别、人脸识别技术的主要研究方法目前在国内和国外研究人脸识别的方法有很多,常用的方法有:基于几何特征的人脸识别方法、基于代数特征的人脸识别方法、基于连接机制的人脸识别方法以及基于三维数据的人脸识别方法。 人脸识别流程图如图.所示:图.人脸识别流程图、基于几何特征的人脸识别方法基于特征的方法是一种自下而上的人脸检测方法,由于人眼可以将人脸在不此研究人员认为有一个潜在的假设:人脸或人脸的部件可能具有在各种条件下都不会改变的特征或属性,如形状、肤色、纹理、边缘信息等。 基于特征的方法的目标就是寻找上述这些不变特征,并利用这些

特征来定位入脸。 这类方法在特定的环境下非常有效且检测速度较高,对人脸姿态、表情、旋转都不敏感。 但是由于人脸部件的提取通常都借助于边缘算子,因此,这类方法对图像质量要求较高,对光照和背景等有较高的要求,因为光照、噪音、阴影都极有可能破坏人脸部件的边缘,从而影响算法的有效性。 模板匹配算法首先需要人作标准模板(固定模板)或将模板先行参数化(可变模板),思想汇报专题然后在检测人脸时,计算输入图像与模板之间的相关值,这个相关值通常都是独立计算脸部轮廓、眼睛、鼻子和嘴各自的匹配程度后得出的综合描述,最后再根据相关值和预先设定的阈值来确定图像中是否存在人脸。 基于可变模板的人脸检测算法比固定模板算法检测效果要好很多,但是它仍不能有效地处理人脸尺度、姿态和形状等方面的变化。 基于外观形状的方法并不对输入图像进行复杂的预处理,也不需要人工的对人脸特征进行分析或是抽取模板,而是通过使用特定的方法(如主成分分析方法()、支持向量机()、神经网络方法()等)对大量的人脸和非人脸样本组成的训练集(一般为了保证训练得到的检测器精度,非人脸样本集的容量要为人脸样本集的两倍以上)进行学习,再将学习而成的模板或者说分类器用于人脸检测。 因此,这也是种自下而上的方法。 这种方法的优点是利用强大的机器学习算法快速稳定地实现了很

数字图像处理在人脸识别中的应用

基于肤色的人脸检测 摘要 本文介绍了人脸图像识别中所应用MATLAB对图像进行预处理,应用该工具箱对图像进行经典图像处理,通过实例来应用matlab图像处理功能,对某一特定的人脸图像处理,进而应用到人脸识别系统。本文在总结分析人脸识别系统中几种常用的图像预处理方法基础上,利用MATLAB实现了一个集多种预处理方法于一体的通用的人脸图像预处理仿真系统,将该系统作为图像预处理模块可嵌入在人脸识别系统中,并利用灰度图像的直方图比对来实现人脸图像的识别判定。 关键词:脸部定位,特征提取,图像处理,MATLAB

Abasract This paper introduces the application of MATLAB in face image recognition of image preprocessing,the application of the toolkit for classical image processing, application MATLAB image processing function through instance,for a particular face image processing,and then applied to the face recognition system.In face recognition system based on the summary analysis of several commonly used image preprocessing method based on the MATLAB implements a collect a variety of pretreatment method for the integration of the universal facial image preprocessing simulation system,the system as the image preprocessing module can be embedded in a face recognition system,and use the gray histogram of the image matching to realize the face image recognition. Key words:face positioning,feature extraction,picture processing,MATLAB

贝叶斯网络工具箱使用

matlab贝叶斯网络工具箱使用 2010-12-18 02:16:44| 分类:默认分类| 标签:bnet 节点叶斯matlab cpd |字号大中小订阅 生成上面的简单贝叶斯网络,需要设定以下几个指标:节点,有向边和CPT表。 给定节点序,则只需给定无向边,节点序自然给出方向。 以下是matlab命令: N = 4; %给出节点数 dag = false(N,N); %初始化邻接矩阵为全假,表示无边图C = 1; S = 2; R = 3; W = 4; %给出节点序 dag(C,[R,S])=true; %给出有向边C-R,C-S dag([R,S],W)=true; %给出有向边R-W,S-W discrete_nodes = 1:N; %给各节点标号 node_sizes = 2*ones(1,N); %设定每个节点只有两个值 bnet = mk_bnet(dag, node_sizes); %定义贝叶斯网络bnet %bnet结构定义之后,接下来需要设定其参数。 bnet.CPD{C} = tabular_CPD(bnet, C, [0.5 0.5]); bnet.CPD{R} = tabular_CPD(bnet, R, [0.8 0.2 0.2 0.8]); bnet.CPD{S} = tabular_CPD(bnet, S, [0.5 0.9 0.5 0.1]); bnet.CPD{W} = tabular_CPD(bnet, W, [1 0.1 0.1 0.01 0 0.9 0.9 0.99]); 至此完成了手工输入一个简单的贝叶斯网络的全过程。 要画结构图的话可以输入如下命令: G=bnet.dag; draw_graph(G); 得到:

人脸识别系统的原理与发展

人脸识别系统的原理与发展 一、引言 人脸识别系统以人脸识别技术为核心,是一项新兴的生物识别技术,是当今国际科技领域攻关的高精尖技术。它广泛采用区域特征分析算法,融合了计算机图像处理技术与生物统计学原理于一体,利用计算机图像处理技术从视频中提取人像特征点,利用生物统计学的原理进行分析建立数学模型,具有广阔的发展前景。2012年4月,铁路部门宣布车站安检区域将安装用于身份识别的高科技安检系统人脸识别系统;可以对人脸明暗侦测,自动调整动态曝光补偿,人脸追踪侦测,自动调整影像放大; 二、概述 人脸识别系统概述 广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。生物特征识别技术所研究的生物特征包括脸、指纹、手掌纹、虹膜、视网膜、声音(语音)、体形、个人习惯(例如敲击键盘的力度和频率、签字)等,相应的识别技术就有人脸识别、指纹识别、掌纹识别、虹膜识别、视网膜识别、语音识别(用语音识别可以进行身份识别,也可以进行语音内容的识别,只有前者属于生物特征识别技术)、体形识别、键盘敲击识别、签字识别等。 人脸识别系统功能模块 人脸捕获与跟踪功能:人脸捕获是指在一幅图像或视频流的一帧中检测出人像并将人像从背景中分离出来,并自动地将其保存。人像跟踪是指利用人像捕获技术,当指定的人像在摄像头拍摄的范围内移动时自动地对其进行跟踪。 人脸识别比对:人脸识别分核实式和搜索式二种比对模式。核实式是对指将捕获得到的人像或是指定的人像与数据库中已登记的某一对像作比对核实确定其是否为同一人。搜索式的比对是指,从数据库中已登记的所有人像中搜索查找是否有指定的人像存在。 人脸的建模与检索:可以将登记入库的人像数据进行建模提取人脸的特征,并将其生成人脸模板(人脸特征文件)保存到数据库中。在进行人脸搜索时(搜索式),将指定的人像进行建模,再将其与数据库中的所有人的模板相比对识别,最终将根据所比对的相似值列出最相似的人员列表。

神经网络在人脸识别中的应用

神经网络在人脸识别中的应用 1.引言 早在上世纪60年代末, 人脸识别即引起了研究者的强烈兴趣.但早期的人脸识别一般都需要人的某些先验知识, 无法摆脱人的干预。进入上世纪9O年代, 由于高速度、高性能计算机的出现,人脸识别的方法有了重大突破, 进入了真正的机器自动识别阶段, 人脸识别研究得到了前所未有的重视。人脸识别方法有很多种: (1)特征脸方法。这种方法起源于图像描述技术,采用特征脸识别方法有良好的稳定性、位移不变性、特征向量与图像的高度成比例变化以及转置不变性。不足之处是受表情变化、光照角度强度变化和视角变化等严重影响, 鲁棒性较差。(2)隐马尔可夫模型方法(HiddenMarkovMode1)是用于描述信号统计特征的一组统计模型。HMM的基本理论是由Baum和Welch等人在20世纪6O年代末70年代初建立, 在语音识别中应用较多。 (3)弹性图匹配方法。弹性图匹配方法是一种基于动态连接结构的方法。它将人脸用格状的稀疏图表示。 (4)神经网络方法。人工神经网络是由多个神经元按照一定的排列顺序构成的, 是一个非线性动力学系统, 其特色在于信息的分布式存储和并行协同处理。虽然单个神经元的结构极其简单, 功能有限, 但由大量冲经元所构成的网络系统却能够实现复杂丰富的功能。神经网络系统除了具有集体运算的能力和自适应的学习能力外, 还有根强的容错性和鲁棒性.善于联想、综合和推广。神经网络模型各种各样。它们是从不同的角度对生物神经系统不同层次的描述和模拟。有代表性的网络模型有感知器、多层映射BP网络、RBF网络等。目前, 在人工神经网络的实际应用中,绝大部分的神经网络模型都是采用BP网络及其变化形式, 它也是前向网络的核心部分, 是人工神经网络最精华的部分。2BP神经网络的人脸识别BP神经网络用于人脸识别一般应先对输入图像实行图像预处理,然后进行特征提取,接下来就是BP网络训练,最后用训练好的网络进行识别,获得识别结果。 2.基于特征脸和BP 神经网络的人脸识别方法 2.1特征脸分析 这种方法是根据图像的统计特征进行正交变换( K-L 变换) [3] , 以去除样 本间的相关性, 然后根据特征值的大小选择特征向量( 主分量) , 由于这些特 征向量的图像类似人脸, 所以称为特征脸[4, 5] 。下面就这种方法作简要介绍。 X∈RN 为表示一幅图像的随机向量, 这里N是图像的大小, X 由图像的行或列连 接而成的向量。假设有p 个人, 每个人有r1 ( 1≤i≤P) 个人脸样本图像, 样 本集为{ Xji } , Xji表示第j个人的第i个样本。那么每个人样本均值向量为 mi ( 1≤ i≤p) ; 总体样本均值向量为m; 类间散布矩阵为

基于图像处理的人脸识别系统

东北大学 硕士学位论文 基于图像处理的人脸识别系统 姓名:周丹 申请学位级别:硕士 专业:控制理论与控制工程指导教师:王建辉 20050701

东北大学硕士学位论文第一章引言 如何能正确识别大量的人并满足实时性要求是迫切需要解决的问题。总之,要让计算机象人一样方便准确地识别大量的人脸尚需不同学科研究领域的科学家共同做出不懈的努力。 1.3模式识别的基本概念 模式识别研究的内容是利用计算机对客观物体进行分类,在错误概率最小的条件下,使识别的结果尽量与客观物体相符合。 在模式识别学科中,就“模式”与“模式类”而言,模式类是一类事物的代表,而“模式”则是某一事物的具体体现,如数字0,l,2,3,4,5,6,7,8,9是模式类,而用户任意手写的一个数字或任意一个印刷数字则是“模式”,是数字的具体化。 在模式识别技术中,被观测的每个对象称为样品,用x表示,样品的数量用N表示。 对于一个样品来说,必须确定一些与识别有关的因素作为研究的根据,侮‘ 个因素称为一个特征。模式就是样品所具有的特征描述。模式的特征集由处于同 一个特征空间的特征向量表示,特征向量的每个元素成为特征,该向量也因此称为特征向量。一般地用小写英文字母x,个特征,则可把X看作一个n维列向量,x榧 Y,z来表示特征。如果一个样品Ⅳ有n该向量x称为特征向量,记作: ’,X月 模式识别问题就是根据x的几个特征来判别模式工属于q,国:,...,∞。类中的 哪一类。 1.4模式识别系统组成 一个典型的模式识别系统如图3.1所示,由数据获取、预处理、特征提取、分类决策及分类器设计五部分组成。一般分为上下两部分。上半部分完成未知类别模式的分类;下半部分属于设计分类器的训练过程,利用样品进行训练,确定分 2 XG 一一

数字图像处理课程设计人脸检测与识别

数字图像处理课程设计

人脸检测与识别课程设计一、简介人脸检测与识别是当前模式识别领域的一个前沿课题,人脸识别技术就是利用计算机技 术,根据数据库的人脸图像,分析提取出有效的识别信息,用来 “辨认”身份的技术。人脸识别是模式识别研究的一个热点, 它 在身份鉴别、信用卡识别, 护照的核对及监控系统等方面有着广 泛的应用。人脸图像由于受光照、表情以及姿态等因素的影响, 使得同一个人的脸像矩阵差异也比较大。因此, 进行人脸识别时, 所选取的特征必须对上述因素具备一定的稳定性和不变性. 主 元分析(PCA)方法是一种有效的特征提取方法,将人脸图像表示成 一个列向量, 经过PCA 变换后, 不仅可以有效地降低其维数, 同 时又能保留所需要的识别信息, 这些信息对光照、表情以及姿态 具有一定的不敏感性. 在获得有效的特征向量后, 关键问题是设 计具有良好分类能力和鲁棒性的分类器. 支持向量机(SVM ) 模 式识别方法,兼顾训练误差和泛化能力, 在解决小样本、非线性及 高维模式识别问题中表现出许多特有的优势。 本此课程设计基于MATLAB,将检测与识别分开进行。其中检测 部分使用实验指导书上的肤色模型算法进行,不进行赘述。识别 部分采用PCA算法对检测出的人脸图像进行特征提取, 再利用最

邻近距离分类法对特征向量进行分类识别,将在后文具体表述。仿真结果验证了本算法是有效的。 二、人脸检测源码 1.img=imread('D:\std_test_images\face3.jpg'); figure; imshow(img); R=img(:,:,1); G=img(:,:,2); B=img(:,:,3); faceRgn1=(R>95)&(G>40)&(B>20)&max(img,[],3)-min(img,[],3)>15& abs(R-G)>15&R>B; figure; imshow(faceRgn1); r=double(R)./double(sum(img,3)); g=double(G)./double(sum(img,3)); Y=0.3*R+0.59*G+0.11*B; faceRgn2=(r>0.333)&(r<0.664)&(g>0.246)&(g<0.398)&(r>g)& g>=0.5-0.5*r; figure; imshow(faceRgn2); Q=faceRgn1.*faceRgn2;

人脸识别文献综述

文献综述 1 引言 在计算机视觉和模式识别领域,人脸识别技术(Face Recognition Technology,简称FRT)是极具挑战性的课题之一。近年来,随着相关技术的飞速发展和实际需求的日益增长,它已逐渐引起越来越多研究人员的关注。人脸识别在许多领域有实际的和潜在的应用,在诸如证件检验、银行系统、军队安全、安全检查等方面都有相当广阔的应用前景。人脸识别技术用于司法领域,作为辅助手段,进行身份验证,罪犯识别等;用于商业领域,如银行信用卡的身份识别、安全识别系统等等。正是由于人脸识别有着广阔的应用前景,它才越来越成为当前模式识别和人工智能领域的一个研究热点。 虽然人类能够毫不费力的识别出人脸及其表情,但是人脸的机器自动识别仍然是一个高难度的课题。它牵涉到模式识别、图像处理及生理、心理等方面的诸多知识。与指纹、视网膜、虹膜、基因、声音等其他人体生物特征识别系统相比,人脸识别系统更加友好、直接,使用者也没有心理障碍。并且通过人脸的表情/姿态分析,还能获得其他识别系统难以获得的一些信息。 自动人脸识别可以表述为:对给定场景的静态或视频序列图像,利用人脸数据库验证、比对或指认校验场景中存在的人像,同时可以利用其他的间接信息,比如人种、年龄、性别、面部表情、语音等,以减小搜索范围提高识别效率。自上世纪90年代以来,人脸识别研究得到了长足发展,国内外许多知名的理工大学及TT公司都成立了专门的人脸识别研究组,相关的研究综述见文献[1-3]。 本文对近年来自动人脸识别研究进行了综述,分别从人脸识别涉及的理论,人脸检测与定位相关算法及人脸识别核心算法等方面进行了分类整理,并对具有典型意义的方法进行了较为详尽的分析对比。此外,本文还分析介绍了当前人脸识别的优势与困难。 2 人脸识别相关理论 图像是人们出生以来体验最丰富最重要的部分,图像可以以各种各样的形式出现,我们只有意识到不同种类图像的区别,才能更好的理解图像。要建立一套完整的人脸识别系统(Face Recognetion System,简称FRS),必然要综合运用以下几大学科领域的知识: 2.1 数字图像处理技术 数字图像处理又称为计算机图像处理,它是指将图像信号转换成数字信号并利用计算机

JAVA贝叶斯网络算法

贝叶斯网络 提纲: 最近工作: B-COURSE工具学习 BNT研究与学习 BNT相关实验及结果 手动建立贝叶斯网及简单推理 参数学习 结构学习 下一步工作安排 最近工作: 1. B-COURSE 工具学习 B-COURSE是一个供教育者和研究者免费使用的web贝叶斯网络工具。主要分为依赖关系建模和分类器模型设计。输入自己的研究数据,就可以利用该工具在线建立模型,并依据建立好的模型进行简单推理。 B-COURSE要求数据格式是ASCII txt格式的离散数据,其中第一行是各种数据属性变量,其余各行则是采集的样本,属性变量值可以是字符串也可以是数据,属性变量之间用制表符分割,缺失属性变量值用空格代替。读入数据后,在进行结构学习前,可以手动的选择需

要考虑的数据属性!生成过程中,可以手动确定模型,确定好模型后,可以选择JAVA playgroud,看到一个java applet程序,可以手动输入相应证据,从而进行简单推理。 B-COURSE的详细使用介绍,可详见 [url]http://b-course.cs.helsinki.fi/obc/[/url]。 B-COURSE工具隐藏了数据处理,算法实现等技术难点,所以对初学者来说,容易上手。但是却不能够针对不同的应用进行自主编程,缺乏灵活性。 2.贝叶斯网工具箱BNT的研究与学习 基于matlab的贝叶斯网络工具箱BNT是kevin p.murphy基于matlab语言开发的关于贝叶斯网络学习的开源软件包,提供了许多贝叶斯网络学习的底层基础函数库,支持多种类型的节点(概率分布)、精确推理和近似推理、参数学习及结构学习、静态模型和动态模型。 贝叶斯网络表示:BNT中使用矩阵方式表示贝叶斯网络,即若节点i到j有一条弧,则对应矩阵中(i,j)值为1,否则为0。 结构学习算法函数:BNT中提供了较为丰富的结构学习函数,都有: 1. 学习树扩展贝叶斯网络结构的TANC算法learn_struct_tan(). 2. 数据完整条件下学习一般贝叶斯网络结构的K2算法 learn_struct_k2()、贪婪搜索GS(greedy search)算法

人脸识别课程设计报告

用Matlab实现人脸识别 学院:信息工程学院 班级:计科软件普131 成员:

一、问题描述 在一个人脸库中,有15 个人,每人有11 幅图像。要求选定每一个人的若干幅图像组成样本库,由样本库得到特征库。再任取图像库的一张图片,识别它的身份。 对于一幅图像可以看作一个由像素值组成的矩阵,也可以扩展开,看成一个矢量。如一幅N*N象素的图像可以视为长度为N2的矢量,这样就认为这幅图像是位于N2维空间中的一个点,这种图像的矢量表示就是原始的图像空间,但是这个空间仅是可以表示或者检测图像的许多个空间中的一个。不管子空间的具体形式如何,这种方法用于图像识别的基本思想都是一样的,首先选择一个合适的子空间,图像将被投影到这个子空间上,然后利用对图像的这种投影间的某种度量来确定图像间的相似度,最常见的就是各种距离度量。因此,本次采用PCA算法确定一个子空间,最后使用最小距离法进行识别,并用matlab实现。 二、PCA 原理和人脸识别方法 1)K-L 变换 K-L 变换以原始数据的协方差矩阵的归一化正交特征矢量构成的正交矩阵作为变换矩阵,对原始数据进行正交变换,在变换域上实现数据压缩。它具有去相关性、能量集中等特性,属于均方误差测度下,失真最小的一种变换,是最能去除原始数据之间相关性的一种变换。PCA 则是选取协方差矩阵前k 个最大的特征值的特征向量构成K-L 变换矩阵。

2)主成分的数目的选取 保留多少个主成分取决于保留部分的累积方差在方差总和中所占百分比(即累计贡献率),它标志着前几个主成分概括信息之多寡。实践中,粗略规定一个百分比便可决定保留几个主成分;如果多留一个主成分,累积方差增加无几,便不再多留。 3)人脸空间建立 假设一幅人脸图像包含N 个像素点,它可以用一个N 维向量Γ表示。这样,训练样本库就可以用Γi(i=1,...,M)表示。协方差矩阵C 的正交特征向量就是组成人脸空间的基向量,即特征脸。将特征值由大到小排列:λ1≥λ2≥...≥λr,其对应的特征向量为μk。这样每一幅人脸图像都可以投影到由u1,u2,...,ur张成的子空间中。因此,每一幅人脸图像对应于子空间中的一点。同样,子空间的任意一点也对应于一幅图像。 4)人脸识别 有了这样一个由"特征脸"张成的降维子空间,任何一幅人脸图像都可以向其投影得到一组坐标系数,这组系数表明了该图像在子空间中的位置,从而可以作为人脸识别的依据。计算数据库中每张图片在子空间中的坐标,得到一组坐标,作为下一步识别匹配的搜索空间。计算新输入图片在子空间中的坐标,采用最小距离法,遍历搜索空间,得到与其距离最小的坐标向量,该向量对应的人脸图像即为识别匹配的结果。 三、实验步骤

人脸识别技术的几个主要研究方向

人脸识别技术的几个主要研究方向 1 引言 计算机人脸识别是指基于已知的人脸样本库,利用计算机分析图像和模式识别技术从静态或动态场景中,识别或验证一个或多个人脸。通常识别处理后可得到的基本信息包括人脸的位置、尺度和姿态信息。利用特征提取技术还可进一步抽取出更多的生物特征(如:种族、性别、年龄..) 。计算机人脸识别是目前一个非常活跃的研究课题,它可以广泛应用于保安系统、罪犯识别以及身份证明等重要场合。虽然人类对于人脸的识别能力很强,能够记住并辨识上千个不同的人脸,可是对于计算机则困难多了,其表现在:人脸表情丰富;人脸随年龄的增长而变化;发型、胡须、眼镜等装饰对人脸造成的影响;人脸所成图像受光照、成像角度以及成像距离等影响。 计算机人脸识别技术是近20年发展起来的,90年代更成为科研热点,仅从1990 年到1999年之间,EI 可检索到的相关文献多达数千篇,关于人脸识别的综述也屡屡可见[1] 。自动人脸识别系统包括两个主要技术环节首先是人脸检测和定位,然后是对人脸进行特征提取和识别(匹配)。本文着重介绍人脸识别技术的各类方法,通过对比指出各类方法的优缺点及今后的发展方向。 2 人脸检测和定位 人脸检测和定位即对于给定的一幅图像检测图像中是否有人脸,若有则确定其在图像中的位置,并从背景中分割出来。这是个极富挑战性的问题,因为人脸是非刚体,且人脸在图像中的大小和方向以及人的肤色和纹理等方面有很大的可变形。人脸检测问题主要有四种:(1)对于给定的一幅人脸图像,将其中的人脸定位并给出其位置;(2)在一幅混乱的单色场景图中检测出所有的人脸;(3)在彩色图像中检测(定位)所有人脸;(4)在某一视频序列中,检测和定位出所有人脸。文献[2]对人脸检测进行了较为详细的综述,指出常用的人脸检测方法有四种:(1)基于知识的方法;(2)基于人脸固定特征的方法;(3)基于模板匹配的方法;(4)基于外貌的方法(Appearance-based methods),在基于模板匹配的方法中所采用的是预先确定的模板,而在基于外貌的方法中其模板的选择是通过对一系列图像的学习而确定的。一般来说,基于外貌的方法依靠统计和学习技术来找出人脸和非人脸图像的相关特征。在该方法中有特征脸法、基于聚类的方法、神经网络方法和支持向量机的方法。CMU库是常用的人脸检测库,主要的算法评定指标为错误接受率(FAR)和错误拒绝率(ARR)。 3 人脸特征提取和识别 目前大部分研究主要是针对二维正面人脸图像,也有基于三维人脸模型的方法,还有一种所谓的混合系统的身份鉴定系统。 3.1 二维正面人脸识别 在对人脸图像进行特征提取和分类之前一般需要做几何归一化和灰度归一化。几何归一化是指根据人脸定位结果将图像中人脸变换到同一位置和同样大

基于神经网络的人脸识别实验报告

基于神经网络的人脸识实验报告别 一、 实验要求 采用三层前馈BP 神经网络实现标准人脸YALE 数据库的识别。 二、BP 神经网络的结构和学习算法 实验中建议采用如下最简单的三层BP 神经网络,输入层为],,,[21n x x x X =,有n 个神经元节点,输出层具有m 个神经元,网络输出为],,,[21m y y y Y =,隐含层具有k 个神经元,采用BP 学习算法训练神经网络。 BP 神经网络的结构 BP 网络在本质上是一种输入到输出的映射,它能够学习大量的输入与输出之间的映射关系,而不需要任何输入和输出之间的精确的数学表达式,只要用已知的模式对BP 网络加以训练,网络就具有输入输出对之间的映射能力。 BP 网络执行的是有教师训练,其样本集是由形如(输入向量,期望输出向量)的向量对构成的。在开始训练前,所有的权值和阈值都应该用一些不同的小随机数进行初始化。 BP 算法主要包括两个阶段: (1) 向前传播阶段 ①从样本集中取一个样本(X p ,Y p ),将X p 输入网络,其中X p 为输入向量,Y p 为期望输出向量。 ②计算相应的实际输出O p 。 在此阶段,信息从输入层经过逐级的变换,传送到输出层。这个过程也是网络在完成训练后正常运行时执行的过程。在此过程中,网络执行的是下列运算: (1)(2)()21(...((())...))n p n p O F F F X W W W = (2) 向后传播阶段 ①计算实际输出O p 与相应的理想输出Y p 的差; ②按极小化误差的方法调整权矩阵。 这两个阶段的工作一般应受到精度要求的控制,定义

21 1()2m p pj pj j E y o ==-∑ (1) 作为网络关于第p 个样本的误差测度(误差函数)。而将网络关于整个样本集的误差测度定义为 p E E =∑ (2) 如前所述,将此阶段称为向后传播阶段,也称之为误差传播阶段。 为了更清楚地说明本文所使用的BP 网络的训练过程,首先假设输入层、中间层和输出层的单元数分别是N 、L 和M 。X=(x 0,x 1,…,x N-1)是加到网络的输入矢量,H=(h 0,h 1,…,h L-1)是中间层输出矢量,Y=(y 0,y 1,…,y M-1)是网络的实际输出矢量,并且用D=(d 0,d 1,…,d M-1)来表示训练组中各模式的目标输出矢量。输出单元i 到隐单元j 的权值是V ij ,而隐单元j 到输出单元k 的权值是W jk 。另外用θk 和Φj 来分别表示输出单元和隐单元的阈值。 于是,中间层各单元的输出为: 1 0()N j ij i j i h f V x φ-==+∑ (3) 而输出层各单元的输出是: 1 0()L k jk j k j y f W h θ-==+∑ (4) 其中f(*)是激励函数,采用S 型函数: 1 ()1x f x e -=+ (5) 在上述条件下,网络的训练过程如下: (1) 选定训练集。由相应的训练策略选择样本图像作为训练集。 (2) 初始化各权值V ij ,W jk 和阈值Φj ,θk ,将其设置为接近于0的随机值,并初始化精度控制参数ε和学习率α。 (3) 从训练集中取一个输入向量X 加到网络,并给定它的目标输出向量D 。 (4) 利用式(7)计算出一个中间层输出H ,再用式(8)计算出网络的实际输出Y 。 (5) 将输出矢量中的元素y k 与目标矢量中的元素d k 进行比较,计算出M 个输出误差项:()(1)k k k k k d y y y δ=--对中间层的隐单元也计算出L 个误差项: 1 *0(1)M J j j k jk k h h W δδ-==-∑ (6) 依次计算出各权值和阈值的调整量: ()(/(1))*((1)1)**jk jk k j W n L W n h αδ?=+?-+ (6)

数字图像处理课程设计——人脸检测与识别

: 数字图像处理 课 程 设 计 ] $

: 人脸检测与识别课程设计 一、简介 人脸检测与识别是当前模式识别领域的一个前沿课题,人脸识别技术就是利用计算机技术,根据数据库的人脸图像,分析提取出有效的识别信息,用来“辨认”身份的技术。人脸识别是模式识别研究的一个热点, 它在身份鉴别、信用卡识别, 护照的核对及监控系统等方面有着广泛的应用。人脸图像由于受光照、表情以及姿态等因素的影响, 使得同一个人的脸像矩阵差异也比较大。因此, 进行人脸识别时, 所选取的特征必须对上述因素具备一定的稳定性和不变 性. 主元分析(PCA)方法是一种有效的特征提取方法,将人脸图像表示成一个列向量, 经过PCA 变换后, 不仅可以有效地降低其维数, 同时又能保留所需要的识别信息, 这些信息对光照、表情以及姿态具有一定的不敏感性. 在获得有效的特征向量后, 关键问题是设计具有良好分类能力和鲁棒性的分类器. 支持向量机 (SVM ) 模式识别方法,兼顾训练误差和泛化能力, 在解决小样本、非线性及高维模式识别问题中表现出许多特有的优势。 本此课程设计基于MATLAB,将检测与识别分开进行。其中检测部分使用实验指导书上的肤色模型算法进行,不进行赘述。识别部分采用PCA算法对检测出的人脸图像进行特征提取, 再利用最邻近距离分类法对特征向量进行分类识别,将在后文具体表述。仿真结果验

证了本算法是有效的。 二、人脸检测 1.》 2.源码 img=imread('D:\std_test_images\'); figure; imshow(img); R=img(:,:,1); G=img(:,:,2); B=img(:,:,3); faceRgn1=(R>95)&(G>40)&(B>20)&max(img,[],3)-min(img,[],3)>15&abs(R-G)>15&R>B; ~ figure; imshow(faceRgn1); r=double(R)./double(sum(img,3)); g=double(G)./double(sum(img,3)); Y=*R+*G+*B; faceRgn2=(r>&(r<&(g>&(g<&(r>g)&g>='Boundingbox'); BB1=struct2cell(BB); BB2=cell2mat(BB1); ) figure; imshow(img); [s1 s2]=size(BB2); mx=0; for k=3:4:s2-1 p=BB2(1,k)*BB2(1,k+1); if p>mx&(BB2(1,k)/BB2(1,k+1))< mx=p; ! j=k; hold on; rectangle('position',[BB2(1,j-2),BB2(1,j-1),BB2(1,j),BB2(1,j+1)],'linewidth',3,'edg ecolor','r'); hold off; end end

基于BP神经网络的人脸识别

基于BP神经网络的人脸识别 学生:林仙土学号:S071954 摘要:人脸自动识别技术有着广阔的应用领域,本文提出用主成分分析和BP神经网络进行人脸识别。人脸识别包括两个部分:第一,特征提取;第二,神经网络进行识别。 关键词:BP神经网络人脸识别主成分分析 本系统采用20幅图像(4个人每人5幅)作为训练图像,应用主成分分析对训练图像进行二阶相关和降维,提取训练图像的独立基成分构造人脸子空间,并将训练集中的人脸图像向独立基上投影得到的系数输入改进的BP神经网络进行训练。然后将待识别的人脸图像向独立基上投影得到投影系数,再将其输入已训练过的BP神经网络进行识别。此方法对人脸库图像进行测试,识别率达到90%以上。本系统采用MATLAB编程,并运用了其中的GUI编程实现人机交互。 为在不同机子下顺利运行,本系统用uigetdir函数让用户选择训练图像库和待识别图像,使得待识别图像可在不同位置皆可让软件识别。 注意:待识别图像的名字必须是test.jpg。 系统界面: 程序: function varargout=BP(varargin) gui_Singleton=1;

gui_State=struct('gui_Name',mfilename,... 'gui_Singleton',gui_Singleton,... 'gui_OpeningFcn',@BP_OpeningFcn,... 'gui_OutputFcn',@BP_OutputFcn,... 'gui_LayoutFcn',[],... 'gui_Callback',[]); if nargin&&ischar(varargin{1}) gui_State.gui_Callback=str2func(varargin{1}); end if nargout [varargout{1:nargout}]=gui_mainfcn(gui_State,varargin{:}); else gui_mainfcn(gui_State,varargin{:}); end function BP_OpeningFcn(hObject,eventdata,handles,varargin) handles.output=hObject; guidata(hObject,handles); %UIWAIT makes BP wait for user response(see UIRESUME) %uiwait(handles.figure1); %---Outputs from this function are returned to the command line. function varargout=BP_OutputFcn(hObject,eventdata,handles) %varargout cell array for returning output args(see VARARGOUT); %hObject handle to figure %eventdata reserved-to be defined in a future version of MATLAB %handles structure with handles and user data(see GUIDATA) %Get default command line output from handles structure varargout{1}=handles.output; %---Executes on button press in input. function input_Callback(hObject,eventdata,handles) %hObject handle to input(see GCBO) %eventdata reserved-to be defined in a future version of MATLAB %handles structure with handles and user data(see GUIDATA) global TestDatabasePath TestDatabasePath=uigetdir('D:\','Select test database path'); axes(handles.axes1); a=imread(strcat(TestDatabasePath,'\test.jpg')); imshow(a) set(handles.text1,'string','image for recognition') %---Executes on button press in recognise. function recognise_Callback(hObject,eventdata,handles) %hObject handle to recognise(see GCBO) %eventdata reserved-to be defined in a future version of MATLAB %handles structure with handles and user data(see GUIDATA) TrainDatabasePath=uigetdir('D:\','Select training database path');

相关文档
最新文档