人体运动的检测和识别研究

人体运动的检测和识别研究
人体运动的检测和识别研究

模式识别中文核心期刊《微计算机信息》(测控自动'f:.15)2008年第24卷第2-1期文章编号:1008—0570(2008)02…1021002

人体运动的检测和识别研究

StudyonDetectionandIdentificationofHumanMovement

(北京榭吏大学)宋修雷王志良

SONGXIULEIWANGZHILIANG

摘要:本文针对人体运动视觉分析中的行为理解和分析等高层视觉问题进行分析,研究了一种静止摄像机条件下的行为理解和分析的算法,它以运动序列中的关键帧为基础,针对关键帧提取人体的骨架信息,然后通过Hu不变矩来提取特征,最后组成特征向量,通过对HMM模型的训练来识别特定运动序列的语义。

关键词:运动识别:计算机视觉;I-EVllM

中图分类号:TP391.4文献标识码:A

Abstract:Thispaperfocusesonvisualanalysisofhumanmovementandtheunderstandingofhighlevelvisualproblems.Itgivesanalgorismtocomprehend

andanalysispeopleSmovementifthecameraisnotmoved.Wepresentanalgorithmbasedonkeyframes,thistechniquecanbemoreeffectiveintheoriginalsequencebyreducingtheinterferenceofdetectionandidentification.

Keywords:movementidentification,computervision,HMM

1引言

计算机视觉是计算机科学和人工智能领域的一个重要分支.它研究的主要内容是怎样利用各种成像系统代替视觉器官作为信号输入手段,用计算机代替大脑完成对信息的处理和解释。计算机视觉的最终研究目标,就是使计算机能象人那样通过视觉观察和理解世界。

运动物体的检测、跟踪和行为的理解与描述是计算机视觉领域的一个重要课题。也是计算机能否象人那样通过视觉观察和理解世界的关键所在。目前在运动物体检测领域,国内外有关这方面的研究很多,但是目前的许多方法都受到了一定条件的局限性。比如我们在使用背景差对运动目标进行检测时,发现了这种方法受光线亮度变化的影响很大,同时当背景中有物体移人或移出时.这种方法检测的效果正确性受到很大影响。对行为的理解与描述国内外的文献相对较少。可以说是一个比检测和跟踪更加困难的研究领域。针对这些问题,我们提出一种能够在简单背景下对人体行为进行理解和描述的方法。该方法将运动的检测、跟踪和行为的理解和描述联系到一起,使两者相辅相成。解决了两者分离情况下研究中的难点问题。

2关键帧算法

直接比较的人体的运动来识别运动的语义是不可能的,因为人体区域随着肢体的摆动而呈现非刚性的变化。这里我们对运动序列进行分解,原则是提取运动序列中的关键帧进行分析。关键帧的定义是在运动方向发生变化的时刻对应的图像帧。从运动中来看,运动方向发生变化的时刻,必定是序列图像在水平或者是垂直方向的投影在时间轴上出现了极值。所以我们就可

宋修雷:硕士研究生

基金项目:本论文得到国家自然科学基金(N0.60573059)、

北京市“现代信息科学与网络技术”重点实验室基金

(No.TDXX0503)和北京科技大学重点基金的支持以根据这条规则来从运动序列中提取关键帧。一个完整的具有具体语义的运动序列可以由一个相对应的关键帧序列来表示。

通过关键帧的方法完成了对运动序列的第一次特征提取。图1是对关键帧提取的一个示例。图2是一个行走运动序列的关键帧表示。

图1关键帧的提取

彳彳kk

图2行走运动序列的关键帧表示

3特征提取

3.1骨架算法

首先要从待处理的序列图像中抽取出目标人体的轮廓,获

一210—360元,年邮局订阅号:82-946 

万方数据

隧瓣瓣黧黼溺鬻糕黎§豢。瓣渊

模式识别

得对应的二值图像。由于研究对象——人体保持运动状态,首

同目标图像区域计算其不变矩,并以不变矩作为特征量来对具先可以利用运动信息把人体运动部分从复杂背景中提取出来,有旋转和尺度变化的目标图像进行识别。

然后利用运动部分的位置和灰度信息,获得人体轮廓的二值图概率密度分布函数为f(x,y)的二维连续随机函数的p+q阶像。具体过程如下:

规则矩(也称几何矩)m。的定义为:

(1)对相邻两帧图像进行差分运算,抽取其运动部分,统计m。=.1。j。xPy4,(工,y)dxdyP,q:0,1…2.

运动部分的灰度信息。

二维MxN数字化图像f(m,n)的规则矩定义为:

(2)利用运动部分的灰度信息,根据第1步的结果提取人体轮廓。

(3)抽取出人体轮廓后,对图像做二值化处理。

f0,点(x,y)∈轮廓区域

g【工'"211,点(‘y)正轮廓区域

得到人体轮廓二值图像。

对于彩色图像,算法原理不变,进行比较的信息则由灰度变成对应像素点的RGB值。人体运动具有多样性和复杂性,人体轮廓作为一种复杂模式,单凭某一种信息(灰度或彩色信息)和某一种方法很难得出很精确的结果。在后续算法中给出的用于提取人体轮廓的虚拟骨架的能量函数法对图像噪声有很好的抑制作用,因此,由上述方法所抽取的人体轮廓在精度上完全可以满足后续算法的需要。

利用已得到有关人体轮廓的二值图像I(x,y):

,,…、一fo,像素(x,y)在人体轮廓区域内

u“川一11,像素(z,y)在人体轮廓区域外

定义如下的能量函数

E(x,Y,,)=II.(r一√“2+v2),(x+甜,Y+v)dudv一二_一

式中积分区域D为位于人体轮廓内部的、圆心P(x,Y)和半径r均可改变的一个圆形区域。在上述能量函数中,第1项的目的是使所设定的圆形区域保持在人体的内部.第2项的目的是使该圆的半径r达到极大值,其中,仪为一个常量,用来调整所述圆形积分区域的半径对能量函数的影响,它的取值与图像的平均灰度有关.一般取2或3。当x’Y和r的取值使能量函数£(x,Y,r)达到最小时,上述积分圆形区域D的圆心P(x,y)位于轮廓中轴线上.半径r的取值则使圆的外缘和人体轮廓线切。

如图3所示.据此可以确定虚拟骨架上的一个一个的点。

(a1,㈣为相邻两帧图像,(c)为差分图像,(d)为提取的人体轮廓,

(e)为抽取的虚拟骨架和关节点的位置,(D为与真实关节位置的比较。

a=3.K--O08

图3实验室环境下骨架提取

3.2不变矩特征

这里我们假设同一物体的图像序列之间只相差一个旋转、平移和尺度变换,即同一物体的不同图像差别有物体摆放的方向、位置或摄像机与物体间距离不同引起的尺度不同。因此可

以找到一些不变量。这些量只与物体形状有关与它们的位置、方

位、尺度无关,这就是矩不变量。矩不变量是目标图像的一种区域描述,也是目标的特征匹配的常用方法。由于它对平移、旋转

和尺度变化的目标具有不变性,因此可以对经区域分割得到不

聊w

2萎善∥矿,(%川M=o'1,2…

阶次为n的规则矩的完备集包括所有满P+q≤n条件的

in。,因而共有妻o+1)0+2)个元素。单项式乘积xpyu和m啊u是

这种矩定义的基底函数。

既然一幅图像具有有限的面积,并且在最坏的情况下也是分段连续的,那么所有阶的规则矩都存在,所求得的矩集可唯一描述该幅图像所包含的信息。要将一幅图中的信息全部表征出来需要无限多的矩值,对于实际应用来讲,需要选取矩集的一个子集.只要这个子集对于某个特定应用包含表征该图像的足够有用信息就可以了。

两个一阶矩{mo,,m,。}用来确定目标的质心。质心的坐标6,Y一)给出了二条分别平行于x轴和y轴的直线X=X一和y=歹的交点。

质心坐标由下式计算:

;:鱼

了:塑

m00

m00

如果目标的质心与坐标系的原点重合,即;=o和;=o,那么

由此求得的矩值称为中心矩,由‰表示:

%2LL

o一工)’(y—y)9,(工,y)dxdy

Hu定义了由三阶规格化后的中心矩的非线性组合构成的七个量值,它们对目标的位置,尺度和方向的变化保持不变。在得到人体的骨架信息后。我们提取骨架图像的7个hu不变矩作为特征向量.至此就完成了对运动序列的分解和特征提取.为HMM的学习和训练做好了准备。

4原型设计

人体运动检测和识别的原型系统包括以下几个模块:数据采集模块,图像预处理模块,关键帧提取模块,人体骨架提取模块,不变矩计算模块,HMM训练和识别模块。如图4所示。

图4人体运动检测和识别流程图

吓转第291页)

r—————————————r——————一…一1}《阻c技术廒瓣2∞例》i

nlll摸Jl邮局订阅号:82-946

36。,L/-q-一21l一

 

万方数据

鼬婆塞堡型塑墼鳖塞差鎏{

软件天地

向为飞机推进系统稳定性。李军,男,(1964.2-),汉,教授,主要研作者简介:邹滨(1981一),男,湖南常德人,讲师,博士,研究方向:究方向为飞机推进系统稳定性。

GIS理论与应用、生态环境遥感。

Biography:WangLeming:male,(1981.11一),the

Hannationali-(410083湖南中南大学)邹滨

ty,masterPostgraduate,Major

in

studying

of

the

aviation(410083湖南东北师范大学)杨令宾佟志军张继权

propulsion

system

stability?Li

Jun,male,(1964?2一),theHan

通讯地址:(410083湖南省长沙市岳麓区中南大学本部采矿

nanon射1ty,粤譬s0。,

MaJor

m吼udymgofth8

avlanon

propul。

楼419)邹滨

(7l∞;8陕西陕蔷西安空军工程大学工程学院)王乐明李军(收稿日期:2007?¨?03)“彦稿日期:2008.0H5)

需嚣:(飞军7100代38墓兰貔3-程学院研姓11眦乐明(上接第2?,页)通讯地址

空军工程大学程学院研究生

队)王乐明卜‘一一’…‘“7

(收稿日期:2007.11.03)(修稿日期:2008.01.15)

(上接第184页)

图6空间数据共享实验平台下的服务集成效果本文作者的创新点是:将WebService技术引入到传统的WebGIS二次开发组件构建了一种新型空间数据共享模式.并

以ArclMS

WebService和GeoBeansWebService为例开展了分

布、异构空间数据共享实验,为打破传统的空间数据共享壁垒提供了一种新的解决思路。参考文献:

[11何建邦,吴平生问国年.地理信息共享方法研究[M】.北京:科学

出版社,2003.

[2】陈述彭.“数字鸿沟”与地球信息科学的应对田.’钡9绘科学,2003,28(3):1-4.

【3】龚健雅.当代GIS的若干理论与技术[M】.武汉:测绘科技大学出版社,1999.

f4】蒋红兵,蒙印.WebGIS的空间数据共享与互操作[J】.四川测绘,2005,28(1):20-22.

【5】沈体雁,程承旗.基于空间元数据的分布式地理模型及应用研究【J】坝8绘通报,1999,7:34—37.

[6]马林兵,齐华.基于可重用WebService的GIS数据集成和共享【J】.铁路航测,2003,2:1-3.

[7】孙华峰,钱雪忠.一种基于Web服务的服务组合体系结构叨微计算机信息,2006,22(5—3):79—81.

f8】岳小婷,李森.深入理解WEBSERVICE[J].新疆师范大学学报,2003,22(1):22-28.

【91WANGHongbing.Webservices:problemsandfuturedirections

阴.Web

Semantics:Science

2004,l(3):309?320.

【lO】许春杰,邹乐君.基于WebService的WebGIS数据共享研究叨.测绘通报,2003,1:41--43.[11mAWenjue,CHEN

Yumin,GONG

Jianya.Implemenfa

tionof

OGCWebMapServiceBasedOnWebService[J1.GeospatialIn-

formationScience,2004,7(2):148—152.

图5对行走的识别图

图5是我们所设计的原型系统的界面图。从图中可以看出我们的原型系统可以比较准确的识别出人体的行走动作。

本文作者创新点:我们给出了一种对人体运动进行检测和

识别的方法。该方法对对简单背景下单人运动序列的识别具备良好的适应性。但是对于多人,运动不规范的条件下,还有许多

工作要做。对于人体运动检测和识别的未来。作者认为以下的几个方面值得重点关注:

(1)在运动序列语义的描述方法上面,基于关键帧的算法虽然可以很好的体现运动序列的前后关系,但是对于相邻关键帧之间的信息没有做到充分的利用。这将是今后一个值得深入研究的课题。

(2)基于HMM的建模技术,本文主要是应用离散模型。由于人体运动的多样性和复杂性,本文给出的模型仍然需要进行相应的改进。参考文献:

【l】张雷,刘冀伟,王志良.固定场景下的运动检测与运动跟踪阴微计算机信息,2006,9—1:287—289。

作者简介:宋修雷,1981年生,男,硕士研究生,研究方向:图像处理和机器视觉,王志良,1956年生,男,博士生导师,北京科技大学教授,研究方向:人工智能与人工心理。

Biography:Song

Xiulei(1981一),Male,Beijing,Universityof

Sci?

ence

andTechnologyBering,Master,Pattern

Recognitionand

IntelligentSystems,Interestingfields:ImageProcessing,Machine

Vision.

(100083北京市北京科技大学信息工程学院)宋修雷王志良通讯地址:000083北京北京科技大学112#信箱)宋修雷

(收稿日期:2007.11.03)(修稿日期:2008.01.15)

|<PLC技窳斑溺200例》{

@畔一邮局订眠82艄360元/彩1一

 万方数据

人体运动的检测和识别研究

作者:宋修雷, 王志良, SONG XIULEI, WANG ZHILIANG

作者单位:北京科技大学信息工程学院,北京市,100083

刊名:

微计算机信息

英文刊名:CONTROL & AUTOMATION

年,卷(期):2008,24(4)

被引用次数:0次

参考文献(1条)

1.张雷.刘冀伟.王志良固定场景下的运动检测与运动跟踪[期刊论文]-微计算机信息 2006

相似文献(10条)

1.学位论文苏国辉基于视频的人体运动识别系统研究2007

随着计算机视觉和图像处理技术的不断发展,基于视频的人体运动识别、跟踪和分析已成为计算机视觉领域的一个备受关注的研究方向,其在智能监控、人机接口、体育性能分析、医疗诊断、基于内容的图像存储和检索以及视频会议等方面都有着广阔的应用前景。目前,基于视频的人体运动识别分析大致分为三个步骤:第一步,从复杂背景中提取出运动人体;第二步,人体运动跟踪与重构;第三步,人的行为识别与理解。前面两步是第三步的基础,因而目前的研究主要集中在前面两步当中。

本文提出了一种基于平行双目视觉模型的人体运动分析方法。首先,对于输入的人体运动视频图像序列,通过基于背景减除的方法获得初步的人体轮廓,再利用数学形态学里的闭运算和开运算去除噪声区域和填充人体内部的空洞区域,将运动人体从背景中提取出来。获得人体轮廓图像后,对于人机交互的场合,论文提出了一种基于模板匹配的简单人体姿态识别方法,该方法主要以人体轮廓图像的几何矩作为特征,与事先通过训练建立好的人体姿态库中的标准姿态进行比较,判断出该人体姿态的类型。此外,论文还介绍了基于几何矩和方向直方图的手势识别方法。

在获取人体轮廓的基础上,提出了一种基于LK光流和Kalman滤波器的人体运动跟踪方法。首先建立一个基于关节点的人体二维骨架模型,在运动的首帧通过自动标注的方法确定人体关节点的位置,在后续帧采用LK光流算法跟踪标注的关节点,并利用Kalman滤波器修正跟踪出错的关节点。提出的人体模型关节点的自动标注方法在一定程度上减少了系统中的人工干预。

获得人体二维骨架运动序列后,建立平行双目视觉模型对各关节点进行重建。首先利用张正友标定对摄像机进行标定,得到摄像机的内部参数,其后通过立体匹配确定关节点在左右摄像机图像当中的图像像素坐标,进而实现对关节点的三维重建,恢复人体三维姿态。

最后,在Visual C++环境下编程实现了人体运动识别系统。实验结果表明,本文提出的人体运动分析识别的方法是行之有效的,并为进一步的研究奠定了良好的基础。

2.学位论文李振波低维空间人体运动分析技术研究2007

在计算机中生成满足人们需要的三维人体运动是一项长期而艰巨的任务.近年来,随着计算机动画、虚拟现实、游戏、影视等产业的不断发展,人们对研究三维空间中的人体运动产生了浓厚的兴趣.但由于描述人体运动的状态空间维数非常高,运动状态空间非常巨大(从优美的舞蹈动作到激烈的体育比赛,无不是人体运动状态空间的子空间),使得三维空间中人体运动的生成变得非常困难.

当前运动捕捉技术已经成为获取真实的人体运动信息的主流技术,运动捕获数据真实地反映了人体的运动过程.由于运动数据中包含了人体关节点的三维运动信息,它具有传统的二维图像运动分析所不具有的真实、准确的优点.经过近十年的发展,人们已经积累了大量的运动捕获数据,从运动数据出发建立人体运动分析模型或者统计模型的研究条件已经具备.

三维空间人体运动的特点是运动是多刚体、多自由度的,对其直接分析具有很大的难度.但同时我们注意到人体运动具有一定的规律性,如在走路过程中,人体上肢与下肢的运动关系遵循一定的运动模式.通过对人体运动的这种规律性知识的学习可以建立人体运动的分析模型或者统计模型.这种运动分析模型或者统计模型对于计算机视觉中的人体运动跟踪、运动识别以及计算机动画制作都是十分重要的.在人体运动跟踪中加入人体运动的先验知识可以极大地提高运动跟踪的效率和准确性.通过对给定的人体运动先验模型的似然观察可以对指定的运动进行分类和识别.另外,在计算机动画中这种模型可以用于减少生成运动的状态空间,提高动画制作的自动化程度.

建立人体运动分析模型或者统计模型过程中一个很重要的方法是对人体运动的状态空间进行降维表示.本文从理论和实际应用的角度,对低维空间中的人体运动分析技术进行了研究.本文研究的目的是通过运动状态空间降维,在低维空间对运动的特征及规律进行描述,为运动跟踪及运动合成等提供先验知识,本文的主要贡献如下:

1.提出了建立包括现象模型和解剖模型的分层结构的三维人体运动模型表示思想.针对当前不同系统中三维人体运动模型表示不统一的问题,定义了两种层次的人体运动表示模型.同时在运动模型中引入特定运动的统计特征,增加了相应运动的动态约束条件.这种分层结构的运动模型可以满足不同应用的需求.

2.提出人体运动虚关节的概念,利用线性方法对人体运动的状态空间进行降维表示,将高维的运动数据映射到低维空间.并在此基础上提出了一种利用运动数据产生不同级别真实感人体运动的方法,提出了低维空间中人体运动周期的获取策略和在低维空间利用运动数据进行身份识别的方法.

3.提出了利用高斯过程动态模型(Gaussian Process Dynamical Model,GPDM)和三维曲线矩不变量(3D Curve Moment Invariant)进行运动的非线性低维描述的方法,高斯过程动态模型可以对运动序列进行非线性学习,获取低维空间的非线性运动特征,三维曲线矩不变量用来对获取的三维空间隐式曲线进行几何描述,从而实现在非线性隐式空间进行运动的特征描述和识别;

4.提出了一种空间投影模型,建立了基于投影图像的人体运动识别方法,将三维空间的人体姿态和运动识别问题转化为二维空间投影图像之间的特征提取和匹配,实现了基于姿态投影的运动识别原型系统.

3.学位论文向坚基于三维捕获数据的人体运动分析关键技术研究2007

二十世纪九十年代以来,随着运动捕获技术的兴起,以及设备技术的进步,大量的三维人体运动捕获数据生成,并被广泛的应用在计算机动画,游戏,医学仿真,电影特技等领域。在此背景下,基于运动捕获数据的研究,已经成为近年来计算机视觉,图形学研究领域和动漫应用领域的一大热点。 随着大量三维人体运动捕获数据库的出现,使得如何对人体运动数据进行高效分析和处理,从而有效利用运动捕获数据库成为一个新的挑战。在这些挑战中,如何从复杂的人体运动中找到能正确表达运动信息的本质特征,如何从浩如烟海的运动数据中检索出用户所需要的运动,以及如何去合理高效的重用处理后的运动数据,都是该领域关心的热点问题。

本论文的目的是针对基于三维捕获数据的人体运动分析处理技术的上述关键问题,研究如何正确的提取人体运动的特征,如何不失真的对运动数据进行降维以及索引,探索如何用机器学习的方法对运动库的数据进行自动分析,以及如何结合子空间的方法对人体运动进行编辑和合成,从而实现利用运动捕获数据库进行动漫创作,电影特技制作等实际应用。主要完成了以下工作:

1.运动捕获数据的特征提取。不同于传统的运动特征提取方法,考虑运动的几何结构能够较真实地反映运动内在属性。二维的几何特征只能较好的表达运动的局部几何结构,本文提出的三维时空特征则从全局几何结构角度出发,不仅能够有效表达各个关节点独立运动信息,而且能够反映关节点之间相互作用的运动属性。

2.运动的特征数据的降维和分段。提取出来运动特征维数较高,为了克服维数灾难,实现运动数据的识别和检索,本文利用主成分分析(Principal ComponentsAnalysis,PCA)和扩展等距特征映射(Isometric Feature Mapping,ISOMAP)方法对高维运动特征进行线性和非线性降维。同时,对于长运动

序列,还利用上述方法对运动数据在子空间进行分段,将其分解为单个运动类型的短运动片段,以利于后续分析和处理。

3.运动数据的高效索引和快速匹配。为了适应大规模数据库的需要,本文对降维分段等预处理之后的运动数据提出了基于决策树,多示例学习和集成学习的有效索引方法以过滤绝大部分和查询例子不相关的运动样例,综合考虑人体各个关节点对运动影响的重要性,达到加速检索的目的。

4.基于子空间的运动编辑和合成。由于运动数据在子空间的内在隐藏属性能够在子空间被反映出来,本文提出了对运动数据在流形子空间进行线性和非线性映射,从而分离出风格参数的方法,进而对其进行编辑生成新风格运动。

5.系统实现。本文实现了上述运动捕获数据的分析处理技术和方法,并给出了人体运动检索和运动编辑合成的结果。

4.期刊论文杜友田.陈峰.徐文立.李永彬.DU You-tian.CHEN Feng.XU Wen-li.LI Yong-bin基于视觉的人的运动

识别综述-电子学报2007,35(1)

目前,基于视觉的人的运动分析是一个非常活跃的研究领域,而对人的运动进行理解和识别更是该领域内一个富有挑战性的研究方向,它在智能监控、感知接口和基于内容的视频检索等领域具有广泛的应用前景.本文对人的运动识别领域近年来的发展作了比较详细的论述,从人运动的类别、运动表示方法和运动识别方法三个方面分析了该方向的进展情况,并对当前该研究方向上亟待解决的问题做了比较详细的分析.

5.学位论文柴桦基于视频的人体运动识别方法研究2008

目前,基于视频的人体运动分析是一个非常活跃的研究领域,而其高级阶段,人体运动识别更是该领域内一个富于挑战性的课题,它在人机交互、智能监控、体育性能分析、内容检索等领域具有广泛的应用前景。在分析总结国内外计算机领域关于人体运动识别研究工作的基础上,本文作者从视频中运动捕获的数据出发,针对具有复杂动作特征的人体动作识别和人体连续动作识别,分别建立了合适的模型。主要研究内容如下:

首先,针对传统概率模型中对观测序列的限制和存在的“标记偏置”问题,提出了基于条件随机场模型描述人体动作时序特征序列的方法。该方法无需对观测建模,从而避免了独立性假设,并在优化过程中进行全局归一化又能解决“标记偏置”问题,从而更符合实际情况中人体动作建模。此外

,由于条件随机场模型具有容纳观测值重叠和长距离依赖特征的特点,该方法在处理复杂人体动作识别时具有很强的优势。

然后,针对人体连续动作的动作分段和识别,提出一种将条件随机场和条件概率密度传播相结合的方法。该方法将连续动作识别分解成各个单个动作识别的分治方法。首先利用条件概率密度对连续动作序列进行分割,采用一种先假设再验证的策略,假设多个可能的动作分段,再以条件随机场输出的概率形式的识别结果验证分段假设。由于分割时去除了动作转换过程中部分过渡帧,从而减轻了过渡姿势的影响,提高了识别的鲁棒性和正确率。

实验结果表明,本文作者提出的复杂动作识别和连续动作识别方法是行之有效的,并为进一步的研究奠定了良好的基础。

6.学位论文杨锋基于图像序列的三维重建2009

视觉是人类获取信息、认识世界的重要途径。计算机视觉就是用计算机模拟人眼的视觉功能,从图像或图像序列中提取信息,对客观世界的三维景物和物体进行形态和运动识别。在最近三十年内,计算机视觉技术有了突飞猛进的发展,其应用范围遍及工业、农业、医学、军事等多个领域。

三维重建技术是研究如何通过二维信息来获取物体在空间中的三维信息的技术,具有广泛的应用前景。它涉及到的学科也非常广泛,包括特征点提取、图像匹配、多视图几何理论、数值分析方法、计算机图形学、三维建模等多个领域。

本文提出了一种两幅图像间基本矩阵的自动计算算法,该算法结合SIFT特征点,并以RANSAC算法作为搜索引擎。该算法仅需图像作为输入,不需要其它先验信息;而输出是基本矩阵的估计以及一组对应的特征点。

本文设计并完成了一种基于图像序列的三维重建系统,详细地阐述了系统实现的流程,对其中涉及到的特征点提取与匹配、图像间关系建立、运动与结构的更新、自标定、稠密匹配等多种技术进行了较深入的研究。实验证明,本文实现的三维重建系统能够较好地还原出实际物体的外观,并且具有较高的重建精度。

7.学位论文于虹基于视频图像的人体运动识别与跟踪研究2006

近年来,从人体运动的图像序列中检测、识别和跟踪感兴趣的人体部位是图像处理和计算机视觉领域中的热门课题之一,它具有非常广阔的应用前景。例如,在医学方面,运用人体运动来分析伤残患者的运动信息,能对他们的病症诊断和身体康复起到很大地帮助;在体育运动方面,运用人体运动来分析运动员的运动信息,对提高他们的运动成绩是很有帮助的。人体运动分析过程首先是获取由摄像机摄入的视频图像序列,然后采用适当地跟踪算法对运动人体的关节点进行跟踪,最后把关节点在图像序列中的坐标进行三维重构,并用所获取的三维参数进行人体运动进行分析。

本文主要研究的是如何在保证匹配精度的条件下快速、准确地确定图像序列中人体各个关节点的位置,并使之能够应用到运动解析中。本文通过对已有算法的分析和根据人体关节点运动的实际需要,在四步运动矢量查找算法FourStepSearch(FSS)的基础之上采用了一种效率更高,查找更准确的自适应大小查找算法AdaptiveSizeSearch(ASS)。此外本文还重点研究了基于均值偏移的目标跟踪算法(MeanShiftAlgorithm),并在此基础上,对均值偏移算法进行了改进,提出了一种适应运动幅度较大地人体关节点的动态均值偏移跟踪算法。通过对均值偏移算法和动态均值偏移跟踪算法的分析和实验比较,可以看出动态均值偏移跟踪算法,由于利用了目标的空间位置信息,从而提高了跟踪目标的可靠性和有效性。为了更进一步地提高跟踪运动目标的准确性,本文提出了将动态偏移跟踪算法与多种常用矩结合起来,对人体关节点目标进行了跟踪。

8.学位论文张建华基于二维视频序列的伪立体视频重建方法研究2007

计算机视觉就是用计算机模拟人眼的视觉功能,从图像或图像序列中提取信息,对客观世界的三维景物和物体进行形态和运动识别。计算机视觉是计算机科学研究领域的重要分支,其研究的核心问题是从景物图像或序列图像求出景物的精确的三维几何描述,并定量的确定景物中物体的空间性质

,其过程是成像过程的逆过程。从二维视频序列中重建三维视频序列是诸多学术领域,包括计算机科学,计算机视觉,人工智能,医学等广泛关注的一个课题。

本文主要是根据双目立体视觉原理讨论了如何将二维视频序列转换成伪3D视频序列的方法。

视频运动的分割是计算机视觉的基础,本文主要根据时域和空域信息,采用了根据运动信息结合边缘检测的方法进行分割。

要得到三维视频,就必须要有立体视差,立体视差是计算机视觉的重要内容,也是三维重建中的关键技术,本文通过对现在的视差算法研究,提出了采用基于三角形网格的浓密视差提取方法。但是对二维视频序列来说,其本身并不包含有视差信息,但我们可以根据二维视频序列中的运动信息,纹理信息,遮挡信息等信息来估算视差,本文主要采用的方法是根据运动信息来估算视差。

根据双目立体视觉原理和立体显示技术,将二维视频帧经过变换,得到伪三维立体视频帧,并合成视频序列。根据分色式立体显示技术,最终获得了具有立体感的伪立体视频图像。

9.学位论文王江涛基于视频的目标检测、跟踪及其行为识别研究2008

目标的检测、跟踪与行为识别作为视频监控的主要研究内容,是当前计算机视觉领域的研究热点,其不但具有重要的实际意义,而且对计算机视觉的其他研究领域有着重要的推动作用。视频监控技术研究的主要目的是赋予机器视觉系统人类的视觉感知功能,以能够在图像序列中发现目标、跟踪目标,并对目标的行为进行识别和理解。经过几十年尤其是近十年的不懈研究,上述技术取得了长足的进步,但实践表明一般意义上的目标检测、跟踪与行为识别技术还远未成熟,要开发出真正鲁棒、实用的视频监控系统还需要更为鲁棒的核心算法。本论文主要对视频监控相关的关键技术进行研究,研究内容涉及目标的检测、目标的跟踪以及人体行为识别等方向,内容涵盖了可见光图像和红外图像领域。现对论文的主要创新点概述如下:

1)提出一种基于几何约束和颜色信息的人脸检测算法该方法在充分考虑人脸区域与头发区域的颜色特征与几何关系的基础上,给出了用于描述人脸区域和头发区域之间几何约束的表达模型;在对肤色区域和头发区域分别进行检测后,根据不同候选区域之间的几何关系,通过几何约束对人脸和头发可能存在的区域进行特征判别,完成对图像中的人脸检测。

2)分别提出一种单幅红外图像中和序列红外图像中的人体检测方法在单幅红外图像中,针对红外图像中人体图像亮度较高的特点,首先通过亮度方向投影确定可能存在人体的候选区域,进而采用方向梯度直方图对候选目标进行描述。最后将方向梯度直方图作为输入向量采用。Fisher线性判别和贝叶斯分类器对候选目标进行分类,完成对候选目标中存在的人体进行检测。在红外序列图像中,首先采用自适应高斯混合模型对序列图像进行背景建模,在准确分割出前景目标的基础上,设计了一种新的人体目标表达模型。以人体表达模型作为输入向量,构建支持向量机对人体目标进行分类判别。在不同的红外场景下进行人体检测实验时,所提出的两种算法均取得了满意的检测效果。

3)从自适应目标表达特征的选取和遮挡情况下的目标跟踪两个角度出发对Mean-Shift框架下的目标跟踪问题进行了改进Mean-ShiR框架下的目标跟踪

大多采用静态目标表达模型,这在动态变化的场景中容易导致跟踪失败。针对该缺点,论文提出一种基于自适应特征生成模型的目标跟踪方法。通过构建目标和背景的局部信噪比,对当前目标所处特征空间的可跟踪性进行量化评估,选用性能最优的表达模型作为当前的特征跟踪模型。实验表明,与采用静态模型相比,提出的算法具有更好的鲁棒性和可行性。

经典的Mean-Shift算法要求目标在连续两帧之间部分的重合,在目标发生遮挡时难以满足该条件。该论文将目标的运动在较短时间内看作一时不变系统,通过引入Kalman滤波进行参数辨识而使发生遮挡后的跟踪系统具有后续状态预测的能力。整个跟踪过程分为Mean-Shift跟踪下的Kalman参数辨识和基于Kalman状态估计的Bhattacharyya系数分析两个子过程交替执行。对不同的视频序列测试的结果表明,算法能够对发生遮挡后的目标进行持续、稳健的跟踪。

4)在粒子滤波跟踪框架下提出一种多线索融合方法在复杂的动态背景下,采用多线索进行目标跟踪可以提高系统的鲁棒性。论文在注意到不同特征具有不同的鉴别性能的基础上,从分析采样粒子和参考样本的特征空间距离和物理距离之间的关系出发,提出相对鉴别系数这一概念对不同特征间的鉴别性能进行描述,进而采用二次加权的方法对不同特征进行融合。实验结果表明,所提出的算法在多个复杂场景下均能够对目标进行准确、鲁棒的跟踪。

5)提出一种基于周期运动分析的人体运动识别方法人体运动识别是视频监控的最终研究目标之一,论文对此提出一种基于周期运动分析的人体运动识别方法。该方法首先通过背景抽耿获取人体的前景图像,并采用3个参数对人体的轮廓变化进行测量,以获取人体运动的周期。然后将人体图像投影到一个低维的特征空间中,此时同一周期所包含的特征点组成一个封闭的环。最后设计了一种特征距离函数求取不同的运动环之间的距离,对不同的运动进行分类识别。

上述的几个创新点,按照在视频监控任务中所处的层次,由低到高有机连接,为视频监控技术的实用化提供了理论支持。

10.学位论文张颖康关于摄像机标定与三维重建技术的研究2008

视觉是人类获取信息、认识世界的重要途径。计算机视觉就是用计算机模拟人眼的视觉功能,从图像中提取信息,对客观世界的三维景物和物体进行形态和运动识别。在最近三十年内,计算机视觉技术有了突飞猛进的发展,其应用范围遍及工业、农业、医学、军事等多个领域。

摄像机标定是计算机视觉领域中的关键技术,标定的过程是通过建立摄像机图像像素位置与场景点位置之间的关系,最终确定摄像机内部几何和光学特性(内部参数)以及摄像机在三维空间坐标系中的位置和方向(外部参数)。摄像机标定的精度直接影响着整个视觉系统的精度,此项技术也是三维重建技术得以实现的重要基础。

三维重建技术是研究如何通过二维信息来获取物体在空间中的三维信息的技术,它涉及到的学科非常广泛,包括特征点提取、图像匹配、摄像机标定、多视图几何理论、数值分析方法、计算机图形学等多个领域的理论,具有广泛的应用前景。

本文针对计算机视觉中摄像机标定和三维重建技术进行了较深入的理论研究和充分的实践工作。分析了摄像机标定的多种实现方法,并针对双目和多目视觉系统等多种应用场合,提出了一些切实可行的摄像机标定方法。结合实验,总结出了影响摄像机标定精度的诸多因素。实现了一种基于图像序列的三维重建技术,对其中涉及到的特征点提取和匹配、射影重建、摄像机自标定、稠密匹配等技术进行了详细的阐述。在若干具体环节上提出了一些有效的方法,如误匹配点的剔出、基准图像对的选择、重叠匹配、添加图像的选择,自适应RANSAC算法求解运动等等。实验证明,本文实现的三维重建系统能够较好的还原出实际物体的外观,并且具有较高的重建精度。

本文链接:https://www.360docs.net/doc/3d8332618.html,/Periodical_wjsjxx200804089.aspx

授权使用:武汉科技大学(whkjdx),授权号:f84b4d8b-90e3-4727-b853-9e1100aad2eb

下载时间:2010年10月16日

运动目标检测光流法

摘要 运动目标检测方法是研究如何完成对视频图像序列中感兴趣的运动目标区域的“准确定位”问题。光流场指图像灰度模式的表面运动,它可以反映视频相邻帧之间的运动信息,因而可以用于运动目标的检测。MATLAB这种语言可移植性好、可扩展性强,再加上其中有丰富的图像处理函数,所以利用MATLAB 软件来用光流法对运动目标的检测中具有很大的优势。本设计主要可以借助matlab软件编写程序,运用Horn-Schunck算法对图像前后两帧进行处理,画出图像的光流场。而图像的光流场每个像素都有一个运动矢量,因此可以反映相邻帧之间的运动,分析图像的光流场就可以得出图像中的运动目标的运动情况。 关键字:光流法;Horn-Schunck算法;matlab

目录 1光流法的设计目的 (1) 2光流法的原理 (1) 2.1光流法的介绍 (1) 2.1.1光流与光流场的概念 (1) 2.1光流法检测运动目标的原理 (2) 2.1.1光流场计算的基本原理 (2) 2.2.2基于梯度的光流场算法 (2) 2.2.3Horn-Schunck算法 (3) 2.2.4光流法检测运动目标物体的基本原理概述 (5) 3光流法的程序具体实现 (6) 3.1源代码 (6) 3.1.1求解光流场函数 (6) 3.1.2求导函数 (9) 3.1.3高斯滤波函数 (9) 3.1.4平滑性约束条件函数 (10) 3.1.5画图函数 (10) 4仿真图及分析 (12) 结论 (13) 参考文献 (14)

1 光流法的设计目的 数字图像处理,就是用数字计算机及其他有关数字技术,对图像进行处理,以达到预期的目的。随着计算机的发展,图像处理技术在许多领域得到了广泛应用,数字图像处理已成为电子信息、通信、计算机、自动化、信号处理等专业的重要课程。 数字图像处理课程设计是在学习完数字图像处理的相关理论后,进行的综合性训练课程,其目的是:使学生进一步巩固数字图像处理的基本概念、理论、分析方法和实现方法;增强学生应用Matlab编写数字图像处理的应用程序及分析、解决实际问题的能力;尝试所学的内容解决实际工程问题,培养学生的工程实践能力。 运动目标检测是数字图像处理技术的一个主要部分,近些年来,随着多媒体技术的迅猛发展和计算机性能的不断提高,动态图像处理技术日益受到人们的青睞,并且取得了丰硕的成果,广泛应用于交通管理、军事目标跟踪、生物医学等领域。 因此,基于光流法,实现运动目标的检测是本文的研究对象。结合图书馆书籍、网上资料以及现有期刊杂志,初步建立起运动目标检测的整体思路和方法。 2 光流法的原理 2.1 光流法的介绍 2.1.1 光流与光流场的概念 光流是指空间运动物体在观测成像面上的像素运动的瞬时速度,它利用图像序列像素强度数据的时域变化和相关性来确定各自像素位置的“运动”,即反映图像灰度在时间上的变化与景物中物体结构及其运动的关系。将二维图像平面特定坐标点上的灰度瞬时变化率定义为光流矢量。视觉心理学认为人与被观察物体

人体运动的检测和识别研究

模式识别中文核心期刊《微计算机信息》(测控自动'f:.15)2008年第24卷第2-1期文章编号:1008—0570(2008)02…1021002 人体运动的检测和识别研究 StudyonDetectionandIdentificationofHumanMovement (北京榭吏大学)宋修雷王志良 SONGXIULEIWANGZHILIANG 摘要:本文针对人体运动视觉分析中的行为理解和分析等高层视觉问题进行分析,研究了一种静止摄像机条件下的行为理解和分析的算法,它以运动序列中的关键帧为基础,针对关键帧提取人体的骨架信息,然后通过Hu不变矩来提取特征,最后组成特征向量,通过对HMM模型的训练来识别特定运动序列的语义。 关键词:运动识别:计算机视觉;I-EVllM 中图分类号:TP391.4文献标识码:A Abstract:Thispaperfocusesonvisualanalysisofhumanmovementandtheunderstandingofhighlevelvisualproblems.Itgivesanalgorismtocomprehend andanalysispeopleSmovementifthecameraisnotmoved.Wepresentanalgorithmbasedonkeyframes,thistechniquecanbemoreeffectiveintheoriginalsequencebyreducingtheinterferenceofdetectionandidentification. Keywords:movementidentification,computervision,HMM 1引言 计算机视觉是计算机科学和人工智能领域的一个重要分支.它研究的主要内容是怎样利用各种成像系统代替视觉器官作为信号输入手段,用计算机代替大脑完成对信息的处理和解释。计算机视觉的最终研究目标,就是使计算机能象人那样通过视觉观察和理解世界。 运动物体的检测、跟踪和行为的理解与描述是计算机视觉领域的一个重要课题。也是计算机能否象人那样通过视觉观察和理解世界的关键所在。目前在运动物体检测领域,国内外有关这方面的研究很多,但是目前的许多方法都受到了一定条件的局限性。比如我们在使用背景差对运动目标进行检测时,发现了这种方法受光线亮度变化的影响很大,同时当背景中有物体移人或移出时.这种方法检测的效果正确性受到很大影响。对行为的理解与描述国内外的文献相对较少。可以说是一个比检测和跟踪更加困难的研究领域。针对这些问题,我们提出一种能够在简单背景下对人体行为进行理解和描述的方法。该方法将运动的检测、跟踪和行为的理解和描述联系到一起,使两者相辅相成。解决了两者分离情况下研究中的难点问题。 2关键帧算法 直接比较的人体的运动来识别运动的语义是不可能的,因为人体区域随着肢体的摆动而呈现非刚性的变化。这里我们对运动序列进行分解,原则是提取运动序列中的关键帧进行分析。关键帧的定义是在运动方向发生变化的时刻对应的图像帧。从运动中来看,运动方向发生变化的时刻,必定是序列图像在水平或者是垂直方向的投影在时间轴上出现了极值。所以我们就可 宋修雷:硕士研究生 基金项目:本论文得到国家自然科学基金(N0.60573059)、 北京市“现代信息科学与网络技术”重点实验室基金 (No.TDXX0503)和北京科技大学重点基金的支持以根据这条规则来从运动序列中提取关键帧。一个完整的具有具体语义的运动序列可以由一个相对应的关键帧序列来表示。 通过关键帧的方法完成了对运动序列的第一次特征提取。图1是对关键帧提取的一个示例。图2是一个行走运动序列的关键帧表示。 图1关键帧的提取 彳彳kk 图2行走运动序列的关键帧表示 3特征提取 3.1骨架算法 首先要从待处理的序列图像中抽取出目标人体的轮廓,获 一210—360元,年邮局订阅号:82-946  万方数据

基于视频的运动人体检测技术研究

基于视频的运动人体检测技术研究 摘要在视频监控领域中,快速准确地检测出运动人体,是后续进行运动分析的初级处理。本文将单摄像头拍摄的视频流,首先转换成静止的图像帧,通过MATLAB利用中值法进行背景模型的重建,背景减除来进行运动目标检测,并通过图像后处理技术,将运动人体快速准确地检测出来。通过对公共视频数据库及自拍视频的检测实验,均得到了较理想的运动人体图像,证明了该技术的可行性。 关键词视频序列;运动人体;MATLAB;目标检测 前言 当今社会,智能视频监控已分布到各行各业,是安全防范系统的重要组成部分。运动人体的检测是视频监控系统进行运动分析的最底层,是后续进行各种高级处理如目标分类、行为理解等的基础。本文以视频监控系统的应用为目的,将单摄像头拍摄的彩色视频流,首先转换成静止的图像帧,通过MATLAB利用中值法进行背景模型的重建,背景减除来进行运动目标检测,并通过图像后处理技术,检测到了较理想的运动人体图像。 1 运动目标检测 背景减除是当前最简单也是最常用的一种检测方法。该方法通过将当前图像帧与背景图像的灰度值直接进行相减操作,并将得到的差值与某一阈值T进行比较,大于阈值T的即被认定为是目标点,赋值为1;反之,认定为是背景点,赋值为0,进而检测出运动人体目标。 1.1 中值法背景建模 根据视频序列的特点,在时间序列上,运动人体经过视频图像上某一位置的时间是非常短暂的,大部分时间在该位置上显示的都是背景图像,因此本文利用中值法[1-2]来进行背景模型的重新建立,该方法能够利用图像序列中的一部分图像重新构造出精确的背景图像。其思想就是将图像序列中的部分图像按照其中像素的顺序进行排列,然后选出中间的像素值以此作为背景图像中对应位置处的像素值,遍历图像序列中所有的像素,即可以获得精确的背景图像。 1.2 差分及二值化 采用前述的背景减除法对图像进行差分操作,得到的差分结果为灰度图像,而在后续的处理过程中,用到更多的是二值化图像。将灰度图像进行二值化的常用方法是阈值分割法,其中阈值的选取至关重要。 根据阈值选取的不同一般分为局部阈值算法和全局阈值算法。全局阈值算法

基于骨骼数据的人体行为识别分析

基于骨骼数据的人体行为识别 摘要 人体动作姿态识别是计算机视觉研究领域中最具挑战的研究方向,是当前的研究热点。对人体动作姿态进行自动识别将带来一种全新的交互方式,通过身体语言即人体的姿态和动作来传达用户的意思,如在机场、工厂等喧闹的环境下,采用手势、动作姿态识别等人机交互技术能够提供比语音识别更加准确的信息输入。总之,在智能监控、虚拟现实、感知用户接口以及基于内容的视频检索等领域,人体动作姿态的识别均具有广泛的应用前景。该文首先简单介绍了人体动作姿态序列的分割,然后对人体动作姿态识别的方法进行了分类介绍,并对一些典型的算法的研究进展情况及其优缺点进行了重点介绍。 关键词:人体动作姿态识别; 人工智能; 隐马尔可夫模型; 动态贝叶斯网络; 模板匹配前言 人体姿态识别是计算机视觉的一个重要研究方向,它最终目的是输出人的整体或者局部肢体的结构参数,如人体轮廓、头部的位置与朝向、人体关节点的位置或者部位类别。姿态识别的研究方法应该说,几乎涵盖了计算机视觉领域所有理论与技术,像模式识别、机器学习、人工智能、图像图形、统计学等。到目前为止,已经有众多识别方法被提出,并且也取得了许多重要的阶段性的研究成果,但是以往的方法都是基于普通光学图像,比如常见的RGB 图像,这类图像容易受光照、阴影等外界变化的影响,尤其在环境黑暗的情况下无法来识别人体姿态,并且由于人体关节自由度大,及人的体型、着装较大差异性,常导致姿态识别系统识别率低。尽管有研究者利用多个摄像机获取采集的图像来获取人体深度信息以克服以上问题[1],但是该类方法恢复的深度信息不是唯一的,而且计算量非常大,尤其是这种方法要求事先用人工对传感设备进行标定,而在选取场景中的标定物时,往往又会遇到实际环境操作困难的问题。 随着光电技术的快速发展,深度传感设备的成本逐渐降低,人们获取深图像的途径及方法也越来越多。该方向的研究也逐渐成为计算机视觉领域的研究趋势。具体原因包括:一方面,深度传感设备不仅操作简单,并且极大简化了普通摄像机的标定过程;另一方面,得到的深度图像由于直接包含了人体的深度信息,能够有效的克服普通光学图像遇到的上述问题。到目前为止,较有影响力的基于该类图像的人体姿态识别算法,应该是 Shotton 等人利用一种深度传感器 Kinect 来实时捕捉人体运动的算法,该算法虽然能够满足人们对识别系统实时性的要求,但其对硬件要求特别高,并且不适合低分辨率图像中的人体关节点提取,容易导致人体骨架扭曲。下文将具体陈述人体运动分析的主要用途和前人在不同时期对这些难题的处理办法。 主题 基于计算机视觉的人体运动分析不仅在智能监控、人机交互、虚拟现实和基于内容的视频检索等方面有着广泛的应用前景,更是成为了未来研究的前瞻性方向之一。Gavrila 总结了它的一些主要应用领域[2,3,4],下面据此对其典型应用做出进一步的介绍。 智能监控(Smart Surveillance) 所谓“智能监控”是指监控系统能够监视一定场景中人的活动,并对其行为行分析和识别,跟踪其中的可疑行为(例如在一些重要地点经常徘徊或者人流密集的场合下突发的人群拥挤等状况)从而采取相应的报警措施。智能监控系统应用最多的场合来自于那些对安全

运动目标检测方法总结报告

摘要 由于计算机技术的迅猛发展,使得基于内容的视频信息的存取、操作和检索不仅成为一种可能,更成为一种需要。同时,基于内容的视频编码标准MPEG-4和基于内容的视频描述标准MPEG-7正在发展和完善。因此提取和视频中具有语义的运动目标是一个急需解决的问题。运动目标提取和检测作为视频和图像处理领域的重要研究领域,有很强的研究和应用价值。运动检测就是将运动目标从含有背景的图像中分离出来,如果仅仅依靠一种检测算法,难以从复杂的自然图像序列中完整地检测出运动的目标。较高的检测精度和效率十分重要,因此融合多种检测方法的研究越来越受到重视。本文介绍了几种国内外文献中的经典的视频运动目标的检测和提取算法,并对各种方法进行了评价和总结。首先介绍了基本的运动目标检测的基本知识和理论,然后介绍了基本的几种目标检测方法及其各种改进方法。对今后的运动目标检测提取的相关研究提供一定的参考。 关键词:运动目标检测光流法帧差法背景建模方法

ABSTRACT Because of the rapid development of computer technology, it is possible to access, operate and retrieve the video information based on the content of the video. At the same time, based on the content of the video coding standard MPEG-4 and content-based video description standard MPEG-7 is developing and improving. Therefore, it is an urgent problem to be solved in the extraction and video. Moving object extraction and detection is a very important field of video and image processing, and has a strong research and application value. Motion detection is to separate moving objects from the image containing background, if only rely on a detection algorithm, it is difficult to from a complex natural image sequences to detect moving target. Higher detection accuracy and efficiency are very important, so the study of the fusion of multiple detection methods is becoming more and more important. In this paper, the detection and extraction algorithms of the classical video moving objects in the domestic and foreign literatures are introduced, and the methods are evaluated and summarized. Firstly, the basic knowledge and theory of basic moving target detection is introduced, and then the basic method of target detection is introduced. To provide a reference for the research on the extraction of moving target detection in the future. Keywords: Visual tracking Optical flow method Frame Difference Background modeling method

人体行为识别技术

人体行为识别技术 在计算机视觉领域中,人体运动行为识别是一个被广泛关注的热点问题,在智能监控、机器人、人机交互、虚拟现实,智能家居,智能安防,运动员辅助训练等方面有巨大应用价值。行为识别问题一般遵从如下基本过程:数据图像预处理,运动人体检测、运动特征提取、特征训练与分类、行为识别。着重从这几方面逐一回顾了近年来人体行为识别的发展现状和常有方法。并对当前该研究方向上待解决的问题和未来趋势做了分析。行为理解可以简单地认为是时变数据的分类问题,即将测试序列与预先标定的代表典型行为的参考序列进行匹配。通过对大量行为理解研究文献的整理发现:人行为理解研究一般遵从特征提取与运动表征、行为识别、高层行为与场景理解等几个基本过程。 特征提取与运动表征是在对目标检测、分类和跟踪等底层和中层处理的基础上,从目标的运动信息中提取目标图像特征并用来表征目标运动状态;行为识别则是将输入序列中提取的运动特征与参考序列进行匹配,判断当前的动作处于哪种行为模型;高层行为与场景理解是结合行为发生的场景信息和相关领域知识,识别复杂行为,实现对事件和场景的理解。【2】 1、行为识别的应用 从应用领域的分类来讲,可以将人体运动分析的应用分成如下几个领域: ①智能监控 这里所指的“智能”包含两个方面的含义。一种“智能”是指系统能够在一定的场景中检测是否有人的出现(如通过检测人脸的方法)防止只是简单的通过 运动目标检测所造成的错误报警(例如因为动物活动或者刮风摇动树枝等等而造

成误报)。另外一种“智能”是指系统能够监视一定场所中人的活动,并对其行为进行分析和识别,跟踪可疑行为(如经常在重要地点徘徊等等行为)从而采取相应的报警措施。通常把报警系统设置于银行、机场、车站、码头、超市、办公大楼、住宅小区等地,以实现对这些场所的智能监控。 ②虚拟现实 跟踪现实世界人的姿态,从而创建一个虚拟的仿真场景,实现人与这个虚拟世界的交互。该领域的具体应用涉及视频游戏、虚拟摄影棚、计算机动画等方面。 ③高级用户接口 指可以通过对用户手势的识别来代替传统的鼠标和键盘输入,从而实现人与计算机之间的智能交互。此外,通过对手势语言的理解,还可以进行聋人与计算机之间的手语交流。 ④运动分析 人体运动分析可以运用于基于容的视频检索领域。例如可以检索在运动会上单杠比赛中运动员的杠上动作。这样可以节省用户大量的查询视频资料的时间和精力。另外一种应用是用于各种体育项目中,提取运动员的各项技术参数(如关节位置、角度和角速度,等等),通过分析这些信息,可以为运动员的训练提供指导和建议,有助于提高运动员的训练水平。此外,还可以用于体育舞蹈动作的分析,以及临床矫形术的研究等领域。 ⑤基于模型的视频编码 通过提取一定的静态场景中人物的形态特征参数和3D姿态参数,以较低的数据量对视频数据流加以描述,实现视频数据的压缩和低比特率传送。可以用于在因特网上展开远程视频会议以及VOD(Video-On-Demand)视频点播。

基于视频序列的人体动作识别

密级:学校代码:10075 分类号:学号:20081194 工学硕士学位论文 基于视频序列的人体动作识别 学位申请人:刘涛 指导教师:张欣教授 学位类别:工学硕士 学科专业:电路与系统 授予单位:河北大学 答辩日期:二○一三年六月

Classified Index: CODE: 10075 U.D.C.: NO: 20081194 A Dissertation for the Degree of Master Human Action Recognition Based on Video Sequences Candidate:Liu Tao Supervisor:Prof. Zhang Xin Academic Degree Applied for:Master of Engineering Specialty:Circuits and Systems University:Hebei University Date of Oral Examination:June, 2013

河北大学 学位论文独创性声明 本人郑重声明:所呈交的学位论文,是本人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写的研究成果,也不包含为获得河北大学或其他教育机构的学位或证书所使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了致谢。 作者签名:日期:年月日 学位论文使用授权声明 本人完全了解河北大学有关保留、使用学位论文的规定,即:学校有权保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。学校可以公布论文的全部或部分内容,可以采用影印、缩印或其他复制手段保存论文。 本学位论文属于 1、保密□,在年月日解密后适用本授权声明。 2、不保密□。 (请在以上相应方格内打“√”)

视频图像中运动目标检测

视频图像中运动目标检测

毕业论文 题目视频图像中运动目标检测 方法研究 专业电气工程及其自动化 班级电气1003 学生曹文 学号20113024543 指导教师赵哥君 二〇一二年六月八日

摘要 在很多现代化领域,运动目标检测都显示出了其重要的作用。尤其是近二十年的社会经济的飞速发展,运动目标检测都彰显了其重要性,在航空、通信、航海等各个方面都有关键性的作用,从而使运动目标检测方法的研究成为各国的研究热门课题。 通过阅读大量的相关论文、期刊及其网络资源,了解了高斯背景建模及背景更新的基本原理及思想。在本文中,首先介绍了运动目标检测方法的相关基础知识,如图像的二值化、图像的形态学处理、颜色空间模型。然后重点说明了三种常用的运动目标检测方法的研究,简要阐述了三种研究方法的基本思想。在老师的帮助下进行了相应的实验,最终得出了三种运动目标检测方法的优点和缺点,着重探究了高斯背景建模及其背景更新基本原理及思想。 最后,通过相关的程序及软件对混合高斯背景模型进行了相关的实验,进而发现了混合高斯背景建模算法存在的不足之处,如:高斯背景建模的计算量大、运动目标较大时检测效果差等问题,并对对这些问题提出了相关设想及改进。 关键词:运动目标检测;二值化;图像的形态学处理;高斯背景建模;背景更新 I

ABSTRACT In many modern fields, moving target detection are showing its important role. Especially nearly twenty years of rapid development of social economy, the moving target detection has shown its importance, in various aviation, communication, navigation and so on have a key role, so the study of moving target detection method has become a research hot topic in countries. By reading relevant papers, a large number of journals and cyber source, understand the basic principle and thought of Gauss background modeling and updating the background. In this paper, firstly introduces the basic knowledge of moving target detection method, such as the two values image, morphological image processing, color space model. Then focus on the study of three methods used for moving object detection, a brief description of the basic ideas of the three kinds of research methods. By the experiment, the results of three kinds of method of moving target detection has advantages and disadvantages, this paper emphatically explores Gauss background modeling and background updating basic principle and thought. Finally, through the program and software related to mixed Gauss background model for the relevant experiments, and found the shortcomings, the presence of mixed Gauss background modeling algorithm such as: the problem of computing Gauss background modeling, moving target volume larger detection effect is poor, and on these problems put forward relevant ideas and improvement. Keywords: moving object detection; two values; I I

运动人体图像识别

学习报告 一.意义和背景 随着信息技术的快速发展壮大和应用的普及,利用计算机视觉的技术在图像处理方面和模式识别领域中研究,并对视频图像进行人体运动特征提取与有效识别已成为人们关注的热点问题。计算机视觉技术对人体运动的视频或者图像进行识别是基于对其视频或者图像的序列进行分析处理;对检测出的人体运动目标进行运动特征提取和分类识别,从而达到理解和描述其行为的目的。基于视频图像的人体运动特征分析在智能视频监控、智能接口、虚拟现实等领域有着相当广阔的应用前景。 人体运动特征的提取与识别需要结合生物识别技术来识别和判断运动中人的行为、区别个体身份。所谓生物识别技术,其具体操作就是利用人体与生俱来的生物特征进行个体身份认证,最显著的特点是具有不变性和唯一性。 人体运动特征包括:肢体摆动特征,步态特征,人体轮廓投影特征,人体对称特征等,其中从视觉监控的角度来看,步态特征是远距离场景条件下最具有代表性最典型的人体运动特征,近年来备受关注,同时也涌现出大量富有意义的步态识别算法。 二.人体运动特征识别研究 运动特征识别在当今的科研领域中涉及面广泛,主要涉及到图像处理,多传感器技术,虚拟现实,模式识别,计算机视觉和图形学,

计算机辅助设计,可视化技术,智能机器人等一系列研究领域。针对人体运动图像序列进行分析处理的运动人体视觉分析技术,一般情况下可分为以下几个过程,运动目标检测,运动目标特征提取以及识别复杂背景下的运动目标身份。 图1 典型的运动特征识别系统 运动特征识别的主要研究方法 目前运动特征识别中的运动特征包含了两种分量:结构化分量和动态分量。其中结构化分量也就是静态分量,它负责记录运动人体的身高,步幅等身体形状信息;而动态分量则形象地表征出了在运动过程中人体的胳膊摆动,肢体倾斜度,迈腿方式等运动特征,依据上述两种类型分量,现有的运动特征识别算法大致分为两类:基于统计的方法和基于模型的方法。

运动人体识别技术

二、运动人体识别技术 1.概念 运动人体识别技术是一种以图像处理,模式识别,计算机视觉等技术为基础,为运动人体进行识别处理的一项技术。其中图像处理(影像处理)是用计算机对图像进行分析,以达到所需结果的技术;模式识别是通过计算机用数学技术方法来研究模式的自动处理和判读,其中环境与客体统称为“模式”;计算机视觉技术是一门研究如何使机器看的学科,简单的说,就是用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步作图像处理,使电脑处理成更适合人眼观察或传送仪器检测的图像。 2.运动人体识别的研究进展与现状 运动人体识别的研究主要包括图像处理、多传感技术、虚拟现实、模式识别、计算机视觉和图形学、计算机辅助技术、可视化技术以及智能机器人等。针对人体运动图像系列进行分析处理的运动人体视觉分析技术,一般情况下可分为:运动目标检测,运动目标特征提取以及识别复杂背景下的运动目标身份。其主要的研究方法为结构化分量和动态分量。其算法又分为基于统计的方法和基于模型的方法。现状是运动人体科学由宏观向微观理论研究深入发展,与运动人体科学相关的一些学科,快速成长为深入研究性学科,运动人体科学的竞技体育和体育保健。研究方向为:智能安全监控、人机接口、视频会议等方面,这些方面具有广泛的应用前景和巨大的潜在经济价值。 3.运动人体识别算法概述 (1)运动人体识别过程一般分为目标检测和处理、特征提取和分析、模式分类和识别。 (2)主要方法:目标检测和处理的特点为检测出原始图像中的运动目标,在一副图像中,局部目标的表象和形状能够被梯度或者边缘的方向密度分布很好的描述;特征提取和分析的特点为通过映射和变换的方法可以将高维空间中的特征描述用低维空间的特征来描述;模式分类和识别的特点是通过计算机用数学技术方法来研究模式的自动处理和判读,其中环境与客体统称为“模式” (3)特征提取模式识别的方法 在很多实际问题中,往往不容易找到那些最重要的特征,或者因为外界干扰不能提取出自己想要的特征信息。因此在测量时,我们总希望能够获取更多的信息来加以判断。除此之外,我们还能够用数据,比值,梯形图等等的一些展现方法来突出自己想要的特征信息。为了设计出效果好的分类器,通常需要对原始的测量值集合进行分析,经过选择和变换处理,组成有效的识别特征。 4.未来的发展趋势以及存在的问题 人体识别技术的发展趋势是:面对着全球化、信息化越来越提倡的社会背景下,识别技术会越来越广,深度也会不断加深。其虽然有着自己独特的优势,但并不是没有缺点,举个例子,在指纹识别上,面临指纹膜冒充指纹蒙混过关的问题;人面识别也许简单易个容就能过关;虹膜识别技术对黑眼睛存在识别难得问题;对于盲人和眼睛有疾病的患者实在是无能为力;声音、笔记也并不难以模仿;静脉识别也存在着易受温度干扰影响识别率的问题。

运动目标检测原理

运动检测(移动侦测)原理 一、引言 随着技术的飞速发展,人们对闭路电视监控系统的要求越来越高,智能化在监控领域也得到越来越多的应用。在某些监控的场所对安全性要求比较高,需要对运动的物体进行及时的检测和跟踪,因此我们需要一些精确的图像检测技术来提供自动报警和目标检测。运动检测作为在安防智能化应用最早的领域,它的技术发展和应用前景都受到关注。 运动检测是指在指定区域能识别图像的变化,检测运动物体的存在并避免由光线变化带来的干扰。但是如何从实时的序列图像中将变化区域从背景图像中提取出来,还要考虑运动区域的有效分割对于目标分类、跟踪等后期处理是非常重要的,因为以后的处理过程仅仅考虑图像中对应于运动区域的像素。然而,由于背景图像的动态变化,如天气、光照、影子及混乱干扰等的影响,使得运动检测成为一项相当困难的工作。 二、运动检测(移动侦测)原理 早期的运动检测如MPEG1是对编码后产生的I帧进行比较分析,通过视频帧的比较来检测图像变化是一种可行的途径。原理如下:MPEG1视频流由三类编码帧组成,它们分别是:关键帧(I 帧),预测帧(P帧)和内插双向帧(B帧)。I帧按JPEG标准编码,独立于其他编码帧,它是MPEG1视频流中唯一可存取的帧,每12帧出现一次。截取连续的I帧,经过解码运算,以帧为单位连续存放在内存的缓冲区中,再利用函数在缓冲区中将连续的两帧转化为位图形式,存放在另外的内存空间以作比较之用,至

于比较的方法有多种。此方法是对编码后的数据进行处理,而目前的MPEG1/MPEG4编码都是有损压缩,对比原有的图像肯定存在误报和不准确的现象。 目前几种常用的方法: 1.背景减除(Background Subtraction ) 背景减除方法是目前运动检测中最常用的一种方法,它是利用当前图像与背景图像的差分来检测出运动区域的一种技术。它一般能够提供最完全的特征数据,但对于动态场景的变化,如光照和外来无关事件的干扰等特别敏感。最简单的背景模型是时间平均图像,大部分的研究人员目前都致力于开发不同的背景模型,以期减少动态场景变化对于运动分割的影响。 2.时间差分(Temporal Difference ) 时间差分(又称相邻帧差)方法是在连续的图像序列中两个或三个相邻帧间采用基于像素的时间差分并且阈值化来提取出图像中的运动区域。时间差分运动检测方法对于动态环境具有较强的自适应性,但一般不能完全提取出所有相关的特征像素点,在运动实体内部容易产生空洞现象。 3.光流(Optical Flow) 基于光流方法的运动检测采用了运动目标随时间变化的光流特性,如Meyer[2] 等通过计算位移向量光流场来初始化基于轮廓的跟踪算法,从而有效地提取和跟踪运动目标。该方法的优点是在摄像机运动存在的前提下也能检测出独立的运动目标。然而,

自然的人体动作识别

自然的人体动作识别 黄飞跃徐光祐 清华大学计算机科学与技术系,普适计算教育部重点实验室,北京,100084 摘 要:人体动作识别是计算机视觉的一个重要研究课题。目前大多数动作识别的研究都 假设是在特定受限的场景下,即特定的视角、位置、对象、背景和光照条件下工作。其中, 尤以要求特定的视角和位置对实际应用的限制最为严重。本文致力于研究能处理视角和位 置变化并可用于非特定对象的人体动作识别方法。我们把它称为自然的人体动作识别方法。 为此我们提出了"包容形状"的人体表示,这种表示不受视角、位置的变化影响,充分利用了 两个正交摄像机拍摄的轮廓信息以去除由人的身体旋转引起的影响。利用包容形状,我们 取得了非特定人、任意视角下的自然人体动作识别较好的实验结果。同时我们也介绍了该 识别方法在实际智能家居——老人看护系统中的应用。 关键词:自然动作识别;包容形状 1.引言 人体动作识别是计算机视觉里一个活跃的研究方向,有不少综述,力图把以前的相关研究方法进行总结和分类,比如[1], [2], [3], [4]。至今为止,关于动作识别的大多数研究工作都是在特定受限的场景下展开,比如特定的视角、动作人、背景和光照。在这之中,尤以视角和位置的限制最为突出。我们认为要实现自然场景下的动作识别,就必须消除应用条件中的这些限制。为此,我们在这篇论文中,重点研究了动作识别中与视角和位置无关的体态表示,以实现非特定人、任意视角下的自然人体动作识别。 现阶段已经开展了不少视角无关的动作识别研究工作,比如Cen Rao [5],Vasu Parameswaran[6]。但是还有很多问题亟待解决,大多数的方法依赖鲁棒的语义特征点检测或者是点对应,而这些是比较难实现的。 在本文中,我们提出使用了一种“包容形状”的体态表示。在仿射摄像机投影模型的假设下,这种表示对于视角和位置的变化具有不敏感性,同时不需要依靠任何较难提取并且对误差很敏感的语义点检测和点对应。利用这种表示,我们开发了自己的动作识别系统并且把它部署到实际应用:智能家居—老人看护系统中。实验结果表明我们的系统对于非特定人、任意视角和位置下的自然动作有着很理想的识别能力。 资助项目:国家自然科学基金资助项目(60673189,60433030) 联系作者:黄飞跃, Email:hfy01@https://www.360docs.net/doc/3d8332618.html,

一种运动人体行为识别的改进方法

一种运动人体行为识别的改进方法 摘要:隐马尔可夫模型主要用于根据系统外部观测量来预测该事件的未知序列,本文将它引入运动人体行为识别中。在获得了运动目标的整体轮廓以后,论述了怎 样对规则行为建模,并结合隐马尔可夫原理识别出运动人体行为。针对人体轮 廓单通道图像对比的局限,提出了一种轮廓对比和质心跟踪相结合的方法改进 了算法,通过实验证明该改进的算法具有较好的性能。 关键词:行为模型 隐马尔可夫模型 质心 轮廓 中图法分类号:TP3文献分类标识码:C4 An Improved Method for Human Motion Recognition Abstract:The Hidden Markov Models is widely used in forecasting the unknown sequence based on observation on outside system. In this paper, it is applied in human motion recognition. With the human’s silhouettes, the paper deals with how to get the models of regular actions and combine with HMM to recognize the motions of mobile human. As for the localization on gray images of silhouettes, silhouettes contrasting and center of mass tracking algorithm is put forward to solve this problem. The results show that the new algorithm has better performance. Key words:Motion models, HMM, Centroid, Silhouette 1引言 目前,“人的观察”(looking at people)向“理解人”(understanding people)转变是计算机视觉领域中最活跃的研究主题之一,其核心是利用计算机视觉技术从图像序列中检测、跟踪、识别人并对其行为进行理解与描述,其重要目标是摆脱传统的人机交互方式(如:键盘、鼠标等设备信息输入),让计算机系统具备自动分析,获取外部信息的能力,并通过分析做出相应的响应,让计算机系统更加智能化和人性化 。 动态现场视觉监控是计算机视觉领域一个新兴的应用方向。视觉监控区别于传统意义上的监控系统在于其智能性[1]。简单而言,不仅用摄像机代替人眼,而且用计算机代替人、协助人,来完成监视或控制任务,从而减轻人的负担.视觉监控具有广泛的应用前景和潜在的经济价值。运动目标行为识别作为整个视觉监控的重点和难点,国内外提出了许多方法,比如区域分割[2],关节点法等,但实现起来相当复杂。针对一些常见的非规则行为(比如跳,爬行,打斗,偷窥等)本文采用了一种隐马尔可夫模型和质心理论相结合的方法,简单的运用自然语言理解,能够比较高效的识别出这些非规则行为,并且具有比较大的可扩展空间。

运动目标检测研究意义及国内外现状

运动目标检测研究意义及国内外现状运动目标检测研究意义及国内外现状 1研究意义...................................................................... (1) 2国内外研究现 状 ..................................................................... . (1) 1研究意义 众所周知,当前是信息时代,信息的获得、加工、处理以及应用都有了飞跃发展。人们认识世界的重要知识来源就是图像信息,在很多场合,图像所传送的信息比其他形式的信息更丰富、真切和具体。人眼与大脑的协作使得人们可以获取、处理以及理解视觉信息,人类利用视觉感知外界环境信息的效率很高。事实上,据一些国外学者所做的统计,人类所获得外界信息有80%左右是来自眼睛摄取的图像。由此可见,视觉作为人类获取外界信息的主要载体,计算机要实现智能化,就必须能够处理图像信息。尤其是近年来,以图形、图像、视频等大容量为特征的图像数据处理广泛应用于医学、交通、工业自动化等领域。 自然界的一切图像都是连续变化的模拟图像,在日常生活中,这些图像中的运动目标往往是我们比较关心的,如:行人、行驶的交通工具以及其他的运动物体。运动目标检测是计算机视觉和数字图像处理的一个热门方向,广泛应用于机器人导航、智能视频监控、工业检测、航空航天等诸多领域。因此,运动目标检测也就成为了近年来理论和应用的研究热点,它是图像处理和计算机视觉学科的重要分支,也是智能监控系统的核心部分。它的目的就是如何快速、准确地检测出监控视频中的运动目标,即从序列图像中将运动目标提取出来。

(完整word版)基于matlab的运动目标检测

1 绪论 1.1 课题研究背景及意义 运动目标检测是图像处理与计算机视觉的一个分支,在理论和实践上都有重大意义,长久以来一直被国内外学者所关注。在实际中,视频监控利用摄像机对某一特定区域进行监视,是一个细致和连续的过程,它可以由人来完成,但是人执行这种长期枯燥的例行监测是不可靠,而且费用也很高,因此引入运动监测非常有必要[1]。它可以减轻人的负担,并且提高了可靠性。概括起来运动监测主要包括三个内容[2]:运动目标检测,方向判断和图像跟踪。运动目标检测是整个监测过程的基础,运动目标的提取准确与否,直接关系到后续高级过程的完成质量。 1.2 国内外研究现状 运动目标检测在国外已经取得了一些的研究成果[3],许多相关技术已经开始应用到实际系统中,但是国内研究相对落后,与国外还有较大差距。传统的视频目标提取大致可以分两类,一类以空间同性为准则,先用形态学滤波器或其他滤波器对图像作预处理;然后对该图像的亮度、色度或其他信息作空间上的分割以对区域作边缘检测;之后作运动估计,并合并相似的运动区域以得到最终的提取结果。如光流算法、主动轮廓模型算法。此类方法结果较为准确但是运算量相对较大。另一类算法主要以时间变化检测作为准则,这类算法主要通过帧差检测图像上的变化区域和不变区域,将运动物体与静止背景进行分割。此类方法运算量小,提取结果不如前类方法准确。此外,还有时空结合方法、时空亮度梯度信息结合的方法等等[4]。本文将围绕以时间变化监测为基础的方法展开分析和讨论。 1.3 本文结构 第1章介绍了本文的研究意义及国内外发展状况;第2章分为四个部分详细讲述了运动目标检测的方法,介绍了背景提取与更新算法,检测算法,阈值选取,形态学滤波等;第三章对全文作出了总结。

相关文档
最新文档