(完整版)目标检测综述

(完整版)目标检测综述
(完整版)目标检测综述

,、传统目标检测方法

如上图所示,传统目标检测的方法一般分为三个阶段:首先在给定的图像上选择一些候选的区域,然后对这些区域提取特征,最后使用训练的分类器进行分类。下面我们对这三个阶段分别进行介绍。

(1) 区域选择这一步是为了对目标的位置进行定位。由于目标可能出现在

图像的任何位置,而且目标的大小、长宽比例也不确定,所以最初采用滑动窗口的策略对整幅图像进行遍历,而且需要设置不同的尺度,不同的长宽比。这种穷举的策略虽然包含了目标所有可能出现的位置,但是缺点也是显而易见的:时间复杂度太高,产生冗余窗口太多,这也严重影响后续特征提取和分类的速度和性能。(实际上由于受到时间复杂度的问题,滑动窗口的长宽比一般都是固定的设

置几个,所以对于长宽比浮动较大的多类别目标检测,即便是滑动窗口遍历也不

能得到很好的区域)

(2) 特征提取由于目标的形态多样性,光照变化多样性,背景多样性等因素使得设计一个鲁棒的特征并不是那么容易。然而提取特征的好坏直接影响到分类的准确性。(这个阶段常用的特征有SIFT HOG等)

(3) 分类器主要有SVM, Adaboost等。

总结:传统目标检测存在的两个主要问题:

一是基于滑动窗口的区域选择策略没有针对性,时间复杂度高,窗口冗余;二是手工设计的特征对于多样性的变化并没有很好的鲁棒性。

1、基于Region ProposaI的深度学习目标检测算法

对于传统目标检测任务存在的两个主要问题,我们该如何解决呢?

对于滑动窗口存在的问题,region proposal提供了很好的解决方案。region

proposal候选区域)是预先找出图中目标可能出现的位置。但由于region proposal 利用了图像中的纹理、边缘、颜色等信息,可以保证在选取较少窗口(几千个甚至几百个)的情况下保持较高的召回率。这大大降低了后续操作的时间复杂度,并且获取的候选窗口要比滑动窗口的质量更高(滑动窗口固定长宽比)。比较常用的region proposal 算法有selective Search和edge Boxes 如果想具体了解region proposal 可以看一下PAMI2015 的“What makes for effective detection proposals?”

有了候选区域,剩下的工作实际就是对候选区域进行图像分类的工作(特征提取+分类)。对于图像分类,不得不提的是2012年ImageNet大规模视觉识别挑战赛(ILSVRC上,机器学习泰斗Geoffrey Hinton教授带领学生Krizhevsky使用卷积神经网络将ILSVRC^类任务的Top-5 error降低到了15.3%,而使用传统方法的第二名top-5 error高达26.2%。此后,卷积神经网络占据了图像分类任务的绝对统治地位,微软最新的ResNet和谷歌的Inception V4模型的top-5 error降到了4%以内多,这已经超越人在这个特定任务上的能力。所以目标检测得到候选区域后使用CNN对其进行图像分类是一个不错的选择。2014年,RBG( Ross B.

Girshick)大神使用region proposal+CNN代替传统目标检测使用的滑动窗口+手工设计特征,设计了R-CNN框架,使得目标检测取得巨大突破,并开启了基于深度学习目标检测的热潮。

1. R-CNN (CVPR2014, TPAMI2015) (Region-based Convolution Networks for Accurate Object detecti on and Segme ntati on)

R-CNN: Region-based Convolutional Network

tVTOCiiitor?

no.

2. Extract region 3* Compute 4. Classify proposals 卜2k} CNN features regions

上面的框架图清晰的给出了 R-CNN 的目标检测流程:

(1) 输入测试图像

(2) 利用selective search 算法在图像中提取2000个左右的region proposal 。

(3) 将每个region proposal 缩放(warp )成227x227的大小并输入到 CNN,将

CNN 的fc7层的输出作为特征。

(4) 将每个region proposal 提取到的CNN 特征输入到SVM 进行分类。 上面的

框架图是测试的流程图,要进行测试我们首先要训练好提取特征的

CNN 模型,以及用于分类的SVM :使用在ImageNet 上预训练的模型

(AlexNet/VGG16进行微调得到用于特征提取的 CNN 模型,然后利用CNN 模型 对训练集提特征训练 SVM 。

对每个region proposal 缩放到同一尺度是因为 CNN 全连接层输入需要保证 维

度固定。

上图少画了一个过程 ——对于 SVM 分好类的 region proposal 做边框回归

(bounding-box regression), 边框回归是对 region proposal 进行纠正的线性回归 算法,为了让 region proposal 提取到的窗口跟目标真实窗口更吻合。因为 region

proposal 提取到的窗口不可能跟人手工标记那么准,如果 region proposal 跟目标 位置偏移较大,即便是分类正确了,但是由于loU(region proposal 与Ground Truth 的窗口的交集比并集的比值 )低于 0.5,那么相当于目标还是没有检测到。

小结:R-CNN 在PASCAL VOC200上的检测结果从 DPM HSC 的 34.3%直接

提 升到了 66%(mAP >如此大的提升使我们看到了 region proposal+CNN 的巨大优 势。 但是R-CNN 框架也存在着很多问题:

(1) 训练分为多个阶段,步骤繁琐:微调网络+训练SVM+训练边框回归器

(2) 训练耗时,占用磁盘空间大:5000张图像产生几百G 的特征文件

(3) 速度慢:使用GPU, VGG16模型处理一张图像需要47s 。 针对速度慢的

这个问题,SPPNET 给出了很好的解决方案。

L Input

iniaiic

2

2. SPF-NET (ECCV2014, TPAMI2015) (Spatial Pyramid Pooling in

Deep Convo lutio nal Networks for Visual Recog niti on)

先看一下R-CNN 为什么检测速度这么慢,一张图都需要47s!仔细看下R-CNN

框架发现,对图像提完region proposal (2000个左右)之后将每个proposal 当成 一张图像进行后续处理(CNN 提特征+SVM 分类),实际上对一张图像进行了 2000 次提特征和分类的过程! 有没有方法提速呢?好像是有的,这 2000个region

proposal 不都是图像的一部分吗,那么我们完全可以对图像提一次卷积层特征, 然后只需要将region proposal 在原图的位置映射到卷积层特征图上, 这样对于一 张图像我们只需要提一次卷积层特征, 然后将每个region proposal 的卷积层特征 输入到全连接层做后续操作。(对于CNN 来说,大部分运算都耗在卷积操作上, 这样做可以节省大量时间)。现在的问题是每个region proposal 的尺度不一样, 直接这样输入全连接层肯定是不行的,因为全连接层输入必须是固定的长度。

SPPNET 恰好可以解决这个问题:

fulh -c*winec(ed layers (ft?)

上图对应的就是SPPNET 的网络结构图,任意给一张图像输入到 CNN,经过 卷

积操作我们可以得到卷积特征(比如VGG16最后的卷积层为conv5_3,共产生 512张特征图)。图中的window 是就是原图一个region proposal 对应到特征图的 区域,只需要将这些不同大小 window 的特征映射到同样的维度,将其作为全连 接的输入,就能保证只对图像提取一次卷积层特征。 SPPNET 使用了空间金字塔ure niups of

11 xv

window spoticiL (amid

pooling I is er

含 convolutional layers

input im ;ige

采样(spatial pyramid pooli ng ):将每个 window 划分为 4*4, 2*2, 1*1 的块,然后 每个块使用max-pooling 下采样,这样对于每个 window 经过SPP 层之后都得到 了一个长度为(4*4+2*2+1)*512维度的特征向量,将这个作为全连接层的输入进 行后续操作。 小结:使用SPPNET 相比于R-CNN 可以大大加快目标检测的速度, 但是依然存在着很多问题:

(1) 训练分为多个阶段,步骤繁琐:微调网络+训练SVM+训练训练边框回归 器

⑵SPPNET 在微调网络的时候固定了卷积层,只对全连接层进行微调,而对 于

一个新的任务,有必要对卷积层也进行微调。 (分类的模型提取的特征更注重

高层语义,而目标检测任务除了语义信息还需要目标的位置信息)

针对这两个 问题,RBG 又提出Fast RCNN, —个精简而快速的目标检测框架。

3. Fast R-CNN(ICCV2015)

有了前边R-CNN 和SPPNET 的介绍,我们直接看Fast RCNN 的框架图:

与R-CNN 框架图对比,可以发现主要有两处不同:一是最后一个卷积层后

加了一个ROI pooling laye ,二是损失函数使用了多任务损失函数(multi-task loss),

将边框回归直接加入到CNN 网络中训练。 (1) ROI pooling layer 实际上是 SPPNET 的一个精简版, SPPNET 对每个

proposal 使用了不同大小的金字塔映射,而 ROI pooli ng layer 只需要下采样到一Deeo ---------- ConvNet

project! oriV

Com x

feature map

softmax

Rol feature

个7x7 的特征图。对于VGG16 网络conv5_3 有512 个特征图,这样所有region proposal 对应了一个7*7*512 维度的特征向量作为全连接层的输入。

(2)R-CNN训练过程分为了三个阶段,而Fast R-CNN直接使用softmax替代SVM 分类,同时利用多任务损失函数边框回归也加入到了网络中,这样整个的训练过程是端到端的(除去region proposal提取阶段)。

3 Fast R-CNN在网络微调的过程中,将部分卷积层也进行了微调,取得了更好的检测效果。

小结:Fast R-CNN融合了R-CNN和SPPNET的精髓,并且引入多任务损失函数,使整个网络的训练和测试变得十分方便。在PascalVOC2007训练集上训练,在VOC2007测试的结果为66.9%(mAP)如果使用VOC2007+2012训练集训练,在VOC2007上测试结果为70%(数据集的扩充能大幅提高目标检测性能)。使用VGG16每张图像总共需要3s左右。

缺点:region proposal的提取使用selective search,目标检测时间大多消耗在这上面(提region proposal 2~3s,而提特征分类只需0.32s),无法满足实时应用,而且并没有实现真正意义上的端到端训练测试(region proposal 使用selective search先提取处来)。那么有没有可能直接使用CNN直接产生region proposal并

对其分类?Faster R-CNN框架就是符合这样需要的目标检测框架。

4. Faster R-CNN(NIPS2015)(Faster R-CNN: Towards Real -Time Object Detection with Region Proposal Networks)

在region proposal + CNN分类的这种目标检测框架中,region proposal质量好坏直接影响到目标检测任务的精度。如果找到一种方法只提取几百个或者更少的高质量的预选窗口,而且召回率很高,这不但能加快目标检测速度,还能提高目标检测的性能(假阳例少)°RPN(Region Proposal Network网络应运而生。RPN 的核心思想是使用卷积神经网络直接产生region proposal,使用的方法本质上就是滑动窗口。RPN的设计比较巧妙,RPN只需在最后的卷积层上滑动一遍,因为anchor 机制和边框回归可以得到多尺度多长宽比的region proposal。

256-d

intennediiite lax ei -V--- 我们直接看上边的RPN 网络结构图(使用了 ZF 模型),给定输入图像(假设分 辨率为600*1000),经过卷积操作得到最后一层的卷积特征图(大小约为40*60 )。 在这个特征图上使用3*3的卷积核(滑动窗口)与特征图进行卷积,最后一层卷 积层共有256个feature map ,那么这个3*3的区域卷积后可以获得一个 256维 的特征向量,后边接cis layer 和reg layer 分别用于分类和边框回归(跟Fast RCNN 类似,只不过这里的类别只有目标和背景两个类别)。3*3滑窗对应的每个特征 区域同时预测输入图像3种尺度(128,256,512) ,3种长宽比(1:1,1:2,2:1)的region proposal ,这种映射的机制称为 anchor 。所以对于这个40*60的feature map ,总 共有约 20000(40*60*9)个 anchor ,也就是预测 20000个 region proposal 0 这样 设计的好处是什么呢?虽然现在也是用的滑动窗口策略, 但是:滑动窗口操作是 在卷积层特征图上进行的,维度较原始图像降低了 16*16倍(中间经过了 4次 2*2的pooling 操作);多尺度采用了 9种anchor,对应了三种尺度和三种长宽比, 加上后边接了边框回归,所以即便是这 9种anchor 外的窗口也能得到一个跟目 标比较接近的region proposal o NIPS2015版本的Faster RCNN 使用的检测框架 是RPN 网络+Fast RCNN 网络分离进行的目标检测,整体流程跟Fast RCNN —样, 只是region proposal 现在是用 RPN 网络提取的(代替原来的 selective search ) o 同时作者为了让RPN 的网络和Fast RCNN 网络实现卷积层的权值共享,训练RPN 和Fast RCNN 的时候用了 4阶段的训练方法:

⑴使用在ImageNet 上预训练的模型初始化网络参数,微调 RPN 网络;

(2) 使用⑴中RPN 网络提取region proposal 训练Fast RCNN 网络;

(3) 使用⑵的Fast RCNN 网络重新初始化RPN,固定卷积层进行微调;

f

¥ scores

4^ coordinates k anchor bo?ces /neg layer

C /J layer

#

微生物检测技术在食品检测中的应用研究进展 文献综述

微生物检测技术在食品检测中的应用研究进展 摘要:食品问题关系国计民生,食品的安全越来越受到人们关注。在食品工业迅速发展的今天,建立食品微生物快速检测方法,对食品质量进行检测、监控尤为重要。近几年各国的许多机构和学者都很重视食品微生物检测技术和方法的研究,本文对此进行了详细的介绍。 关键词:检测技术微生物食品安全 Progress of the research on the application of Microbial Detection Technology in food testing Abstract:Food is the people's livelihood. Food safety has received more and more attention. At present, the food industry is developing rapidly. Therefore, developing an rapid testing method of Microorganism in the food is especially important in detection and monitoring of food quality. In recente years, many institutes and researchers from different country attach great importance to the research of food microbiological testing techniques and methods. This article will give a detailed introduction to this below. Key words:the testing techniques Microorganism food safety 1前言 随着时代的不断发展,人们生活水平不断提高,食品安全问题也越来越受到人们的关注,近几年来,三聚氰氨、苏丹红、漂白剂等等一系列的食品安全问题使人们对食品产生了强烈的不信任感,因此,食品微生物检测技术的应用也越来越广泛,同时,食源性微生物的检测技术也趋向迅捷、准确、大通量的方向发展。以往的食品微生物检测技术已经无法应对现代的食品安全问题,检测速度缓慢、检测精度不精确,因此,应当采取新的食品微生物检测技术,现代的检测技术包括色谱法与荧光分析法、阻抗法、放射测量法、ELISA法和生物传感器法,结合我国实际情况,在建立标准的食源性微生物检测方法,推广标准化、检测技术的应用等方面还要很多工作要做[1]。 2 食品微生物检验的内容和特点 2.1 食品的污染程度指示菌的检验 (1)细菌总数:又称菌落数,是判断食物和应用水污染的主要指标。这是一种可以为卫生学检验评价提供依据的方法。 (2)大肠杆菌:这种细菌主要是来自人们本身的粪便,所以对大肠杆菌的数量来检验食物或饮

运动目标检测方法总结报告

摘要 由于计算机技术的迅猛发展,使得基于内容的视频信息的存取、操作和检索不仅成为一种可能,更成为一种需要。同时,基于内容的视频编码标准MPEG-4和基于内容的视频描述标准MPEG-7正在发展和完善。因此提取和视频中具有语义的运动目标是一个急需解决的问题。运动目标提取和检测作为视频和图像处理领域的重要研究领域,有很强的研究和应用价值。运动检测就是将运动目标从含有背景的图像中分离出来,如果仅仅依靠一种检测算法,难以从复杂的自然图像序列中完整地检测出运动的目标。较高的检测精度和效率十分重要,因此融合多种检测方法的研究越来越受到重视。本文介绍了几种国内外文献中的经典的视频运动目标的检测和提取算法,并对各种方法进行了评价和总结。首先介绍了基本的运动目标检测的基本知识和理论,然后介绍了基本的几种目标检测方法及其各种改进方法。对今后的运动目标检测提取的相关研究提供一定的参考。 关键词:运动目标检测光流法帧差法背景建模方法

ABSTRACT Because of the rapid development of computer technology, it is possible to access, operate and retrieve the video information based on the content of the video. At the same time, based on the content of the video coding standard MPEG-4 and content-based video description standard MPEG-7 is developing and improving. Therefore, it is an urgent problem to be solved in the extraction and video. Moving object extraction and detection is a very important field of video and image processing, and has a strong research and application value. Motion detection is to separate moving objects from the image containing background, if only rely on a detection algorithm, it is difficult to from a complex natural image sequences to detect moving target. Higher detection accuracy and efficiency are very important, so the study of the fusion of multiple detection methods is becoming more and more important. In this paper, the detection and extraction algorithms of the classical video moving objects in the domestic and foreign literatures are introduced, and the methods are evaluated and summarized. Firstly, the basic knowledge and theory of basic moving target detection is introduced, and then the basic method of target detection is introduced. To provide a reference for the research on the extraction of moving target detection in the future. Keywords: Visual tracking Optical flow method Frame Difference Background modeling method

运动目标检测光流法

摘要 运动目标检测方法是研究如何完成对视频图像序列中感兴趣的运动目标区域的“准确定位”问题。光流场指图像灰度模式的表面运动,它可以反映视频相邻帧之间的运动信息,因而可以用于运动目标的检测。MATLAB这种语言可移植性好、可扩展性强,再加上其中有丰富的图像处理函数,所以利用MATLAB 软件来用光流法对运动目标的检测中具有很大的优势。本设计主要可以借助matlab软件编写程序,运用Horn-Schunck算法对图像前后两帧进行处理,画出图像的光流场。而图像的光流场每个像素都有一个运动矢量,因此可以反映相邻帧之间的运动,分析图像的光流场就可以得出图像中的运动目标的运动情况。 关键字:光流法;Horn-Schunck算法;matlab

目录 1光流法的设计目的 (1) 2光流法的原理 (1) 2.1光流法的介绍 (1) 2.1.1光流与光流场的概念 (1) 2.1光流法检测运动目标的原理 (2) 2.1.1光流场计算的基本原理 (2) 2.2.2基于梯度的光流场算法 (2) 2.2.3Horn-Schunck算法 (3) 2.2.4光流法检测运动目标物体的基本原理概述 (5) 3光流法的程序具体实现 (6) 3.1源代码 (6) 3.1.1求解光流场函数 (6) 3.1.2求导函数 (9) 3.1.3高斯滤波函数 (9) 3.1.4平滑性约束条件函数 (10) 3.1.5画图函数 (10) 4仿真图及分析 (12) 结论 (13) 参考文献 (14)

1 光流法的设计目的 数字图像处理,就是用数字计算机及其他有关数字技术,对图像进行处理,以达到预期的目的。随着计算机的发展,图像处理技术在许多领域得到了广泛应用,数字图像处理已成为电子信息、通信、计算机、自动化、信号处理等专业的重要课程。 数字图像处理课程设计是在学习完数字图像处理的相关理论后,进行的综合性训练课程,其目的是:使学生进一步巩固数字图像处理的基本概念、理论、分析方法和实现方法;增强学生应用Matlab编写数字图像处理的应用程序及分析、解决实际问题的能力;尝试所学的内容解决实际工程问题,培养学生的工程实践能力。 运动目标检测是数字图像处理技术的一个主要部分,近些年来,随着多媒体技术的迅猛发展和计算机性能的不断提高,动态图像处理技术日益受到人们的青睞,并且取得了丰硕的成果,广泛应用于交通管理、军事目标跟踪、生物医学等领域。 因此,基于光流法,实现运动目标的检测是本文的研究对象。结合图书馆书籍、网上资料以及现有期刊杂志,初步建立起运动目标检测的整体思路和方法。 2 光流法的原理 2.1 光流法的介绍 2.1.1 光流与光流场的概念 光流是指空间运动物体在观测成像面上的像素运动的瞬时速度,它利用图像序列像素强度数据的时域变化和相关性来确定各自像素位置的“运动”,即反映图像灰度在时间上的变化与景物中物体结构及其运动的关系。将二维图像平面特定坐标点上的灰度瞬时变化率定义为光流矢量。视觉心理学认为人与被观察物体

目标检测综述教学内容

一、传统目标检测方法 如上图所示,传统目标检测的方法一般分为三个阶段:首先在给定的图像上选择一些候选的区域,然后对这些区域提取特征,最后使用训练的分类器进行分类。下面我们对这三个阶段分别进行介绍。 (1) 区域选择这一步是为了对目标的位置进行定位。由于目标可能出现在图像的任何位置,而且目标的大小、长宽比例也不确定,所以最初采用滑动窗口的策略对整幅图像进行遍历,而且需要设置不同的尺度,不同的长宽比。这种穷举的策略虽然包含了目标所有可能出现的位置,但是缺点也是显而易见的:时间复杂度太高,产生冗余窗口太多,这也严重影响后续特征提取和分类的速度和性能。(实际上由于受到时间复杂度的问题,滑动窗口的长宽比一般都是固定的设置几个,所以对于长宽比浮动较大的多类别目标检测,即便是滑动窗口遍历也不能得到很好的区域) (2) 特征提取由于目标的形态多样性,光照变化多样性,背景多样性等因素使得设计一个鲁棒的特征并不是那么容易。然而提取特征的好坏直接影响到分类的准确性。(这个阶段常用的特征有SIFT、HOG等) (3) 分类器主要有SVM, Adaboost等。 总结:传统目标检测存在的两个主要问题: 一是基于滑动窗口的区域选择策略没有针对性,时间复杂度高,窗口冗余; 二是手工设计的特征对于多样性的变化并没有很好的鲁棒性。 二、基于Region Proposal的深度学习目标检测算法 对于传统目标检测任务存在的两个主要问题,我们该如何解决呢? 对于滑动窗口存在的问题,region proposal提供了很好的解决方案。region

proposal(候选区域)是预先找出图中目标可能出现的位置。但由于region proposal 利用了图像中的纹理、边缘、颜色等信息,可以保证在选取较少窗口(几千个甚至几百个)的情况下保持较高的召回率。这大大降低了后续操作的时间复杂度,并且获取的候选窗口要比滑动窗口的质量更高(滑动窗口固定长宽比)。比较常用的region proposal算法有selective Search和edge Boxes,如果想具体了解region proposal可以看一下PAMI2015的“What makes for effective detection proposals?” 有了候选区域,剩下的工作实际就是对候选区域进行图像分类的工作(特征提取+分类)。对于图像分类,不得不提的是2012年ImageNet大规模视觉识别挑战赛(ILSVRC)上,机器学习泰斗Geoffrey Hinton教授带领学生Krizhevsky使用卷积神经网络将ILSVRC分类任务的Top-5 error降低到了15.3%,而使用传统方法的第二名top-5 error高达26.2%。此后,卷积神经网络占据了图像分类任务的绝对统治地位,微软最新的ResNet和谷歌的Inception V4模型的top-5 error降到了4%以内多,这已经超越人在这个特定任务上的能力。所以目标检测得到候选区域后使用CNN对其进行图像分类是一个不错的选择。 2014年,RBG(Ross B. Girshick)大神使用region proposal+CNN代替传统目标检测使用的滑动窗口+手工设计特征,设计了R-CNN框架,使得目标检测取得巨大突破,并开启了基于深度学习目标检测的热潮。 1. R-CNN (CVPR2014, TPAMI2015) (Region-based Convolution Networks for Accurate Object d etection and Segmentation)

关于三维图像目标识别文献综述

关于三维目标识别的文献综述 前言: 随着计算机技术和现代信息处理技术的快速发展,目标识别已经迅速发展成为一种重要的工具与手段,目标识别是指一个特殊目标(或一种类型的目标)从其它目标(或其它类型的目标)中被区分出来的过程。它既包括两个非常相似目标的识别,也包括一种类型的目标同其他类型目标的识别。目标识别的基本原理是利用雷达回波中的幅度、相位、频谱和极化等目标特征信息,通过数学上的各种多维空间变换来估算目标的大小、形状、重量和表面层的物理特性参数,最后根据大量训练样本所确定的鉴别函数,在分类器中进行识别判决。它属于模式识别的范畴,也可以狭义的理解为图像识别。三维目标识别是以物体表面朝向的三维信息来识别完整的三维物体模型目标识别需要综合运用计算机科学、模式识别、机器视觉以及图像理解等学科知识。目标识别技术已广泛应用于国民经济、空间技术和国防等领域。 正文: 图像识别总的来说主要包括目标图像特征提取和分类两个方面。但是一般情况下,图像受各种因素影响,与真实物体有较大的差别,这样,就需要经过预处理、图像分割、特征提取、分析、匹配识别等一系列过程才能完成整个识别过程。 目前,最主流的三种三维物体识别研究思路是: 1)基于模型或几何的方法;

2)基于外观或视图的方法; 3)基于局部特征匹配的方法; 一、基于模型或几何的方法: 这种方法所识别的目标是已知的,原理就是利用传感器获得真实目标的三维信息并对信息进行分析处理,得到一种表面、边界及连接关系的描述,这里,三维物体识别中有两类最经常使用的传感器:灰度传感器和深度传感器,前者获取图像的每个像素点对应于一个亮度测量,而后者对应于从传感器到可视物体表面的距离;另一方面,利用CAD建立目标的几何模型,对模型的表面、边界及连接关系进行完整的描述。然后把这两种描述加以匹配就可以来识别三维物体。其流程如下图所示: 传感器数据获取过程,就是从现实生活中的真实物体中产生待识别的模型。分析/建模过程,是对传感器数据进行处理,从中提取与目标有关的独立应用特征。模型库的建立一般式在识别过程之前,即首先根据物体的某些特定特征建立一些关系以及将这些信息汇总成一个库。在模型匹配过程,系统通过从图像中抽取出的物体关系属性图,把物体描述与模型描述通过某种匹配算法进行比较、分析,最终得到与物体最相似的一种描述,从而确定物体的类型和空间位置。 基于模型的三维物体识别,需要着重解决以下4个问题:

目标检测方法简要综述

龙源期刊网 https://www.360docs.net/doc/b06196974.html, 目标检测方法简要综述 作者:栗佩康袁芳芳李航涛 来源:《科技风》2020年第18期 摘要:目标检测是计算机视觉领域中的重要问题,是人脸识别、车辆检测、路网提取等领域的理论基础。随着深度学习的快速发展,与基于滑窗以手工提取特征做分类的传统目标检测算法相比,基于深度学习的目标检测算法无论在检测精度上还是在时间复杂度上都大大超过了传统算法,本文将简单介绍目标检测算法的发展历程。 关键词:目标检测;机器学习;深度神经网络 目标检测的目的可分为检测图像中感兴趣目标的位置和对感兴趣目标进行分类。目标检测比低阶的分类任务复杂,同时也是高阶图像分割任的重要基础;目标检测也是人脸识别、车辆检测、路网检测等应用领域的理论基础。 传统的目标检测算法是基于滑窗遍历进行区域选择,然后使用HOG、SIFT等特征对滑窗内的图像块进行特征提取,最后使用SVM、AdaBoost等分类器对已提取特征进行分类。手工构建特征较为复杂,检测精度提升有限,基于滑窗的算法计算复杂度较高,此类方法的发展停滞,本文不再展开。近年来,基于深度学习的目标检测算法成为主流,分为两阶段和单阶段两类:两阶段算法先在图像中选取候选区域,然后对候选区域进行目标分类与位置精修;单阶段算法是基于全局做回归分类,直接产生目标物体的位置及类别。单阶段算法更具实时性,但检测精度有损失,下面介绍这两类目标检测算法。 1 基于候选区域的两阶段目标检测方法 率先将深度学习引入目标检测的是Girshick[1]于2014年提出的区域卷积神经网络目标检测模型(R-CNN)。首先使用区域选择性搜索算法在图像上提取约2000个候选区域,然后使用卷积神经网络对各候选区域进行特征提取,接着使用SVM对候选区域进行分类并利用NMS 回归目标位置。与传统算法相比,R-CNN的检测精度有很大提升,但缺点是:由于全连接层的限制,输入CNN的图像为固定尺寸,且每个图像块输入CNN单独处理,无特征提取共享,重复计算;选择性搜索算法仍有冗余,耗费时间等。 基于R-CNN只能接受固定尺寸图像输入和无卷积特征共享,He[2]于2014年参考金字塔匹配理论在CNN中加入SPP-Net结构。该结构复用第五卷积层的特征响应图,将任意尺寸的候选区域转为固定长度的特征向量,最后一个卷积层后接入的为SPP层。该方法只对原图做一

目标跟踪相关研究综述

Artificial Intelligence and Robotics Research 人工智能与机器人研究, 2015, 4(3), 17-22 Published Online August 2015 in Hans. https://www.360docs.net/doc/b06196974.html,/journal/airr https://www.360docs.net/doc/b06196974.html,/10.12677/airr.2015.43003 A Survey on Object Tracking Jialong Xu Aviation Military Affairs Deputy Office of PLA Navy in Nanjing Zone, Nanjing Jiangsu Email: pugongying_0532@https://www.360docs.net/doc/b06196974.html, Received: Aug. 1st, 2015; accepted: Aug. 17th, 2015; published: Aug. 20th, 2015 Copyright ? 2015 by author and Hans Publishers Inc. This work is licensed under the Creative Commons Attribution International License (CC BY). https://www.360docs.net/doc/b06196974.html,/licenses/by/4.0/ Abstract Object tracking is a process to locate an interested object in a series of image, so as to reconstruct the moving object’s track. This paper presents a summary of related works and analyzes the cha-racteristics of the algorithm. At last, some future directions are suggested. Keywords Object Tracking, Track Alignment, Object Detection 目标跟踪相关研究综述 徐佳龙 海军驻南京地区航空军事代表室,江苏南京 Email: pugongying_0532@https://www.360docs.net/doc/b06196974.html, 收稿日期:2015年8月1日;录用日期:2015年8月17日;发布日期:2015年8月20日 摘要 目标跟踪就是在视频序列的每幅图像中找到所感兴趣的运动目标的位置,建立起运动目标在各幅图像中的联系。本文分类总结了目标跟踪的相关工作,并进行了分析和展望。

机器视觉技术发展现状文献综述

机器视觉技术发展现状 人类认识外界信息的80%来自于视觉,而机器视觉就是用机器代替人眼来做 测量和判断,机器视觉的最终目标就是使计算机像人一样,通过视觉观察和理解 世界,具有自主适应环境的能力。作为一个新兴学科,同时也是一个交叉学科,取“信息”的人工智能系统,其特点是可提高生产的柔性和自动化程度。目前机器视觉技术已经在很多工业制造领域得到了应用,并逐渐进入我们的日常生活。 机器视觉是通过对相关的理论和技术进行研究,从而建立由图像或多维数据中获机器视觉简介 机器视觉就是用机器代替人眼来做测量和判断。机器视觉主要利用计算机来模拟人的视觉功能,再现于人类视觉有关的某些智能行为,从客观事物的图像中提取信息进行处理,并加以理解,最终用于实际检测和控制。机器视觉是一项综合技术,其包括数字处理、机械工程技术、控制、光源照明技术、光学成像、传感器技术、模拟与数字视频技术、计算机软硬件技术和人机接口技术等,这些技术相互协调才能构成一个完整的工业机器视觉系统[1]。 机器视觉强调实用性,要能适应工业现场恶劣的环境,并要有合理的性价比、通用的通讯接口、较高的容错能力和安全性、较强的通用性和可移植性。其更强调的是实时性,要求高速度和高精度,且具有非接触性、实时性、自动化和智能 高等优点,有着广泛的应用前景[1]。 一个典型的工业机器人视觉应用系统包括光源、光学成像系统、图像捕捉系统、图像采集与数字化模块、智能图像处理与决策模块以及控制执行模块。通过 CCD或CMOS摄像机将被测目标转换为图像信号,然后通过A/D转换成数字信号传送给专用的图像处理系统,并根据像素分布、亮度和颜色等信息,将其转换成数字化信息。图像系统对这些信号进行各种运算来抽取目标的特征,如面积、 数量、位置和长度等,进而根据判别的结果来控制现场的设备动作[1]。 机器视觉一般都包括下面四个过程:

农药残留对食品安全的影响以及农药残留检测技术的文献综述

农药残留对食品安全的影响以及农药残留 检测技术的文献综述 摘要:介绍了农药残留的现状及其对食品安全的影响,同时对农药残留检测技术进行系统的综述,并对今后农药残留检测及控制进行了展望。 关键词:农药残留食品安全检测技术 农药残留是指在农业生产中施用农药后一定时期内残留于生物体、农副产品及环境中微量的农药原体、有毒代谢物、降解物和杂质的总称。残留的数量叫农药残留量,以每千克样本中有多少毫克(或微克、纳克等)表示。农药残留是使用农药后的必然现象,是不可避免的。农副产品上的残留量超过限量,人畜长期食用后会引起慢性中毒或病变,直接或间接影响人们的身体健康。因此,控制降低农药残留,发展农药残留检测技术已成为当前亟待解决的问题。 1农药残留现状及种类 1.1 农药残留的现状 “民以食为天,食以安为先”,农产品的质量安全直接关系到人们的健康和安全。在农业生产中,由于农药、化肥等农业化学投入品的使用,导致农作物严重污染,人们食用农药残留超标的农产品,引起食物中毒的事件经常发生。2010年1 月25 日至2 月5 日,武汉市农业局在抽检中发现来自海南省英洲镇和崖城镇的5个豇豆样品水胺硫磷农药残留超标,消息一出,立即引起社会各方关注,豇豆产地收购价与销售批发价均出现大幅下滑。 农药残留已经成为我国农产品出口的最大障碍,常常被进口国当作借口阻挡在门外,不仅给农户造成经济损失,而且还导致农产品出口竞争力减弱或下降,引起国家之间的经济贸易纠纷。国际市场对出口农产品安全要求很高,从2000 年起,欧盟等国家对农药残留颁布了更严格的标准,从2006 年5 月29 日开始,在日本市场流通的生鲜食品就适用肯定列表制度,一棵白菜要检测20个项目,最多的一种农产品要检测50个项目,合格后才能通关[1]。 农药喷洒在作物上经过一定时间后,由于日晒、雨淋、风吹、高温挥发和植物代谢等的作用,药剂逐渐分解、减少,但不能全部消失,收获的农副产品上仍

(完整版)视频目标检测与跟踪算法综述

视频目标检测与跟踪算法综述 1、引言 运动目标的检测与跟踪是机器视觉领域的核心课题之一,目前被广泛应用在视频编码、智能交通、监控、图像检测等众多领域中。本文针对视频监控图像的运动目标检测与跟踪方法,分析了近些年来国内外的研究工作及最新进展。 2、视频监控图像的运动目标检测方法 运动目标检测的目的是把运动目标从背景图像中分割出来。运动目标的有效分割对于目标分类、跟踪和行为理解等后期处理非常重要。目前运动目标检测算法的难点主要体现在背景的复杂性和目标的复杂性两方面。背景的复杂性主要体现在背景中一些噪声对目标的干扰,目标的复杂性主要体现在目标的运动性、突变性以及所提取目标的非单一性等等。所有这些特点使得运动目标的检测成为一项相当困难的事情。目前常用的运动目标检测算法主要有光流法、帧差法、背景相减法,其中背景减除法是目前最常用的方法。 2.1帧差法 帧差法主要是利用视频序列中连续两帧间的变化来检测静态场景下的运动目标,假设f k(x, y)和f(k i)(x, y)分别为图像序列中的第k帧和第k+1帧中象素点(x,y)的象素值,则这两帧图像的差值图像就如公式2-1所示: Diff ki f k(x, y) f(k 1)(x, y)(2-1)2-1式中差值不为0的图像区域代表了由运动目标的运动所经过的区域(背景象素值不变),又因为相邻视频帧间时间间隔很小,目标位置变化也很小,所以运动目标的运动所经过的区域也就代表了当前帧中运动目标所在的区域。利用此原理便可以提取出目标。下图给出了帧差法的基本流程:1、首先利用2-1式得到第k帧和第k+1帧的差值图像Diff k 1;2、对所得到的差值图像Diff k 1二值化(如 式子2-2示)得到Qk+1 ;3、为消除微小噪声的干扰,使得到的运动目标更准 确,对Q k 1进行必要的滤波和去噪处理,后处理结果为M k 1。 1

汽车检测站设计文献综述

学院 文献综述 题目汽车检测站设计 姓名徐金权 专业机械设计制造及自动化 学号 7 指导教师郭磊魁 日期2016年12月16日

汽车综合性能检测站设计 一、前言 汽车检测站是综合运用现代检测技术,对汽车实施不解体检测、诊断的。它具有现代的检测设备和检测方法,能在室检测出车辆的各种参数,并诊断出可能出现的故障,为全面、准确评价汽车的使用性能和技术状况提供依据。其重要意义在于,能提高维修效率,并对维修质量进行监管,从而保证行车安全。 汽车综合性能检测站的设计建造在汽车运输行业来说是一项投资比较大技术性较强的工作,如何建好、管好汽车综合性能汽车检测站,这是摆在广大汽车运输行业科技人员面前的一个重要问题。这就要求我们在检测站的设计规划阶段,应着眼于国成熟的设计方案,充分考虑到检测站将要面的新形势和出现的新变化,拿出合理且具有前瞻性的设计方案。

汽车检测站的发展历史 国外发展历程 早在50年代在一些工业发达国家就形成以故障诊断和性能调试为主的单项检测技术和生产单项检测设备。60年代初期进入我国的汽车检测试验设备有美国的发动机分析仪、英国的发动机点火系故障诊断仪和汽车道路试验速度分析仪等,这些都是国外早期发展的汽车检测设备。60年代后期,国外汽车检测诊断技术发展很快,并且大量应用电子、光学、理化与机械相结合的光机电、理化机电一体化检测技术。例如:非接触式车速仪、前照灯检测仪、车轮定位仪、排气分析仪等都是光机电、理化机电一体化的检测设备。 进入70年代以来,随着计算机技术的发展,出现了汽车检测诊断、数据采集处理自动化、检测结果直接打印等功能的汽车性能检测仪器和设备。在此基础上,为了加强汽车管理、各工业发达国家相继建立汽车检测站和检测线,使汽车检测制度化。 国发展历程 我国从20世纪50年代开始研究汽车检测技术,为满足汽车维修需要,当时交通部主持进行了发动机气缸漏气量检测仪,点火正时灯等检测仪器的研究与开发。 随着国民经济的发展,科学技术在各个领域都有了快速的发展,汽车检测与诊断技术也随之得到快速发展。在单台检测设备研制成功的基础上,交通部自1980年开始,有计划地在全国公路运输系统筹建汽车综合性能检测站,取得了很大成绩。公安部门在全国中等以上的城市中,也建成了许多安全性能检测站。到2004年底,全国公路运输部门建成并投入使用的汽车综合性能检测站约1400余个。同时公安部门建成了数百个汽车安全性能检测站,部队,石油,冶金,外贸等系统和部分大专院校也建成了一定数量的汽车检测站。因此,目前我国以基本形成全国性的汽车检测网络。不仅如此,全国各地的维修企业使用的检测诊断设备也日益增多。汽车检测站的蓬勃发展,对保证在用汽车技术状况良好,监督维修质量,保障行车安全起到了非常重要的作用。同时,也促进了汽车诊断检测技术的发展。

(完整word版)基于图像处理的运动物体的跟踪与检测开题报告

1、课题来源 随着计算机技术的高速发展,运动物体的检测和跟踪在图像处理、计算机视觉、模式识别、人工智能、多媒体技术等领域越来越受到人们的关注。运动跟踪和检测的应用广泛,在智能监控和人机交互中,如:银行、交通、超市等场合常常使用运动跟踪分析技术,通过定位物体并对其行为进行分析,一旦发现物体有异常行为,监控系统就发出警报,提醒人们注意并即时的处理,改善了人工监督注意力分散、反应时间较慢、人力资源浪费等问题。运动目标的跟踪在虚拟现实、工业控制、军事设备、医学研究、视频监控、交通流量观测监控等很多领域也有重要的实用价值。特别在军事上,先进的武器导航、军事侦察和监控中都成功运用了自动跟踪技术。而跟踪的难点在于如何快速而准确的在每一帧图像中实现目标定位。正因如此,对运动目标的跟踪和检测的研究很有价值。 2、研究目的和意义 运动目标检测是图像处理与计算机视觉的一个分支,在理论和实践上都有重大意义,长久以来一直被国内外学者所关注。在实际中,视频监控利用摄像机对某一特定区域进行监视,是一个细致和连续的过程,它可以由人来完成,但是人执行这种长期枯燥的例行监测是不可靠,而且费用也很高,因此引入运动监测非常有必要。它可以减轻人的负担,并且提高了可靠性。概括起来运动监测主要包括三个内容:运动目标检测,方向判断和图像跟踪。运动目标检测是整个监测过程的基础,运动目标的提取准确与否,直接关系到后续高级过程的完成质量。3、国内外研究现状和发展趋势及综述 运动目标检测在国外已经取得了一些的研究成果,许多相关技术已经开始应用到实际系统中,但是国内研究相对落后,与国外还有较大差距。传统的视频目标提取大致可以分两类,一类以空间同性为准则,先用形态学滤波器或其他滤波器对图像作预处理;然后对该图像的亮度、色度或其他信息作空间上的分割以对区域作边缘检测;之后作运动估计,并合并相似的运动区域以得到最终的提取结果。如光流算法、主动轮廓模型算法。此类方法结果较为准确但是运算量相对较大。另一类算法主要以时间变化检测作为准则,这类算法主要通过帧差检测图像上的变化区域和不变区域,将运动物体与静止背景进行分割。此类方法运算量小,提取结果不如前类方法准确。此外,还有时空结合方法、时空亮度梯度信息结合的方法等等。 4、研究方法

视频目标跟踪算法综述_蔡荣太

1引言 目标跟踪可分为主动跟踪和被动跟踪。视频目标跟踪属于被动跟踪。与无线电跟踪测量相比,视频目标跟踪测量具有精度高、隐蔽性好和直观性强的优点。这些优点使得视频目标跟踪测量在靶场光电测量、天文观测设备、武器控制系统、激光通信系统、交通监控、场景分析、人群分析、行人计数、步态识别、动作识别等领域得到了广泛的应用[1-2]。 根据被跟踪目标信息使用情况的不同,可将视觉跟踪算法分为基于对比度分析的目标跟踪、基于匹配的目标跟踪和基于运动检测的目标跟踪。基于对比度分析的跟踪算法主要利用目标和背景的对比度差异,实现目标的检测和跟踪。基于匹配的跟踪主要通过前后帧之间的特征匹配实现目标的定位。基于运动检测的跟踪主要根据目标运动和背景运动之间的差异实现目标的检测和跟踪。前两类方法都是对单帧图像进行处理,基于匹配的跟踪方法需要在帧与帧之间传递目标信息,对比度跟踪不需要在帧与帧之间传递目标信息。基于运动检测的跟踪需要对多帧图像进行处理。除此之外,还有一些算法不易归类到以上3类,如工程中的弹转机跟踪算法、多目标跟踪算法或其他一些综合算法。2基于对比度分析的目标跟踪算法基于对比度分析的目标跟踪算法利用目标与背景在对比度上的差异来提取、识别和跟踪目标。这类算法按照跟踪参考点的不同可以分为边缘跟踪、形心跟踪和质心跟踪等。这类算法不适合复杂背景中的目标跟踪,但在空中背景下的目标跟踪中非常有效。边缘跟踪的优点是脱靶量计算简单、响应快,在某些场合(如要求跟踪目标的左上角或右下角等)有其独到之处。缺点是跟踪点易受干扰,跟踪随机误差大。重心跟踪算法计算简便,精度较高,但容易受到目标的剧烈运动或目标被遮挡的影响。重心的计算不需要清楚的轮廓,在均匀背景下可以对整个跟踪窗口进行计算,不影响测量精度。重心跟踪特别适合背景均匀、对比度小的弱小目标跟踪等一些特殊场合。图像二值化之后,按重心公式计算出的是目标图像的形心。一般来说形心与重心略有差别[1-2]。 3基于匹配的目标跟踪算法 3.1特征匹配 特征是目标可区别与其他事物的属性,具有可区分性、可靠性、独立性和稀疏性。基于匹配的目标跟踪算法需要提取目标的特征,并在每一帧中寻找该特征。寻找的 文章编号:1002-8692(2010)12-0135-04 视频目标跟踪算法综述* 蔡荣太1,吴元昊2,王明佳2,吴庆祥1 (1.福建师范大学物理与光电信息科技学院,福建福州350108; 2.中国科学院长春光学精密机械与物理研究所,吉林长春130033) 【摘要】介绍了视频目标跟踪算法及其研究进展,包括基于对比度分析的目标跟踪算法、基于匹配的目标跟踪算法和基于运动检测的目标跟踪算法。重点分析了目标跟踪中特征匹配、贝叶斯滤波、概率图模型和核方法的主要内容及最新进展。此外,还介绍了多特征跟踪、利用上下文信息的目标跟踪和多目标跟踪算法及其进展。 【关键词】目标跟踪;特征匹配;贝叶斯滤波;概率图模型;均值漂移;粒子滤波 【中图分类号】TP391.41;TN911.73【文献标识码】A Survey of Visual Object Tracking Algorithms CAI Rong-tai1,WU Yuan-hao2,WANG Ming-jia2,WU Qing-xiang1 (1.School of Physics,Optics,Electronic Science and Technology,Fujian Normal University,Fuzhou350108,China; 2.Changchun Institute of Optics,Fine Mechanics and Physics,Chinese Academy of Science,Changchun130033,China)【Abstract】The field of visual object tracking algorithms are introduced,including visual tracking based on contrast analysis,visual tracking based on feature matching and visual tracking based on moving detection.Feature matching,Bayesian filtering,probabilistic graphical models,kernel tracking and their recent developments are analyzed.The development of multiple cues based tracking,contexts based tracking and multi-target tracking are also discussed. 【Key words】visual tracking;feature matching;Bayesian filtering;probabilistic graphical models;mean shift;particle filter ·论文·*国家“863”计划项目(2006AA703405F);福建省自然科学基金项目(2009J05141);福建省教育厅科技计划项目(JA09040)

基于机器视觉的工件识别和定位文献综述

基于机器视觉的工件识别和定位文献综述 1.前言 1.1工业机器人的现状与发展趋势 机器人作为一种最典型的应用范围广、技术附加值高的数字控制装备,在现代先进生产制造业中发挥的作用越来越重要,机器人技术的发展将会对未来生产和社会发展起到强有力的推动作用。《2l 世纪日本创建机器人社会技术发展战略报告》指出,“机器人技术与信息技术一样,在强化产业竞争力方面是极为重要的战略高技术领域。培育未来机器人产业是支撑2l 世纪日本产业竞争力的产业战略之一,具有非常重要的意义。” 研发工业机器人的初衷是为了使工人能够从单调重复作业、危险恶劣环境作业中解脱出来,但近些年来,工厂和企业引进工业机器人的主要目的则更多地是为了提高生产效率和保证产品质量。因为机器人的使用寿命很长,大都在10 年以上,并且可以全天后不间断的保持连续、高效地工作状态,因此被广泛应用于各行各业,主要进行焊接、装配、搬运、加工、喷涂、码垛等复杂作业。伴随着工业机器人研究技术的成熟和现代制造业对自动生产的需要,工业机器人越来越被广泛的应用到现代化的生产中。 现在机器人的价格相比过去已经下降很多,并且以后还会继续下降,但目前全世界范围的劳动力成本都有所上涨,个别国家和地区劳动力成本又很高,这就给工业机器人的需求提供了广阔的市场空间,工业机器人销量的保持着较快速度的增长。工业机器人在生产中主要有机器人工作单元和机器人工作生产线这两种应用方式,并且在国外,机器人工作生产线已经成为工业机器人主要的应用方式。以机器人为核心的自动化生产线适应了现代制造业多品种、少批量的柔性生产发展方向,具有广阔的市场发展前景和强劲生命力,已开发出多种面向汽车、电气机械等行业的自动化成套装备和生产线产品。在发达国家,机器人自动化生产线已经应用到了各行各业,并且已经形成一个庞大的产业链。像日本的FANUC、MOTOMAN,瑞典的ABB、德国的KUKA、意大利的COMAU 等都是国际上知名的被广泛用于自动化生产线的工业机器人。这些产品代表着当今世界工业机器人的最高水平。 我国的工业机器人前期发展比较缓慢。当将被研发列入国家有关计划后,发展速度就明显加快。特别是在每次国家的五年规划和“863”计划的重点支持下,我国机器人技术的研究取得了重大发展。在机器人基础技术和关键技术方面都取得了巨大进展,科技成果已经在实际工作中得到转化。以沈阳新松机器人为代表的国内机器人自主品牌已迅速崛起并逐步缩小与国际品牌的技术差距。 机器人涉及到多学科的交叉融合,涉及到机械、电子、计算机、通讯、控制等多个方面。在现代制造业中,伴随着工业机器人应用范围的扩大和机器人技术的发展,机器人的自动化、智能化和网络化的程度也越来越高,所能实现的功能也越来越多,性能越来越好。机器人技术的内涵已变为“灵活应用机器人技术的、具有实在动作功能的智能化系统。”目前,工业机器人技术正在向智能机器和智能系统的方向发展,其发展趋势主要为:结构的模块化和可重构化;控制技术的开放化、PC 化和网络化;伺服驱动技术的数字化和分散化;多传感器融合技术的实用化;工作环境设计的优化和作业的柔性化以及系统的网络化和智能化等方面。 1.2机器视觉在工业机器人中的应用 工业机器人是FMS(柔性加工)加工单元的主要组成部分,它的灵活性和柔性使其成为自动化物流系统中必不可少的设备,主要用于物料、工件的装卸、分捡和贮运。目前在全世界有数以百万的各种类型的工业机器人应用在机械制造、零件加工和装配及运输等领域,

检测交通视频中运动目标的程序设计

专业综合实践任务书 学生姓名:________专业班级: 指导教师: 工作单位: 信息工程学院 题目:检测交通视频中运动目标的程序设计 初始条件: (1)提供实验室机房及其matlab软件; (2)数字图像处理的基本理论学习。 要求完成的主要任务:(包括课程设计工作量及其技术要求,以及说明书撰写等具体 要求): (1)学习运动目标检测的原理及方法,并利用matlab设计程序完成以下功能;(2)读取交通视频文件; (3)运用一种背景建模方法,提取背景图像; (4)读取一帧有运动目标的图像,利用背景差分法,得到差分区域; (5)对差分区域进行数学形态学处理,得到完整的运动目标区域,并显示运动目标检测结果图; (6)对检测的结果进行分析比较; (7)要求阅读相关参考文献不少于5篇; (8)根据课程设计有关规范,按时、独立完成课程设计说明书。 时间安排: (1) 布置课程设计任务,查阅资料,确定方案 1.5天; (2) 进行编程设计、调试2天; (3) 完成课程设计报告书、答辩 1.5天; 指导教师签名: 年月日系主任(或责任教师)签名: 年月日

目录 摘要 (1) 1.概述 (2) 2.设计原理 (3) 2.1 背景提取与更新算法 (3) 2.1.1 手动背景法 (4) 2.1.2 统计中值法 (4) 2.1.3 算术平均法 (4) 2.1.4 Surendra算法 (5) 2.2 背景差分法运动目标检测 (6) 2.3 形态学滤波 (7) 2.4总体方案设定 (9) 2.4.1 算术平均法与Surendra算法相结合的背景建模 (9) 2.4.2 总体程序框图 (10) 3.软件编程实现 (11) 4.结果及分析 (13) 5.心得体会 (17) 参考文献 (18)

相关文档
最新文档