尺度不变特征

尺度不变特征
尺度不变特征

SIFT特征分析与源码解读

分类:机器视觉与模式识别2013-11-19 22:28 10人阅读评论(0) 收藏举报

目录(?)[+] SIFT(Scale-invariant feature transform)是一种检测局部特征的算法,该算法通过求一幅图中的特征点(interest points,or corner points)及其有关scale 和orientation 的描述子得到特征并进行图像特征点匹配,获得了良好效果,详细解析如下:

算法描述

SIFT特征不只具有尺度不变性,即使改变旋转角度,图像亮度或拍摄视角,仍然能够得到好的检测效果。整个算法分为以下几个部分:1. 构建尺度空间

这是一个初始化操作,尺度空间理论目的是模拟图像数据的多尺度特征。

高斯卷积核是实现尺度变换的唯一线性核,于是一副二维图像的尺度空间定义为:

其中G(x,y,σ) 是尺度可变高斯函数

(x,y)是空间坐标,是尺度坐标。σ大小决定图像的平滑程度,大尺度对应图像的概貌特征,小尺度对应图像的细节特征。大的σ值对应粗糙尺度(低分辨率),反之,对应精细尺度(高分辨率)。为了有效的在尺度空间检测到稳定的关键点,提出了高斯差分尺度空间(DOG scale-space)。利用不同尺度的高斯差分核与图像卷积生成。

下图所示不同σ下图像尺度空间:

关于尺度空间的理解说明:2kσ中的2是必须的,尺度空间是连续的。在 Lowe的论文中,将第0层的初始尺度定为1.6(最模糊),图片的初始尺度定为0.5(最清晰). 在检测极值点前对原始图像的高斯平滑以致图像丢失高频信息,所以Lowe 建议在建立尺度空间前首先对原始图像长宽扩展一倍,以保留原始图像信息,增加特征点数量。尺度越大图像越模糊。

图像金字塔的建立:对于一幅图像I,建立其在不同尺度(scale)的图像,也成为子八度(octave),这是为了scale-invariant,也就是在任何尺度都能够有对应的特征点,第一个子八度的scale为原图大小,后面每个octave为上一个octave降采样的结果,即原图的1/4(长宽分别减半),构成下一个子八度(高一层金字塔)。

尺度空间的所有取值,i为octave的塔数(第几个塔),s为每塔层数

由图片size决定建几个塔,每塔几层图像(S一般为3-5层)。0塔的第0层是原始图像(或你double后的图像),往上每一层是对其下一层进行Laplacian变换(高斯卷积,其中σ值渐大,例如可以是σ, k*σ, k*k*σ…),直观上看来越往上图片越模糊。塔间的图片是降采样关系,例如1塔的第0层可以由0塔的第3层down sample得到,然后进行与0塔类似的高斯卷积操作。

2. LoG近似DoG找到关键点<检测DOG尺度空间极值点>

为了寻找尺度空间的极值点,每一个采样点要和它所有的相邻点比较,看其是否比它的图像域和尺度域的相邻点大或者小。如图所示,中间的检测点和它同尺度的8个相邻点和上下相邻尺度对应的9×2个点共26个点比较,以确保在尺度空间和二维图像空间都检测到极值点。一个点如果在DOG尺度空间本层以及上下两层的26个领域中是最大或最小值时,就认为该点是图像在该尺度下的一个特征点,如图所示。

同一组中的相邻尺度(由于k的取值关系,肯定是上下层)之间进行寻找

s=3的情况

在极值比较的过程中,每一组图像的首末两层是无法进行极值比较的,为了满足尺度变化的连续性(下面有详解)

,我们在每一组图像的顶层继续用高斯模糊生成了 3 幅图像,高斯金字塔有每组S+3层图像。DOG金字塔每组有S+2层图像.

==========================================

这里有的童鞋不理解什么叫“为了满足尺度变化的连续性”,现在做仔细阐述:

假设s=3,也就是每个塔里有3层,则k=21/s=21/3,

那么按照上图可得Gauss Space和DoG space 分别有3个(s个)和2个(s-1

个)分量,在DoG space中,1st-octave两项分别是σ,kσ; 2nd-octave两项分别是2σ,2kσ;由于无法比较极值,我们必须在高斯空间继续添加高斯模糊项,使得形成σ,kσ,k

2σ,k3σ,k4σ这样就可以选择DoG space中的中间三项kσ,k2σ,k3σ(只有左右都有才能有极值),那么下一octave中(由上一层降采样获得)所得三项即为

2kσ,2k2σ,2k3σ,其首项2kσ=24/3。刚好与上一octave末项k3σ=23/3尺度变化连续起来,所以每次要在Gaussian space添加3项,每组(塔)共S+3层图像,相应的DoG 金字塔有S+2层图像。

==========================================

使用Laplacian of Gaussian能够很好地找到找到图像中的兴趣点,但是需要大量的计算量,所以使用Difference of Gaussian图像的极大极小值近似寻找特征点.DOG算子计算简单,是尺度归一化的LoG算子的近似,有关DOG寻找特征点的介绍及方法详见

https://www.360docs.net/doc/8c14029652.html,/abcjennifer/article/details/7639488,极值点检测用的Non-Maximal Suppression。

3. 除去不好的特征点

通过拟和三维二次函数以精确确定关键点的位置和尺度(达到亚像素精度),同时去除低对比度的关键点和不稳定的边缘响应点(因为DoG算子会产生较强的边缘响应),以增强匹配稳定性、提高抗噪声能力,在这里使用近似Harris Corner检测器。

①空间尺度函数泰勒展开式如下:,对上式求导,并令其为0,得到精确的

位置, 得

②在已经检测到的特征点中,要去掉低对比度的特征点和不稳定的边缘响应点。去除低对比度的点:把公式(2)代入公式(1),即在DoG Space的极值点处D(x)取值,只取前两项可得:

若,该特征点就保留下来,否则丢弃。

③边缘响应的去除

一个定义不好的高斯差分算子的极值在横跨边缘的地方有较大的主曲率,而在垂直边缘的方向有较小的主曲率。主曲率通过一个2×2 的Hessian矩阵H求出:

导数由采样点相邻差估计得到。

D的主曲率和H的特征值成正比,令α为较大特征值,β为较小的特征值,则

令α=γβ,则

(r + 1)2/r的值在两个特征值相等的时候最小,随着r的增大而增大,因此,为了检测主曲率是否在某域值r下,只需检测

2/r, throw it out. 在Lowe的文章中,取r=10。

if (α+β)/ αβ> (r+1)

4. 给特征点赋值一个128维方向参数

上一步中确定了每幅图中的特征点,为每个特征点计算一个方向,依照这个方向做进一步的计算,利用关键点邻域像素的梯度方向分布特性为每个关键点指定方向参数,使算子具备旋转不变性。

为(x,y)处梯度的模值和方向公式。其中L所用的尺度为每个关键点各自所在的尺度。至此,图像的关键点已经检测完毕,每个关键点有三个信息:位置,所处尺度、方向,由此可以确定一个SIFT特征区域。

梯度直方图的范围是0~360度,其中每10度一个柱,总共36个柱。随着距

中心点越远的领域其对直方图的贡献也响应减小.Lowe论文中还提到要使用高斯函数对直方图进行平滑,减少突变的影响。

在实际计算时,我们在以关键点为中心的邻域窗口内采样,并用直方图统计邻域像素的梯度方向。梯度直方图的范围是0~360度,其中每45度一个柱,总共8个柱, 或者每10度一个柱,总共36个柱。Lowe论文中还提到要使用高斯函数对直方图进行平滑,减少突变的影响。直方图的峰值则代表了该关键点处邻域梯度的主方向,即作为该关键点的方向。

直方图中的峰值就是主方向,其他的达到最大值80%的方向可作为辅助方向

由梯度方向直方图确定主梯度方向

该步中将建立所有scale中特征点的描述子(128维)

Identify peak and assign orientation and sum of magnitude to key point.

The user may choose a threshold to exclude key points based on their assigned sum of magnitudes.

关键点描述子的生成步骤

通过对关键点周围图像区域分块,计算块内梯度直方图,生成具有独特性的向量,这个向量是该区域图像信息的一种抽象,具有唯一性。

5. 关键点描述子的生成

首先将坐标轴旋转为关键点的方向,以确保旋转不变性。以关键点为中心取8×8的窗口。

Figure.16*16的图中其中1/4的特征点梯度方向及scale,右图为其加权到8个主方向后的效果。

图左部分的中央为当前关键点的位置,每个小格代表关键点邻域所在尺度空间的一个像素,利用公式求得每个像素的梯度幅值与梯度方向,箭头方向代表该像素的梯度方向,箭头长度代表梯度模值,然后用高斯窗口对其进行加权运算。

图中蓝色的圈代表高斯加权的范围(越靠近关键点的像素梯度方向信息贡献越大)。然后在每4×4的小块上计算8个方向的梯度方向直方图,绘制每个梯度方向的累加值,即可形成一个种子点,如图右部分示。此图中一个关键点由2×2共4个种子点组成,每个种子点有8个方向向量信息。这种邻域方向性信息联合的思想增强了算法抗噪声的能力,同时对于含有定位误差的特征匹配也提供了较好的容错性。

计算keypoint周围的16*16的window中每一个像素的梯度,而且使用高斯下降函数降低远离中心的权重。

在每个4*4的1/16象限中,通过加权梯度值加到直方图8个方向区间中的一个,计算出一个梯度方向直方图。

这样就可以对每个feature形成一个4*4*8=128维的描述子,每一维都可以表示4*4个格子中一个的scale/orientation. 将这个向量归一化之后,就进一步去除了光照

的影响。

5. 根据SIFT进行Match

生成了A、B两幅图的描述子,(分别是k1*128维和k2*128维),就将两图中各个scale(所有scale)的描述子进行匹配,匹配上128维即可表示两个特征点match上了。

实际计算过程中,为了增强匹配的稳健性,Lowe建议对每个关键点使用4×4共16个种子点来描述,这样对于一个关键点就可以产生128个数据,即最终形成128维的SIFT特征向量。此时SIFT特征向量已经去除了尺度变化、旋转等几何变形因素的影响,再继续将特征向量的长度归一化,则可以进一步去除光照变化的影响。当两幅图像的SIFT特征向量生成后,下一步我们采用关键点特征向量的欧式距离来作为两幅图像中关键点的相似性判定度量。取图像1中的某个关键点,并找出其与图像2中欧式距离最近的前两个关键点,在这两个关键点中,如果最近的距离除以次近的距离少于某个比例阈值,则接受这一对匹配点。降低这个比例阈值,SIFT匹配点数目会减少,但更加稳定。为了排除因为图像遮挡和背景混乱而产生的无匹配关系的关键点,Lowe提出了比较最近邻距离与次近邻距离的方法,距离比率ratio小于某个阈值的认为是正确匹配。因为对于错误匹配,由于特征空间的高维性,相似的距离可能有大量其他的错误匹配,从而它的ratio值比较高。Lowe推荐ratio的阈值为0.8。但作者对大量任意存在尺度、旋转和亮度变化的两幅图片进行匹配,结果表明ratio取值在0. 4~0. 6之间最佳,小于0. 4的很少有匹配点,大于0. 6的则存在大量错误匹配点。(如果这个地方你要改进,最好给出一个匹配率和ration之间的关系图,这样才有说服力)作者建议ratio的取值原则如下:

ratio=0. 4对于准确度要求高的匹配;

ratio=0. 6对于匹配点数目要求比较多的匹配;

ratio=0. 5一般情况下。

也可按如下原则:当最近邻距离<200时ratio=0. 6,反之ratio=0. 4。ratio的取值策略能排分错误匹配点。

当两幅图像的SIFT特征向量生成后,下一步我们采用关键点特征向量的欧式距离来作为两幅图像中关键点的相似性判定度量。取图像1中的某个关键点,并找出其与图像2中欧式距离最近的前两个关键点,在这两个关键点中,如果最近的距离除以次近的距离少于某个比例阈值,则接受这一对匹配点。降低这个比例阈值,SIFT匹配点数目会减少,但更加稳定。

实验结果:

===============================

基本概念及一些补充

什么是局部特征?

?局部特征从总体上说是图像或在视觉领域中一些有别于其周围的地方?局部特征通常是描述一块区域,使其能具有高可区分度

?局部特征的好坏直接会决定着后面分类、识别是否会得到一个好的结果局部特征需具备的特性

?重复性

?可区分性

?准确性

?数量以及效率

?不变性

局部特征提取算法-sift

?SIFT算法由D.G.Lowe 1999年提出,2004年完善总结。后来Y.Ke将其描述子部分用PCA代替直方图的方式,对其进行改进。

?SIFT算法是一种提取局部特征的算法,在尺度空间寻找极值点,提取位置,尺度,旋转不变量

?SIFT特征是图像的局部特征,其对旋转、尺度缩放、亮度变化保持不变性,对视角变化、仿射变换、噪声也保持一定程度的稳定性。

?独特性好,信息量丰富,适用于在海量特征数据库中进行快速、准确的匹配。

?多量性,即使少数的几个物体也可以产生大量SIFT特征向量。

?可扩展性,可以很方便的与其他形式的特征向量进行联合。

尺度空间理论

?尺度空间理论目的是模拟图像数据的多尺度特征

?其基本思想是在视觉信息图像信息处理模型中引入一个被视为尺度的参数, 通过连续变化尺度参数获得不同尺度下的视觉处理信息, 然后综合这些信息以深入地挖掘图像的本质特征。

描述子生成的细节

?以极值点为中心点,并且以此点所处于的高斯尺度sigma值作为半径因子。对于远离中心点的梯度值降低对其所处区域的直方图的贡献,防止一些突变的影响。

?每个极值点对其进行三线性插值,这样可以把此极值点的贡献均衡的分到直方图中相邻的柱子上

归一化处理

?在求出4*4*8的128维特征向量后,此时SIFT特征向量已经去除了尺度变化、旋转等几何变形因素的影响。而图像的对比度变化相当于每个像素点乘上一个因子,光照变化是每个像素点加上一个值,但这些对图像归一化的梯度没有影响。因此将特征向量的长度归一化,则可以进一步去除光照变化的影响。

?对于一些非线性的光照变化,SIFT并不具备不变性,但由于这类变化影响的主要是梯度的幅值变化,对梯度的方向影响较小,因此作者通过限制梯度幅值的值来减少这类变化造成的影响。

PCA-SIFT算法

?PCA-SIFT与标准SIFT有相同的亚像素位置,尺度和主方向。但在第4步计算描述子的设计,采用的主成分分析的技术。

?下面介绍一下其特征描述子计算的部分:

?用特征点周围的41×41的像斑计算它的主元,并用PCA-SIFT将原来的2×39×39维的向量降成20维,以达到更精确的表示方式。

?它的主要步骤为,对每一个关键点:在关键点周围提取一个41×41的像斑于给定的尺度,旋转到它的主方向;计算39×39水平和垂直的梯度,形成一个大小为3042的矢量;用预先计算好的投影矩阵n×3042与此矢量相乘;这样生成一个大小为n的PCA-SIFT描述子。

===============================

辅助资料:

=============================== Reference:

Lowe SIFT 原文:http://www.cs.ubc.ca/~lowe/papers/ijcv04.pdf

SIFT 的C实现:https://https://www.360docs.net/doc/8c14029652.html,/robwhess/opensift/blob/master/src

MATLAB 应用Sift算子的模式识别方法:https://www.360docs.net/doc/8c14029652.html,/abcjennifer/article/details/7372880

https://www.360docs.net/doc/8c14029652.html,/abcjennifer/article/details/7365882

https://www.360docs.net/doc/8c14029652.html,/wiki/Scale-invariant_feature_transform#David_Lowe.27s_method

https://www.360docs.net/doc/8c14029652.html,/blog-613779-475881.html

https://www.360docs.net/doc/8c14029652.html,/linyunzju/archive/2011/06/14/2080950.html

https://www.360docs.net/doc/8c14029652.html,/linyunzju/archive/2011/06/14/2080951.html

https://www.360docs.net/doc/8c14029652.html,/ijuliet/article/details/4640624

https://www.360docs.net/doc/8c14029652.html,/cfantaisie/archive/2011/06/14/2080917.html(部分图片有误,以本文中的图片为准)

SIFT解析(一)建立高斯金字塔

SIFT(Scale-Invariant Feature Transform,尺度不变特征转换)在目标识别、图像配准领域具有广泛的应用,下面按照SIFT特征的算法流程对其进行简要介绍对SIFT特征做简要介绍。

高斯金字塔是SIFT特征提取的第一步,之后特征空间中极值点的确定,都是基于高斯金字塔,因此SIFT特征学习的第一步是如何建立的高斯金字塔。

明白几个定义:

高斯金字塔对于高斯金字塔,很容易直观地理解为对同一尺寸的图像,然后进行不同程度的高斯平滑,这些图像构成高斯金字塔,这种是不对的,这描述的图像集合叫做一个八度。金字塔总要有个变“尖”的过程,真正的高斯金字塔要有个平滑以及下采样的过程,因此整个图像平滑以及下采样再平滑,构成的所有图像集合才构成了图像的高斯金字塔。具有一个б尺度

八度(octave)简单地说八度就是在特定尺寸(长宽)下,经不同高斯核模糊的图像的集合。八度的集合是高斯金字塔。

为什么要构建高斯金字塔:

整个高斯金字塔,或者说是差分高斯金字塔是我们确定SIFT特征的基础,让我们首先想想高斯金字塔到底干了一件什么事情,他到底模仿的是什么?答案很容易确定,高斯金字塔模仿的是图像的不同的尺度,尺度应该怎样理解?对于一副图像,你近距离观察图像,与你在一米之外观察,看到的图像效果是不同的,前者比较清晰,后者比较模糊,前者比较大,后者比较小,通过前者能看到图像的一些细节信息,通过后者能看到图像的一些轮廓的信息,这就是图像的尺度,图像的尺度是自然存在的,并不是人为创造的。好了,到这里我们明白了,其实以前对一幅图像的处理还是比较单调的,因为我们的关注点只落在二维空间,并没有考虑到“图像的纵深”这样一个概念,如果将这些内容考虑进去我们是不是会得到更多以前在二维空间中没有得到的信息呢?于是高斯金字塔横空出世了,它就是为了在二维图像的基础之上,榨取出图像中自然存在的另一个维度:尺度。因为高斯核是唯一的线性核,也就是说使用高斯核对图像模糊不会引入其他噪声,因此就选用了高斯核来构建图像的尺度。

I. 下图两幅图像是典型的一幅一定大小的图像使用高斯滤波后将得到一个高斯平滑图像,注意图像的大小未发生变化。

II. 现在把这样一幅一定大小的图像分别使用不同尺度的高斯(核)滤波平滑后,就得到一个图像集合,那么这个集合就称为一个八度(octave),其中这个图像就称为这个八度的原图像。

III. 那么如果原图像不同,所得的八度也不同,原图像不同包括其大小、灰度值,注意高斯滤波会改变图像的灰度值。

IV. 假设有一组八度,如果原图像都是有一定规律的,那么这些八度一定存在一定联系

现在IV中的原图像是经过降采样生成的,那么这些八度便构成了金字塔形状图像高斯金字塔,这就是模仿的图像离你远去时在你视网膜上的成像,图像分别以动态方式表示。

高斯金字塔的构建步骤:

根据Lowe的论文,高斯金字塔的构建还是比较简单的,高斯卷积和是尺度变换的唯一的线性核。

高斯金字塔构建过程中,一般首先将图像扩大一倍,在扩大的图像的基础之上构建高斯金字塔,然后对该尺寸下图像进行高斯模糊,几幅模糊之后的图像集合构成了一个八度,然后对该八度下的最模糊的一幅图像进行下采样的过程,长和宽分别缩短一倍,图像面积变为原来四分之一。这幅图像就是下一个八度的初始图像,在初始图像图像的基础上完成属于这个八度的高斯模糊处理,以此类推完成整个算法所需要的所有八度构建,这样这个高斯金字塔就构建出来了。构建出的金字塔如下图所示:

什么是尺度空间:

以上已经从人视觉感知的角度让大家感性认识了“尺度”,上文也提到使用高斯核来实现尺度的变换,那么具体实现过程中,尺度体现在哪里?是如何量化的呢?怎么在高斯金字塔中,两个变量很重要,即第几个八度(o)和八度中的第几层(s),这两个量合起来(o,s)就构成了高斯金字塔的尺度空间。尺度空间也不难理解,首先一个八度中图像的长和宽是相等的,即变量o控制的是塔中尺寸这个尺度;区分同一个尺寸尺度下的图像,就需要s了,s控制了一个八度中不同的模糊程度。这样(o,s)就能够确定高斯金字塔中的唯一一幅图像了,这是个三维空间,两维坐标,一维是图像。

根据lowe的论文,(o,s)作用于一幅图像是通过公式

确定的。通过公式也可以看出,尺度空间是连续的,两个变量控制着δ的值,其中在第一个八度中有1<(o+s/S)<=2 ,同理在第二个八度中有

2<(o+s/S)<=3,以此类推,δ中的关键部分(o+s/S)部分是逐渐增大的(具体实现时,有些高斯金字塔中这个值是增大,但不是逐渐均匀增大,只能说是连续的)。

上图中第一个八度的中图像的尺度分别是δ,kδ,k^2δ......,第二个八度的尺度分别是2δ,2kδ,2k^2δ........,同理第三个八度的尺度分别是4δ,4kδ,4k^2δ........。这个序列是通过下式来确定的:

所以每增加一级八度,δ都要扩大2倍,在一个八度中,k的上标s来区分不同的高斯核。

至此,高斯金字塔中的尺度空间已经说得差不多了,包括尺度是什么,包括高斯金字塔中尺度的连续性,后文将详细说明尺度空间的连续性。下图形象说明了什么是尺度空间:

构建差分高斯金字塔

构建高斯金字塔是为了后续构建差分高斯金字塔。对同一个八度的两幅相邻的图像做差得到插值图像,所有八度的这些插值图像的集合,就构成了差分高斯金字塔。过程如下图所示,差分高斯金字塔的好处是为后续的特征点的提取提供了方便。

到这里,高斯金字塔构建的主要部分、关键点都弄好了,一些非常重要的认知就要呼之欲出了,下面解释整个空间的尺度连续性!这是差分高斯金字塔的重中之重!

尺度空间的连续性

这里注意,连续性的主语既不是高斯金字塔,也不是差分高斯金字塔,而是尺度空间。在弄清楚这个问题之前,我们还需要解决一个问题,即为什么高斯金字塔中每个八度有s+3幅高斯图像?s的意思是将来我们在差分高斯金字塔中求极值点的时候,我们要在每个八度中求s层点,通过lowe 论文可知,每一层极值点是在三维空间(图像二维,尺度一维)中比较获得,因此为了获得s层点,那么在差分高斯金字塔中需要有s+2图像,好了,继续上溯,如果差分高斯金字塔中有s+2幅图像,那么高斯金字塔中就必须要有s+3幅图像了,因为差分高斯金字塔是由高斯金字塔相邻两层相减得到的。好了,到了这里似乎真相大白,但是我们上面的推导有一个致命的问题,我们上来就假设“我们要在每个八度中求s层点”,为什么要s层点呢?这才是这个小节的主题:是为了保持尺度的连续性!下面进行详细的分析:

以一个八度中的图像为例说明(此处最好结合OpenCV中金字塔构建部分的源码<下文已列出,可以参照>)

高斯金字塔和差分高斯金字塔那几个公式还要在这里贴出来一下:

高斯函数G对图像I的模糊函数:

高斯差分函数:

通过以上这两个公式,可以确定一个八度中(以第一个八度为例)高斯图像和差分高斯图像的尺度如下(以lowe论文为例,s=3,所以每个八度中会有3+3=6幅图像),每一幅图像的尺度也在图像标示了出来。

在lowe的论文中s=3,因此有

因此,当前八度中各高斯图像的尺度依次为:

σ,2^(1/3)σ,2^(2/3)σ,2^(3/3)σ,2^(4/3)σ,2^(5/3)σ;

当前八度中各差分高斯图像的尺度依次为:

σ,2^(1/3)σ,2^(2/3)σ,2^(3/3)σ,2^(4/3)σ。

同理,我们可以推断出,下一个八度中各高斯图像的尺度依次为:

2×σ,2×2^(1/3)σ,2×2^(2/3)σ,2×2^(3/3)σ,2×2^(4/3)σ,2×2^(5/3)σ;

下一个八度中各差分高斯图像的尺度依次为:

2×σ,2×2^(1/3)σ,2×2^(2/3)σ,2×2^(3/3)σ,2×2^(4/3)σ。

可以观察到,其中红色标注数据所代表的层,是差分高斯金字塔中获得极值点的层,也就是说只有在这些层上才发生与上下两层比较获得极值点的操作。下面将这些红色数据连成一串:2^(1/3)σ,2^(2/3)σ,2^(3/3)σ,2×2^(1/3)σ,2×2^(2/3)σ,2×2^(3/3)σ......。发现了什么?对了,这些数据时连续的,我们通过在每个八度中多构造三幅高斯图像,达到了尺度空间连续的效果,这一效果带来的直接的好处是在尺度空间的极值点确定过程中,我们不会漏掉任何一个尺度上的极值点,而是能够综合考虑量化的尺度因子

所确定的每一个尺度!

下一个八度的第一幅图像如何确定

这个问题,是上面问题(尺度空间的连续性)的延伸,我们可以通过反推OpenCV中这一部分的源代码,来理解这个问题。

当前八度中的第一幅图像是通过前一个八度的倒数第三幅图像得到。OpenCV这段源码有个很重要的问题:不同的八度间的尺度不是会有一个2的差异吗?为什么本部分源码并没有体现这一点,而是在对每一个八度处理中都是用相同的数组sig[]。首先明确一下sig数组内.存储的并不是一个绝对的模糊核,而是相对的模糊核,这一点很重要,既然是相对的模糊核,那么第一幅图像的核就很重要了,所以尺度的连续就看每个八度的第一幅图像了。

对于以下列出的高斯金字塔的构建过程来看,每个八度中的第一幅图像并没有一个2倍的尺度跃进过程。但是,这个2倍的跃进式隐含在整个高斯金字塔的构建过程中了!

再看倒数第三幅图像,这幅图像的尺度是2^(3/3)*δ,3/3=1,也就是说,在这个八度中,第一幅图像的尺度是δ,而倒数第三幅图像的尺度是2*δ,正好发生了一个2的跃进!这就是以这幅图像作为基准进行下采样的原因,如此的话,下一个八度的第一幅图像的初始尺度就是2*δ了。

这就是真相,这就是为什么选用倒数第三幅图像进行下采样的原因。[cpp]view plaincopy

以上SIFT源码均摘自OpenCV nonfree模块,lowe对SIFT拥有版权。

SIFT金字塔构建完毕,需要在金字塔中寻找特征点了,请关注本博客SIFT系列下一篇文章:SIFT解析(二)特征点位置确定

SIFT解析(二)特征点位置确定

最近微博上有人发起投票那篇论文是自己最受益匪浅的论文,不少人说是lowe的这篇介绍SIFT的论文。确实,在图像特征识别领域,SIFT的出现是具有重大意义的,SIFT特征以其稳定的存在,较高的区分度推进了诸多领域的发展,比如识别和配准。上一篇文章,解析了SIFT特征提取的第一步高斯金字塔的构建,并详细分析了高斯金字塔以及差分高斯金字塔如何完成一个连续的尺度空间的构建。构建高斯金字塔不是目的,目的是如何利用高斯金字塔找到极值点。

lowe在论文中阐述了为什么使用差分高斯金字塔:

1)差分高斯图像可以直接由高斯图像相减获得,简单高效

2)差分高斯函数是尺度规范化的高斯拉普拉斯函数的近似,而高斯拉普拉斯函数的极大值和极小值点是一种非常稳定的特征点(与梯度特征、Hessian特征和Harris角点相比)

有了这些基础,我们就可以放开手脚从差分高斯金字塔中找点了。

特征点的确定主要包括两个过程:确定潜在特征点,精确确定特征点的位置和去除不稳定特征点。

确定潜在特征点

上文已经阐述,高斯拉普拉斯函数的极大值和极小值点是一种非常稳定的特征点,因此我们从差分高斯金字塔中寻找这些潜在特征点。差分高斯金字塔是一个三维空间(平面图像二维,尺度一维),因此我们在三维空间中在寻找极大值点和极小值点。具体方法是比较当前特征点的灰度值和其他26个点的灰度值的大小,这26个点包括:当前尺度下该点的8邻域以及前一尺度和后一尺度下与该点最近的9个点(9*2+8=26),如下图所示:

OpenCV该部分源码:

[cpp]view plaincopy

尺度空间中的极值点已经确定出来了,下面有两个问题需要解决:

(1)这些点是最终我们确定的SIFT特征点集的超集,该超集里包含许多“间谍”-----不稳定的特征点,因此必须去掉这些不稳定的特征点。这些不稳定的特征点主要包含两类:低对比度的点(对噪声敏感)和边缘点。

基于张量和多尺度特征的多视角人体行为识别解读

基于张量和多尺度特征的多视角人体行为识别 智能视觉监控系统能够从视频图像中分辩、识别出关键目标物体,并能对目标物体的行为进行识别理解,从而提高视频监控系统的智能化水平。随着网络技术和信息技术的高速发展,智能监控技术在模式识别领域受到越来越多的关注,成为近年来热门的研究课题之一。本文对人体行为识别的一些理论问题进行了一定的研究和试验,提出了一种基于张量和多尺度特征的多视角行为识别方法。本文主要的研究内容如下:1.对运动目标进行前景检测,采用背景差分的方法,经过形态学去噪、填补空洞等后处理得到较好的二值图像。2.提出了一种人体骨架建模的方法,通过对人体骨架进行链码遍历以及计算曲率值定位各个关键点,建立的模型用作行为识别的输入特征。3.提取出多尺度特征,包括速度、轮廓宽度、骨架模型的关键点坐标等信息,能够更准确地描述了人在各个运动尺度上的速度与精度,同时通过降低维数节省了运行时间,大大提高了执行效率。4.定义了连续帧张量,其特征空间由连续帧图像构成,从而包含了更多的运动信息,更好地描述了行为特性。5.分别在多视角以及不同执行人的前提下,与聚类识别方法进行了比较分析,从识别率以及执行效率方面比较不同方法的优越性。 同主题文章 [1]. 李妍婷,罗予频,唐光荣. 单目视频中的多视角行为识别方法' [J]. 计算机应用. 2006.(07) [2]. 每言. “行为识别”反垃圾' [J]. 微电脑世界. 2004.(13) [3]. 刘相滨,向坚持,王胜春. 人行为识别与理解研究探讨' [J]. 计算机与现代化. 2004.(12) [4]. 赵智敏,肖胜双. 电视台的CIS设计' [J]. 中国有线电视. 2002.(16) [5]. 胡长勃,冯涛,马颂德,卢汉清. 基于主元分析法的行为识别' [J]. 中国图象图形学报. 2000.(10) [6]. 张三元,孙守迁,蒋方炎,潘云鹤. 数字化仿真人体模型的设计方法' [J]. 系统仿真学报. 2000.(01) [7]. 王运武,陈琳. 多视角下的教育信息化透视' [J]. 开放教育研究. 2008.(03) [8].

尺度换算公式

尺度换算公式: 1丈=10尺 1尺=1/3米0.333··· 1米=0.3丈 1尺=10寸 1寸=10/3厘米3.3333··· 更多换算公式 面积换算 1平方公里(km2)=100公顷(ha)=247.1英亩(acre)=0.386平方英里(mile2) 1平方米(m2)=10.764平方英尺(ft2) 1平方英寸(in2)=6.452平方厘米(cm2) 1公顷(ha)=10000平方米(m2)=2.471英亩(acre) 1英亩(acre)=0.4047公顷(ha)=4.047×10-3平方公里(km2)=4047平方米(m2) 1英亩(acre)=0.4047公顷(ha)=4.047×10-3平方公里(km2)=4047平方米(m2) 1平方英尺(ft2)=0.093平方米(m2) 1平方米(m2)=10.764平方英尺(ft2) 1平方码(yd2)=0.8361平方米(m2) 1平方英里(mile2)=2.590平方公里(km2) 体积换算 1美吉耳(gi)=0.118升(1)1美品脱(pt)=0.473升(1) 1美夸脱(qt)=0.946升(1)1美加仑(gal)=3.785升(1) 1桶(bbl)=0.159立方米(m3)=42美加仑(gal)1英亩·英尺=1234立方米(m3) 1立方英寸(in3)=16.3871立方厘米(cm3)1英加仑(gal)=4.546升(1) 10亿立方英尺(bcf)=2831.7万立方米(m3)1万亿立方英尺(tcf)=283.17亿立方米(m3)1百万立方英尺(MMcf)=2.8317万立方米(m3)1千立方英尺(mcf)=28.317立方米(m3)1立方英尺(ft3)=0.0283立方米(m3)=28.317升(liter) 1立方米(m3)=1000升(liter)=35.315立方英尺(ft3)=6.29桶(bbl) 长度换算 1千米(km)=0.621英里(mile)1米(m)=3.281英尺(ft)=1.094码(yd) 1厘米(cm)=0.394英寸(in)1英寸(in)=2.54厘米(cm) 1海里(n mile)=1.852千米(km)1英寻(fm)=1.829(m) 1码(yd)=3英尺(ft)1杆(rad)=16.5英尺(ft) 1英里(mile)=1.609千米(km)1英尺(ft)=12英寸(in) 1英里(mile)=5280英尺(ft)1海里(n mile)=1.1516英里(mile)

不变特征

不变特征 0引言 图像局部特征的研究已经有很长的历史,早期研究可以追溯到20世纪70年代的Momvec算子。文献中存在大量关于角点、边缘、blob和区域等局部特征的研究方法。近年来区分性强、对多种几何和光度变换具有不变性的局部不变特征在宽基线匹配、特定目标识别、目标类别识别、图像及视频检索、机器人导航、纹理识别和数据挖掘等多个领域内获得广泛的应用,是国内外的研究热点。 局部不变特征是指局部特征的检测或描述对图像的各种变化,例如几何变换、光度变换、卷积变换、视角变化等保持不变。局部不变特征的基本思想是提取图像内容的本质属性特征,这些特征与图像内容的具体表现形式无关或具有自适应性(即表现形式变化时特征提取自适应的变化以描述相同的图像内容)。局部不变特征通常存在一个局部支撑邻域,与经典的图像分割算法不同,局部支撑邻域可能是图像的任何子集,支撑区域的边界不一定对应图像外观(例如颜色或纹理)的变化。 局部不变特征不仅能够在观测条件变化大、遮挡和杂乱干扰的情况下获得可靠的匹配,而且能够有效的描述图像内容进行图像检索或场景、目标识别等。局部不变特征可以克服语义层次图像分割的需要。从复杂背景中分割出前景目标是十分困难的课题,基于低层特征的方法很难实现有意义的分割,把图像内容表示为局部不变区域的集合(多个区域可能存在重合,图像中一些部分也可能不存在局部不变区域),可以回避分割问题。基于局部不变特征的方法本质上是对图像内容进行隐式分割,局部不变特征既可能位于感兴趣的前景目标上也可能位于背景或目标边界上,后续的高层处理需要基于局部不变特征提取感兴趣的信息。 局部不变特征的研究包含3个基本问题:一是局部不变特征的检测,二是局部不变特征的描述,三是局部不变特征的匹配。根据不同的准则,局部不变特征的研究方法可以分为不同的类别,按照使用的色调空间的不同可以分为局部灰度不变特征和局部彩色不变特征;按照特征层次的不同可以分为角点不变特征、blob不变特征和区域不变特征;按照几何变换不变性的自由度可以分为平移不变特征、旋转不变特征、尺度不变特征、欧氏不变特征、相似不变特征、仿射不变特征和投影不变特征;按照处理思路的不同可以分为基于轮廓曲率的不变特征、

基于多尺度和多特征融合的面向对象的变化检测方法

基于多尺度和多特征融合的面向对象的变化检测方法 王文杰,赵忠明,朱文清 中科院遥感应用研究所图像处理部 邮箱中国,北京100101,9718 wangwenjie@https://www.360docs.net/doc/8c14029652.html, 摘要--高分辨率卫星影像为遥感应用提供了丰富的地球表面信息。利用变化检测技术从高分辨率遥感影像中提取目标区域变化并且迅速地更新地图数据库已经成为遥感信息处理研究的焦点。然而传统的变化检测方法并不适用于高分辨率遥感影像。为了克服传统的像素级变化检测方法的局限和高分辨率遥感影像变化检测的困难,本文以面向对象的分析方法为基础呈现了一种新颖的用于检测高分辨率遥感影像变化的多尺度,多特征融合方法。实验结果表明在高分辨率遥感影像变化检测方面这种方法与传统的像素级方法相比有较强的优势。 关键词:面向对象;多尺度分割;光谱特征;纹理特征;形状特征;融合 一简介 由于从环地卫星获取的数据的短间隔重复性覆盖和始终如一的图像质量,变化检测是其主要应用之一[1]。20年来,高分辨率遥感影像变化检测已成为遥感影像处理领域一项重要研究并且已被广泛应用于地理信息系统更新,资源、环境监测,城市规划和国防建设等领域[2]。 目前已经存在各种各样的变化检测方法。图像差分法,主成分分析法,分类后比较法,向量分析法是传统变化检测中最常用的一些方法[3-4]。这些方法被典型地应用于像Landsat TM这样的中等空间分辨

率的卫星影像[5-9]。然而,当涉及高分辨率影像变化检测研究的时候,这些方法就有了一些缺点。 传统的基于像素级的遥感影像变化检测方法主要是建立在光谱信息分析的基础上的。他们共同的特点是仅利用像素值的统计信息而几乎不分析地物的形状特征和结构特征。然而高分辨率遥感影像已经给遥感影像带来了重大变革,它可以清晰地展现景观的结构,纹理和细节信息。除了获得光谱信息之外,它也可以获取表面物体的机构,形状和纹理信息。传统的遥感图像变化检测方法不能真正利用高分辨率遥感影像的优势,因此它不能解决高分辨率遥感影像变化检测的问题。 面向对象的变化检测是变化检测研究新方法的主要内容。面向对象方法的基本特征是分割影像并把对象当做操作的基本单元而不是像传统的面向像素的方法那样把单个像素当做操作的基本单元。通过图像分割获取的对象有一些属性,不仅包含光谱信息还包含纹理,尺寸,形状,密度,环境和其他的从图像中提取的信息。高分辨率遥感影像的面向对象的变化检测方法不再依赖对光谱信息的分析而是靠对对象属性变化的分析来判断变化结果。因此它极大地提高了高分辨率遥感影像变化检测的精度[10-12]。 本文为高分辨率遥感影像提供了一种创新性的基于多尺度和多特征融合的面向对象的变化检测方法。由于对面向对象思维的主要特征的的良好应用,这种新颖的方法能充分利用高分辨率影像的特点并且

统计降尺度方法和Delta方法建立黄河源区气候情景的比较 …

统计降尺度方法和Delta方法建立黄河源区气候情景的比较分析 赵芳芳徐宗学 北京师范大学水科学研究院,水沙科学教育部重点实验室, 北京, 100875 摘要 大气环流模型(GCMs)预测的气候变化情景,必须经降尺度处理得出小尺度上未来气候变化的时空分布资料,才能满足气候变化对资源、环境和社会经济等影响进行评估的需要。文中研究同时应用Delta方法和统计降尺度(SDS)方法对黄河源区的日降水量和日最高、最低气温进行降尺度处理,建立起未来3个时期(2006—2035、2036—2065和2066—2095年,简记为2020s、2050s和2080s)的气候变化情景,并比较分析两种方法的优缺点和适用性。结果表明,未来降水量有一定的增加趋势,但是增幅不大,而日最高、最低气温存在明显的上升趋势,且增幅较大。与基准期相比,Delta方法模拟的未来3个时期降水量将分别增加8.75%、19.70%和18.49%;日最高气温将分别升高1.41、2.42和3.44 ℃,同时,日最低气温将分别升高1.49、2.68和3.76 ℃,未来极值气温变幅减小。SDS法借助站点实测数据和NCEP再分析资料建立GCM强迫条件下的降尺度模型,模拟结果表明,未来3个时期降水量将分别增加3.47%、6.42%和8.67%,季节变化明显;气温随时间推移增幅明显,未来3个时期的日最高气温将分别升高1.34、2.60和3.90 ℃,最低气温增幅相对较小,3个时期将分别升高0.87、1.49和2.27 ℃,由此模拟的未来时期无霜期将延长。在降尺度方法的应用上,SDS方法存在明显的优势,但同时也存在不可避免的缺陷。因此,在实际的气候变化影响评估中,需要多种方法综合比较,以期为决策部门提供参考和依据。 关键词:气候变化,大气环流模型(GCMs),情景,降尺度,黄河。 初稿时间:2006年2月23日;修改稿时间:2006年7月8 作者简介:赵芳芳,主要从事气候变化对水文资源的影响分析研究。 Email: zhfang2003@https://www.360docs.net/doc/8c14029652.html,

尺度不变特征变换(Scale-invariant feature transform,SIFT

SIFT SIFT,即尺度不变特征变换(Scale-invariant feature transform,SIFT),是用于图像处理领域的一种描述。这种描述具有尺度不变性,可在图像中检测出关键点,是一种局部特征描述子。该方法于1999年由David Lowe 首先发表于计算机视觉国际会议(International Conference on Computer Vision,ICCV),2004年再次经David Lowe整理完善后发表于International journal of computer vision(IJCV) 。截止2014年8月,该论文单篇被引次数达25000余次。 算法介绍 SIFT由David Lowe在1999年提出,在2004年加以完善。SIFT在数字图像的特征描述方面当之无愧可称之为最红最火的一种,许多人对SIFT进行了改进,诞生了SIFT的一系列变种。SIFT 已经申请了专利。 SIFT特征是基于物体上的一些局部外观的兴趣点而与影像的大小和旋转无关。对于光线、噪声、微视角改变的容忍度也相当高。基于这些特性,它们是高度显著而且相对容易撷取,在母数庞大的特征数据库中,很容易辨识物体而且鲜有误认。使用SIFT特征描述对于部分物体遮蔽的侦测率也相当高,甚至只需要3个以上的SIFT物体特征就足以计算出位置与方位。在现今的电脑硬件速度下和小型的特征数据库条件下,辨识速度可接近即时运算。SIFT特征的信息量大,适合在海量数据库中快速准确匹配。 算法的特点 SIFT算法具有如下一些特点: 1.SIFT特征是图像的局部特征,其对旋转、尺度缩放、亮度变化保持不变性,对视角变化、仿射变换、噪声也保持一定程度的稳定性; 2. 区分性(Distinctiveness)好,信息量丰富,适用于在海量特征数据库中进行快速、准确的匹配; 3. 多量性,即使少数的几个物体也可以产生大量的SIFT特征向量; 4.高速性,经优化的SIFT匹配算法甚至可以达到实时的要求; 5.可扩展性,可以很方便的与其他形式的特征向量进行联合。 特征检测 SIFT特征检测主要包括以下4个基本步骤: 1尺度空间极值检测:搜索所有尺度上的图像位置。通过高斯微分函数来识别潜在的对于尺度和旋转不变的兴趣点。 2. 关键点定位 在每个候选的位置上,通过一个拟合精细的模型来确定位置和尺度。关键点的选择依据于它们的稳定程度。 3. 方向确定 基于图像局部的梯度方向,分配给每个关键点位置一个或多个方向。所有后面的对图像数据的操作都相对于关键点的方向、尺度和位置进行变换,从而提供对于这些变换的不变性。 4. 关键点描述 在每个关键点周围的邻域内,在选定的尺度上测量图像局部的梯度。这些梯度被变换成一种表示,这种表示允许比较大的局部形状的变形和光照变化。 特征匹配 SIFT特征匹配主要包括2个阶段: 第一阶段:SIFT特征的生成,即从多幅图像中提取对尺度缩放、旋转、亮度变化无关的特征向量。第二阶段:SIFT特征向量的匹配。 SIFT特征的生成一般包括以下几个步骤:

降尺度方法在月预报中的应用研究

第1期 气象水文海洋仪器 No .1 2011年3月  M eteo rological ,Hy drolog ical and M arine Instruments M ar .2011 收稿日期:2010-08-16. 基金项目:国家自然科学基金(40675040)项目资助. 作者简介:王慧娟(1983),女,硕士.主要从事短期区域气候预测研究. 降尺度方法在月预报中的应用研究 王慧娟1,2,3,吴洪星1,3,仵建勋1,3 (1.解放军理工大学气象学院,南京211101;2.294608部队气象台,南京210022;3.空军装备研究院航空气象研究防化研究所,北京100085) 摘 要:月尺度的预报是气象业务中的难点,本文从降尺度的方法出发、介绍了动力学降尺度 方法、统计学降尺度方法以及动力统计降尺度方法。总结了近年来在月尺度预报上的研究成果,并在此基础上提出了有待进一步研究的课题。关键词:降尺度;月预报;动力延伸期 中图分类号:P456.2 文献标识码:A 文章编号:1006-009X (2011)01-0027-05 Application of downscaling method in monthly forecast Wang H uijuan 1,2,3 ,Wu H o ng xing 1,3 ,Chu Jianxun 1,3 (1.Meteorological College ,PL A Univ ersity o f Science and T echnology ,N anj ing 211101;2.Observatory o f No .294608Army ,N an jing 210022;3.I nstitute of Ai r Force Equi pment ,Chemical De f ense I nstitute of Av iation Weather ,Bei jing 100085) A bstract :The mo nthly fo recast is the difficult point in meteo rological o peratio n .Based on the dow nscaling method ,this paper describes three dow nscaling metho ds that are dy namic ,statistical and dy namic -statistical .Then ,the research results o n the monthly fo recast are summ arized ,and the further pro spects in this area are pro po sed . Key words :dow nscaling metho d ;m onthly forecast ;dynamical ex tended rang e forecast 0 引言 统计学方法做气候预测隐含着一个基本假设,即气候系统的未来状况类似于过去和现在,如果预测期间的气候状况发生较大改变就破坏了这种基本假设,就有可能导致预测失败或者是拟合好预报差。所以统计学预报是基于对过去发生气候状况进行拟合从而对未来情境做出预报。动力学方法则是建立在一套大气动力学方程基础之上的。通过动力学方程之间的关系,由初始状态推导出未来的气候情境。统计学的方法主要用于中长期的气候预测,而动力学的方法则是主要用于 短期的天气预报当中。 月预报的时间尺度介于气候预测和天气预报中间,有着统计学和动力学特征。月尺度的短期 气候预测是气候预测或长期预报的下限,又是中期预报的上限,也被称为动力延伸期预报。 1 研究现状 我国的短期气候预测业务开始于1958年,是世界上开展预测业务比较早且一直坚持的少数几个国家之一。近年来,经过8年多的研制和发展,国家气候中心建成了第一代动力气候模式预测业务系统(NCC -GODAS ),并以此为平台,逐步形成

图像处理特征不变算子系列之DoG算子(五)

图像处理特征不变算子系列之DoG算子(五) 时间 2013-09-12 00:24:07 CSDN博客原 文https://www.360docs.net/doc/8c14029652.html,/kezunhai/article/details/11403733 图像处理特征不变算子系列之DoG算子(五) kezunhai@https://www.360docs.net/doc/8c14029652.html, https://www.360docs.net/doc/8c14029652.html,/kezunhai 在前面分别介绍了:图像处理特征不变算子系列之Moravec算子(一)、图像处理特征不变算子系列之Harris算子(二)、图像处理特征不变算子系列之SUSAN算子(三)和图像处理特征不变算子系列之FAST算子(四)。今天我们将介绍另外一个特征检测算子---DoG算子,DoG算子是 由 Lowe D.G. 提出的,对噪声、尺度、仿射变化和旋转等具有很强的鲁棒性,能够提供更丰富的局部特征信息,本文将对DoG算子进行详细地分析。 在开始介绍DoG之前,有必要对尺度空间有一定的了解。尺度空间最早是由Tony Lindeberg提出的,并不断的发展和完善。日常生活中,我们自觉或不自觉的在使用尺度的概念。举个我们个人自觉的经历,当我们读小学的时候,同学间互相询问来自哪个组;当我们读中学的时候,同学们互相询问自哪个村;当我们读高中的时候,同学们互相询问来自哪个镇;当读大学的时候,同学们互相询问来自哪个省?这里的组、村、镇、省就是我们不自觉使用的尺寸。还有一个例子,当我们打开google地图的时候,随着鼠标的滚动,地图会由五大洲逐渐定位到国家--》省---》市---》区---》街道办等,这也是尺度的表现。 1)尺度空间 在尺度空间中,尺度越大图像就越模糊,尺度空间中各尺度图像的模糊程度逐渐变大,能够模拟目标由远及近人对目标的感知过程。那为什么要讨论尺度空间呢?因为在用机器视觉系统分析未知场景时,机器并不知道图像中物体的尺度,只有通过对图像的多尺度描述,才能获得对物体感知的最佳尺度。如果在不同尺度上,对输入的图像都能检测到相同的关键点特征,那么在不同尺度下也可以实现关键点的匹配,从而实现关键点的尺度不变特性。尺度空间描述的就是图像在不同尺度下的描述,如果对尺度空间有兴趣,请参考Tony Lindeberg的论文:Scale-Space。 2)金字塔多分辨率 常常有人会将DoG与图像金字塔弄混,从而导致对SIFT算法第一步构造DoG不甚理解。这里首先介绍下金字塔多分辨率。金字塔是早起图像多尺度的表示形式,图像金字塔一般包括2个步骤,分别是使用低通滤波平滑图像;对图像进行降采样(也即图像缩小为原来的1/4,长宽高缩小为1/2),从而得到一系列尺寸缩小的图像。金字塔的构造如下所示:

基于多尺度特征的目标检测算法研究

哈尔滨工业大学工学硕士学位论文 Abstract Object detection is one of the basic tasks in computer vision, and the efficient target detection algorithm has always been pursued by researchers. From the perspective of multi-scale features in deep learning, we studies multi-feature fusion methods and combines the high-order features with location aware weighted networks. Firstly, we study the multi-feature fusion method based on Faster-RCNN and feature pyramid network (FPN), respectively. It is necessary to study these two methods because the Faster-RCNN based method has only one prediction component while the FPN based method has multiple components. Two multi-layer feature fusion strategies are proposed in this paper and verified on the PASCAL VOC dataset, and effectively improve the accuracy of object detection. In addition to the study on multi-layer feature fusion strategy, we further propose a multi-scale location-aware kernel representation method (MLKP). MLKP proposes an application method of high-order features in the filed of object detection and designs a location aware weighted network and combines them together. The use of high-order features is a feature-enhancing method that can improve the ability of models to detect small objects. By using the statistical information of the target location, the location weighted network can perform weighted operations on the feature map. In the feature map, not all areas will have targets. The location weighted network can enhance the area where the target exists, weaken the area where the target does not exist and achieve the purpose of improving the target detection effect. In the meantime, we study the multi-scale location weighted network and analyze its advantages and disadvantages. Finally, the MLKP is validated on two types of published datasets: PASCAL VOC and MS COCO, and has achieved the best current results. Keywords: object detection, multi-scale feature, multi-feature fusion, high-order feature, location-aware network - II -

尺度不变特征

SIFT特征分析与源码解读 分类:机器视觉与模式识别2013-11-19 22:28 10人阅读评论(0) 收藏举报 目录(?)[+] SIFT(Scale-invariant feature transform)是一种检测局部特征的算法,该算法通过求一幅图中的特征点(interest points,or corner points)及其有关scale 和orientation 的描述子得到特征并进行图像特征点匹配,获得了良好效果,详细解析如下: 算法描述 SIFT特征不只具有尺度不变性,即使改变旋转角度,图像亮度或拍摄视角,仍然能够得到好的检测效果。整个算法分为以下几个部分:1. 构建尺度空间 这是一个初始化操作,尺度空间理论目的是模拟图像数据的多尺度特征。 高斯卷积核是实现尺度变换的唯一线性核,于是一副二维图像的尺度空间定义为: 其中G(x,y,σ) 是尺度可变高斯函数 (x,y)是空间坐标,是尺度坐标。σ大小决定图像的平滑程度,大尺度对应图像的概貌特征,小尺度对应图像的细节特征。大的σ值对应粗糙尺度(低分辨率),反之,对应精细尺度(高分辨率)。为了有效的在尺度空间检测到稳定的关键点,提出了高斯差分尺度空间(DOG scale-space)。利用不同尺度的高斯差分核与图像卷积生成。 下图所示不同σ下图像尺度空间: 关于尺度空间的理解说明:2kσ中的2是必须的,尺度空间是连续的。在 Lowe的论文中,将第0层的初始尺度定为1.6(最模糊),图片的初始尺度定为0.5(最清晰). 在检测极值点前对原始图像的高斯平滑以致图像丢失高频信息,所以Lowe 建议在建立尺度空间前首先对原始图像长宽扩展一倍,以保留原始图像信息,增加特征点数量。尺度越大图像越模糊。

空间数据的多尺度表达研究

第25卷 第4期2006年8月兰州交通大学学报(自然科学版) Journal of Lanzhou Jiaotong University(Natural Sciences) Vol.25No.4 Aug.2006 文章编号:1001Ο4373(2006)04Ο0035Ο04 空间数据的多尺度表达研究 胡 最, 闫浩文 (兰州交通大学数理与软件工程学院,甘肃兰州 730070) 摘 要:多尺度是空间数据的重要特征之一,研究空间数据在不同尺度条件下的表达特征和方式具有极其重要的现实意义.在参考相关资料和同类研究的基础上,阐述了空间数据多尺度表达的特征和数据模型以及表达中可能出现的问题,并给出了试验结果. 关键词:空间数据;多尺度;特征;数据模型 中图分类号:P208 文献标识码:A 0 引言 GIS系统最主要的功能是能够为辅助决策提供依据,而这是建立在GIS的空间分析的基础之上的.所以,提供多种尺度的空间数据是GIS系统的重要功能之一.而要达到这一目的,就涉及到空间数据库的多重表达问题,或者说空间数据的多尺度表达问题.空间数据的多重表达问题由来已久,早在1988年,美国地理信息和分析国家中心(NC GIA)就提出了数据库多重表达的概念.按照NC GIA的定义,数据库多重表达是指“随着在计算机内存储、分析和描述的地理客体的分辨率(比例尺)的不同,所产生和维护的同一地理客体在几何、拓扑结构和属性方面的不同数字表达形式.”就是说,具备“多重表达”机制的GIS能够以不同分辨率或比例尺的“数据集”的方式来表达其数据库内容.因此,又被称为“多重表达数据库(Multiple Representation Data2 base)”.以多重表达数据库为核心的GIS可以被称作“多比例尺(尺度)GIS”. 1 空间数据的多尺度特征 1.1 尺度(Scale)的概念 广义地讲尺度是指在研究某一物体或现象时所采用的空间或时间单位,也可指某一现象或过程在空间和时间上所涉及的范围和发生频率.所以,一般可以将尺度区分为空间尺度和时间尺度.而在地理现象的研究中,通常用到的尺度主要有概念尺度性、量纲多尺度和内容多尺度;在地理信息系统的研究中,又可以将尺度简单地理解为分辨率或者比例尺,或者也可以叫做“粒度”. 1.2 空间数据的多尺度特征 尺度是空间数据的重要特征,是指数据表达的空间范围的相对大小和时间的相对长短.所以,不同尺度所表达的信息密度有很大的差异.一般而言,尺度增大时所表达的信息密度减少,但并不是呈简单的比例变化.根据不同层次和不同领域的用户对GIS的要求和使用的不同,空间数据在不同的尺度条件下展现如下特征: 1)同一地物在不同的尺度条件下可以表现为不同的几何外形.这是因为尺度不同,对地物的抽象和化简的程度也不尽相同.如图1所示,以居民地为例,图1中的地物,在比例尺为1∶500时,是一个复杂的多边形;当比例尺变化为1∶1万时,可以简化为一个简单多边形;而在更小比例尺条件下,当变为1∶50万时,居民地就通常被抽象表示为一个简单的点 . 图1 不同尺度下同一地物的不同外形 Fig.1 S am e objects in different sh ap es at different scales 收稿日期:2005Ο10Ο31 基金项目:国家自然科学基金资助(40301037) 作者简介:胡 最(1977Ο),男,湖南宁乡人,硕士生.

对尺度和尺度转换的理解

对尺度和尺度转换的理解 摘要:尺度是对地理现象观察、度量的标准之一,是空间数据采集、建模、分析的重要依据,是空间数据的重要特征。本文首先对尺度和尺度转换概念进行了剖析,然后对其重要性进行归纳总结。结合实际应用的需要,尺度转换通常会根据具体的情况采用不同的类型,即尺度效应的存在,对同一过程采用不同的观测尺度会得出不同的结果。于是对尺度转换常用类型,尺度选择和尺度效应进行了分析。最后,对尺度和尺度转换中存在的一些问题进行了总结。 关键词:尺度;尺度转换;尺度效应 1.前言: 由于地理空间非常复杂,人们不可能观察到现实地理世界的所有细节,因此地理信息对地表的描述总是近似的,而这个近似的程度如何则反映了对地理现象及过程的抽象的程度或者抽象尺度。因此尺度是所有地理信息的基本、重要特征,不同的尺度所表达的信息是有很大差异的。尺度问题已经被UCGIS列在地理信息科学未来研究的十大优先领域。Haggett也指出地理学研究中必须解决与尺度相关的三个问题,即:尺度覆盖,尺度关联以及尺度标准。很多学者在多个研究领域对尺度问题进行了研究[1-12],如遥感科学,地图学,空间统计学,生态学,地理信息科学等。 基于此,对尺度和尺度转换概念的正确理解是至关重要和迫切的。 2.尺度与尺度转换 2.1 尺度的概念 尺度是指在研究某一物体或现象时所采用的空间或时间单位,又可指某一现象或过程在空间和时间上所涉及到的范围和发生的频率。即尺度通常有时间和空间两方面的含义,同时尺度往往以粒度和幅度来表达。空间粒度指最小可辨识单元所代表的特征长度、面积或体积(如像元);时间粒度指某一现象或事件发生的(或取样的)频率和时间间隔。幅度是指研究对象在空间或时间上的持续范围或长度。具体来说,所研究对象的范围决定该研究的空间幅度;而研究项目持续多久,则确定其时间幅度[24]。Thompson早在1917年就指出,“尺度的影响,不仅仅是尺度本身,而是与其周围的环境紧密联系”。尺度一词的含义比较复杂,在不同学科领域,同一术语如Scale 表达了不同的含义如表1所示: 表1 尺度在不同学科下的概念[15]

气象资料的统计降尺度方法综述

第26卷第8期2011年8月 地球科学进展 ADVANCES IN EARTH SCIENCE Vol.26No.8 Aug.,2011 文章编号:1001-8166(2011)08-0837-11 气象资料的统计降尺度方法综述? 刘永和1,郭维栋2,冯锦明3,张可欣4 (1.河南理工大学资源环境学院,河南焦作454000;2.南京大学气候与全球变化研究院,大气科学学院,江苏南京210093;3.中国科学院东亚区域气候—环境重点实验室,全球变化东亚区域研究中心,中国科学院大气物理研究所,北京100029; 4.山东省临沂市气象局,山东临沂276004) 摘要:统计降尺度是解决由气象模式输出的低分辨率资料到流域尺度资料转换的手段之一,已成为一个重要的研究领域。统计降尺度方法十分丰富,分为传递函数法、天气形势法和天气发生器3类,3类之间并无严格的界限。统计降尺度涉及到时间与空间降尺度、随机型与确定型降尺度、时间自相关与空间相关性以及面向格点与面向站点的降尺度这4个方面的属性与分类问题,各种具体方法在这些方面的表现有所不同。近年来,相似法、隐马尓可夫模型、广义线性模型、Poisson点过程以及乘性瀑布过程获得了较大的发展和应用,并诞生了各种非线性模型以及物理—统计模型等新方法,已有一些影响较大的统计降尺度模型软件。新的方法在不断涌现,其中非线性模型、气候情境随机模拟技术、短期预报资料降尺度技术以及结合物理机理的统计降尺度方法是未来的主要发展趋势。 关键词:统计降尺度;天气发生器;天气分类;传递函数;非线性模型 中图分类号:P432+.1文献标志码:A 全球气候模式(GCM)能够较好地模拟出未来的气候变化情境,是预估未来全球气候变化的最重要工具。然而GCM输出的空间分辨率较低,不能反映流域尺度的精确气候特点和区域内部的气候差异。在流域水资源状况的未来预测预警研究中,尤其是在借助分布式水文模型模拟时,需要较高分辨率的降水以及其他用于估算蒸散发量的变量信息,但GCM的输出不能很好地满足这个需求。同样,在短期天气预报方面,数值预报模式能够输出一周左右的可靠天气预报,但空间分辨率仍为0.5? 1?,不能体现更小尺度上的天气状况差异,这也难以满足使用这些预报资料进行分布式水文预报的需求。有3种方法可以弥补这个不足,一是发展更高分辨率的GCM或天气预报模式,二是借助区域气候模式(Regional Climate Model),三是发展统计降尺度技术。而GCM及天气预报模式计算量较大,对分辨率提高潜力有限,因此后面2种方法更为有效。使用区域模式即动力降尺度方法,可以内嵌入全球模式,或者利用全球模式的输出作为边界条件单独运行。动力降尺度具有物理意义明确、不受观测资料影响和面向覆盖区域的所有格点等很多优点,但它计算量大,模拟和配置不便。统计降尺度与动力降尺度方法相比,缺点在于模型缺少物理机理,受训练模型的观测资料影响较大,且一般难以获得区域中空间上连续的结果,但它具有以下优点:一是计算量小得多,二是模型相对易于构造,三是方法众多,形式灵 ?收稿日期:2011-02-14;修回日期:2011-04-14. *基金项目:国家自然科学基金项目“汶川巨震对降水过程激发机制的初步控制”(编号:40975049);国家自然科学基金重大国际(地区)合作研究项目“亚洲和北美半干旱区大气—植被—水相互作用的比较研究”(编号:40810059003);淮河流域气象开放研究基 金项目“沂沭河流域暴雨洪水预警及灾害评估业务化技术”(编号:HRM200904)资助. 作者简介:刘永和(1976-),男,内蒙古卓资人,讲师,主要从事统计降尺度、分布式水文模型以及地球信息科学研究. E-mail:sucksis@163.com

尺度不变的额特征提取代码

function [ pos, scale, orient, desc ] = SIFT( im, octaves, intervals, object_mask, contrast_threshold, curvature_threshold, interactive ) % 功能:提取灰度图像的尺度不变特征(SIFT特征) % 输入: % im - 灰度图像,该图像的灰度值在0到1之间(注意:应首先对输入图像的灰度值进行归一化处理) % octaves - 金字塔的组数:octaves (默认值为4). % intervals - 该输入参数决定每组金字塔的层数(默认值为2). % object_mask - 确定图像中尺度不变特征点的搜索区域,如果没有特别指出,则算法将搜索整个图像 % contrast_threshold - 对比度阈值(默认值为0.03). % curvature_threshold - 曲率阈值(默认值为10.0). % interactive - 函数运行显示标志,将其设定为1,则显示算法运行时间和过程的相关信息;% 如果将其设定为2,则仅显示最终运行记过(default = 1). % 输出: % pos - Nx2 矩阵,每一行包括尺度不变特征点的坐标(x,y) % scale - Nx3 矩阵,每一行包括尺度不变特征点的尺度信息(第一列是尺度不变特征点所在的组, % 第二列是其所在的层, 第三列是尺度不变特征点的sigma). % orient - Nx1 向量,每个元素是特征点的主方向,其范围在[-pi,pi)之间. % desc - Nx128 矩阵,每一行包含特征点的特征向量. % 参考文献: % [1] David G. Lowe, "Distinctive Image Features from Sacle-Invariant Keypoints", % accepted for publicatoin in the International Journal of Computer % Vision, 2004. % [2] David G. Lowe, "Object Recognition from Local Scale-Invariant Features", % Proc. of the International Conference on Computer Vision, Corfu, % September 1999. % % Xiaochuan ZHAO;zhaoxch@https://www.360docs.net/doc/8c14029652.html, % 设定输入量的默认值 if ~exist('octaves') octaves = 4; end if ~exist('intervals') intervals = 2; end if ~exist('object_mask') object_mask = ones(size(im)); end if size(object_mask) ~= size(im)

结合尺度不变特征的Super 4PCS点云配准方法

第34卷第5期2019年10月 遥感信息 Remote Sensing Information Vol.34,No.5 Oct.,2019 结合尺度不变特征的Super4PCS点云配准方法 鲁铁定3,袁志聪i,郑坤i (1.东华理工大学,南昌330013;2,流域生态与地理环境监测国家测绘地理信息局重点实验室,南昌330013) 摘要:点云配准是三维模型重建中的关键步骤。针对传统初配准方法效率低等问题,提出一种结合点云特征的超四点快速鲁棒匹配算法(super four point fast robust matching algorithm,Super4PCS)。首先对点云数据进行尺度不变特征提取,凸显点云的局部特征;然后把提取的特征点作为Super4PCS算法的初始值,以便实现源点云与目标点云的初配准;最后在初配准的基础上利用最近点迭代(ICP)算法进行精确配准。通过斯坦福兔子点云及实测点云数据对比分析,表明该算法具有更好的配准性能。 关键词:点云配准;尺度不变特征;特征点;超四点快速鲁棒匹配算法;ICP算法 doi:10.3969/j.issn.1000-3177.2019.05.005 中图分类号:P232文献标志码:A文章编号:1000-3177(2019)165-0015-06 Super4PCS Point Cloud Registration Algorithm Combining Scale Invariant Features LU Tieding1'2,YUAN Zhicong1,ZHENG Kun1 (1.East China University of Science and Technology,Nanchang330013t China; 2.Key Laboratory Watershed Ecology and Geographical Environment Monitoring, National Administration of Surveying^Mapping and Geoinformation,Nanchang3300131China} Abstract:Point cloud registration is the key step in3D model reconstruction.In view of the low efficiency of the traditional initial registration methods,a super four point fast robust matching algorithm(Super4PCS)is proposed,which combines the feature of point cloud.Firstly,scale-invariant feature extraction is performed,to highlight the local features of the point cloud. Then,the extracted feature points are used as the initial values of the Super4PCS algorithm so as to realize initial registration between the source and the target point cloud?Finally,the closest point iteration(ICP)algorithm is used for accurate registration on the basis of the initial registration.By comparing and analyzing Stanford rabbit point cloud and measured point cloud data,the results show that the proposed algorithm has better registration performance. Key words:point cloud registration;scale invariant feature;feature point;Super4PCS;ICP algorithm 0引言 随着三维激光扫描技术的快速发展,三维重建技术的应用越来越广泛。点云配准是三维模型重建中的关键环节,点云配准按配准步骤可分为初配准和精配准初配准能够很大程度上减小两点云的旋转和平移错位,为精配准提供一个好的初始位置,提高配准精度和效率。常用的初配准□切方法有主成分分析法、标签法、中心重合法、4PCS算法3等。精配准是在初配准的基础上对点云进行精确配准,使两点云尽可能地重合,即两点云的距离之和最小。应用最广的精配准方法是由Besl和Mkcya提出的最近点迭代金门(ICP)算法。 近年来,Nicolas Mellado等田切提出的Super 收稿日期:2018-04-28修订日期:2019-07-17 基金项目:国家自然科学基金(41464001);国家重点研发计划(2016YFB0501405);国家重点研发计划(2016YFB0502601-04);江西省自然科学基金(2017BAB203032)。 作者简介:鲁铁定(1974—),男,教授,主要研究方向为测绘数据处理。 E-mail:tdlu@https://www.360docs.net/doc/8c14029652.html, 15

相关文档
最新文档