颜色矩和颜色直方图基本概念笔记

颜色矩和颜色直方图基本概念笔记

∑==N j ij i P N 11μ颜色矩和颜色直方图基本概念笔记

1颜色矩

颜色矩是以数学方法为基础的,通过计算矩来描述颜色的分布。 通常直接在RGB 空间计算。其颜色分布的前三阶矩表示为:

2 颜色直方图

设一幅图像包含M 个像素,图像的颜色空间被量化成N 个不同颜色。颜色直方图H 定义为:

i i h p =

h i 为第i 种颜色在整幅图像中具有的像素数。

归一化为: p i =h i/M

由于RGB 颜色空间与人的视觉不一致,可将RGB 空间转换到视觉一致性空间。除了转换到前面提及的HSI 空间外,还可以采用一种更简单的颜色空间:

其中max=255。

彩色图像变换成灰度图像的公式为:

g=(R+G+B)/3

其中R,G,B 为彩色图像的三个分量,g 为转换后的灰度值。

∑=-=N j i ij i P N 1212])(1[μσ∑=-=N j i ij i P N

1313])(1[μσ

图像颜色特征提取基本知识

一、颜色特征 1 颜色空间 1.1 RGB 颜色空间 是一种根据人眼对不同波长的红、绿、蓝光做出锥状体细胞的敏感度描述的基础彩色模式,R、 G、B 分别为图像红、绿、蓝的亮度值,大小限定在 0~1 或者在 0~255。 1.2 HIS 颜色空间 是指颜色的色调、亮度和饱和度,H表示色调,描述颜色的属性,如黄、红、绿,用角度 0~360度来表示;S 是饱和度,即纯色程度的量度,反映彩色的浓淡,如深红、浅红,大小限定在 0~1;I 是亮度,反映可见光对人眼刺激的程度,它表征彩色各波长的总能量,大小限定在 0~1。1.3 HSV 颜色模型 HSV 颜色模型依据人类对于色泽、明暗和色调的直观感觉来定义颜色, 其中H (Hue)代表色度, S (Saturat i on)代表色饱和度,V (V alue)代表亮度, 该颜色系统比RGB 系统更接近于人们的经验和对彩色的感知, 因而被广泛应用于计算机视觉领域。 已知RGB 颜色模型, 令M A X = max {R , G, B },M IN =m in{R , G,B }, 分别为RGB 颜色模型中R、 G、 B 三分量的最大和最小值, RGB 颜色模型到HSV 颜色模型的转换公式为: S =(M A X - M IN)/M A X H = 60*(G- B)/(M A X - M IN) R = M A X 120+ 60*(B – R)/(M A X - M IN) G= M A X 240+ 60*(R – G)/(M A X - M IN) B = M A X V = M A X 2 颜色特征提取算法 2.1 一般直方图法

基于颜色直方图的图像检索(实验分析)

基于颜色直方图的图像检索 作者:吴亚平学号:200812017081203009 1.概述 在过去的十几年间,有许多知名机构都对图像检索系统进行了深入的研究,病开发出了相应的检索系统,例如IBM Almaden研究中心研制的QBIC系统,Virage公司研发的VIRAGE系统,麻省理工大学多媒体实验室研发的Photobook系统,哥伦比亚大学研发的VisualSeek系统,斯坦福大学研发的WBIIS系统,U.C.伯克利分校研发的Blobworld系统等等。 这些检索系统的基本特征都是基于图像像素值的特征提取相应的规则图像,例如形状、颜色、纹理等,并以此为依据对图像进行比较检索,在这篇论文中,系统采用了基于颜色特征提取的检索。基于直方图在两个颜色空间对图像特征进行判定检索。这两个颜色空间是RGB和HSV。通过对两副图像对应的RGB和HSV 值计算其距离,依据距离的远近来判断相似性,这种方法简单易行,由于丢弃了图像的形状、颜色、纹理等信息,判定的计算量相对较小。当然这也导致了两副图像之间的判定没有实际的语义上的关联,也就是说,距离相近的图像并不一定有事实上的相应联系。但是,经过试验的判定,这种基于直方图的图像检索系统能够为图片检索提供相对精确的检索结果。 2.相关知识 2.1. RGB颜色空间 RGB颜色模型中每种颜色都是由红绿蓝三种颜色组成。这种颜色模型在许多CRT显示器和彩色光栅图形设备中被广泛使用。这三种颜色被认为是其他颜色的

添加剂,对于所需要的颜色通过对这三种颜色进行不同的比例进行相加即可得到。RGB模型可以用如下的颜色坐标系表示。注意从(0,0,0)到(1,1,1)的对角线,白色代表了灰阶,RGB色彩模式俯视从白色开始的。 2.2. HSV颜色空间(也称HIS颜色空间) HSV字母分别代表了色度(Hue),饱和度(Saturation),色调。上面的锥形图说明HSV的颜色模型。Value代表了颜色的强度,他是从图像信息中分离出来,可以表示相关信息的部分。色度和饱和度代表了颜色在人眼中的生理特征。色度与红色等颜色从0到1的表示不同,色度是从红色通过黄,绿,青,蓝,洋红色,再回到红色。饱和度的区分是从0 到 1,他通过值大小来影响颜色的饱和度。对于色调,也是从0到1,随着他的增大,图像的颜色就会越来越亮。

关于颜色的几个算法

?流行色算法 流行色算法的基本思路是:对彩色图像中所有彩色出现的次数做统计分析,创建一个数组用于表示颜色和颜色出现频率的统计直方图。按出现频率递减的次序对该直方图数组排序后,直方图中的前256 种颜色就是图像中出现次放最多(频率最大) 的256 种颜色,将它们作为调色板的颜色。该算法用统计直方图来分析颜色出现的频率,因此且称为彩色直方图统计算法。图像中其他的颜色采用在RGB 颜色空间中的最小距离原则映射到与其邻近的256种调色板颜色上。流行色算法实现较简单,对颜色数量较小的图像可以产生较好的结果,但是该算法存在的主要缺陷是,图像中一些出现频率较低,但对人眼的视觉效挺明显的信息将丢失。比如,图像中存在的高亮度斑点,由于出现的次数少,很可能不能被算法选中,将被丢失。 ?中位切分算法 中位切分算法的基本思路是:在RGB 彩色空间中,R 、G 、B 三基色对所对应于空间的三个坐标轴,将每坐标轴部量化为0 - 255 。对应于最暗(黑) ,255 对应于最亮,这样就形成了一个边长为256 的彩色立方体。所有可能的颜色都对与立方体内的一个点; 将彩色方体切分成256个小立方体,每个立方体中都包含相同数量的在图像中出现的颜色点;取出每个小立方体的中心点,则这些点所表示的颜色就是我们所需要的最能代表图像颜色特征的256 种颜色。中位切分算法是PauJ Heckbert在80 年代初提出来的,现被广泛应用于图像处理领域。该算法的缺点是涉及复杂的排序工作,而且内存开销较大。 ?八叉树算法 1988 年,奥地利的M. Gervautz和W. Purgathofer 发表了一篇题为"A Simple Method for Color Quantization: Octree Quantization" 的论文,提出了种新的采用八义树数据结构的颜色量化算法,一般称为八叉树颜色量化算法。该算法的效率比中位切分算法高而且内存开销小。 八叉树颜色量化算法的基本思路是:将图像中使用的RGB 颜色值分布到层状的八叉树中。八叉树的深度可达九层,即根节点层加上分别表示8位的R、G 、B 值的每一位的八层节点。较低的节点层对应于较不重要的RGB 值的位(右边的位) ,因此,为了提高效率和节省内存,可以去掉最低部的2 ~ 3 层,这样不会对结果有太大的影响。叶节点编码存储像素的个数和R 、G 、B 颜色分量的值;而中间的节点组成了从最顶层到叶节点的路径。这是一种高效的存储方式,既可以存储图像中出现的颜色和其出现的次数,也不会浪费内存来存储图像中不出现的颜色。 扫描图像的所有像素,每遇到种新的颜色就将它放入八叉树中,并创建一个叶节点。图像扫描完后,如果叶子节点的数量大于调色板所需的颜色数时,就需要将有些叶子节点合并到其上一层节点中,并将该节点转化成叶节点,在其中存储颜色且其出现的次数。这样,减少叶节点的数量,直到叶节点的数量等于或小于调色板所需的颜色数。如果叶节点的数量小于或等于调色板所需的颜色数,则可以遍历八叉树,将叶子节点的颜色填入调色饭的颜色表

图像的直方图是图像的重要统计特征

图像的直方图是图像的重要统计特征,它可以认为是图像灰度密度函数的近似。直方图虽然不能直接反映出图像内容,但对它进行分析可以得出图像的一些有用特征,这些特征能反映出图像的特点。当图像对比度较小时,它的灰度直方图只在灰度轴上较小的一段区间上非零,较暗的图像由于较多的像素灰度值低,因此它的直方图的主体出现在低值灰度区间上,其在高值灰度区间上的幅度较小或为零,而较亮的图像情况正好相反。通常一幅均匀量化的自然图像的灰度直方图在低值灰度区间上频率较大,这样的图像较暗区域中的细节常常看不清楚。为使图像变清晰,可以通过变换使图像的灰度动态范围变大,并且让灰度频率较小的灰度级经变换后,其频率变得大一些,使变换后的图像灰度直方图在较大的动态范围内趋于均化。事实证明,通过图像直方图修改进行图像增强是一种有效的方法。 均匀量化的自然图像的灰度直方图通常在低值灰度区间上频率较大,使得图像中较暗区域中的细节常常看不清楚。为了使图像清晰,可将图像的灰度范围拉开,并且让灰度频率较小的灰度级变大,即让灰度直方图在较大的动态范围内趋于一致。 前面介绍的直方图均衡化处理方法从实验效果看还是很不错的,从实现算法上也可以看出其优点主要在于能自动整幅图像的对比度,但具体的增强效果也因此不易控制,只能得到全局均衡化处理的直方图。在科研和工程应用中往往要根据不同的要求得到特定形状的直方图分布以有选择的对某灰度范围进行局部的对比度增强,此时可以采用对直方图的规定化处理,通过选择合适的规定化函数取得期望的效果。 a=imread('花.jpg'); subplot(2,2,1); imshow(a); title('原始图像'); subplot(2,2,2); a=rgb2gray(a); imhist(a); title('原始图像直方图'); subplot(2,2,3);

10.2 直方图(理解频数分布直方图的特点及与其他描述方法的关系)

10.2直方图 一、教学目标 (一)教学知识点 1.了解认识频数分布直方图及相关概念. 2.解读频数分布直方图. 3.理解频数分布直方图的特点及与其他描述方法的关系.毛 (二)能力训练要求 1.通过观察、思考等数学活动,提高合理思维、推理能力. 2.通过比较、概括,提高归纳总结能力. (三)情感与价值观要求 1.积极参与各项活动,提高学习数学的兴趣. 2.养成独立思考的习惯及培养实事求是的态度. 二、教学重点 1.认识频数分布直方图及相关概念. 2.掌握几种统计图形的特点. 三、教学难点 区分直方图与条形图. 四、教学方法 自主合作─探究归纳. 五、教学过程 Ⅰ.提出问题,创设情境 为了研究800米赛跑后学生心率的分布情况,?体育老师统计了全班同学一分钟时间脉搏的次数. 可是如何处理这些数据?用什么样的方法描述才能更好地显示学生心率分布情况呢? Ⅱ.导入新课 我们先看体育老师是怎么做的. 他把全班学生的脉搏次数按范围分成8组,每组的两个端点的差都是5,这样就得出这样一个表格: 脉搏次数x(次/分)频数(学生人数) 130≤x<135 1 135≤x<140 2 140≤x<145 4 145≤x<150 6 150≤x<155 9 155≤x<160 14 160≤x<165 11 165≤x<170 2 从表上可以清楚地看出脉搏次数在不同范围的学生人数. 为了直观地描述表中的数据,体育老师用坐标系横轴表示脉搏次数,标出每组的两个端点,纵轴表示频数(学生人数),每个矩形的高表示对应组的频数.如图:

我们从体育老师描述这组数据的过程可以看出,他首先把全班学生的脉搏次数按范围分成8组,每组的两个端点的差都是5,这是为什么呢?不这样做行吗? [生]因为对这组数据的统计是为了研究800米赛跑后学生心率的分布情况,?要想知道学生脉搏次数在各个范围的分布状况,我们可以按实际需要分成若干组,但每组的两个端点差都应该一样,这样才能用落在各组中的学生人数即频数来准确描述数据的分布情况. 如果想用矩形的高表示频数,就必须这样做,否则是不能反映数据分布情况的. [师]好!这个同学分析得有道理. 我们在统计学中把分成的组的个数称为组数,每组两个端点的差称为组矩,如上表称为频数分布表.像上图那样用矩形高代表对应组频数的统计图称为频数分布直方图. 再思考一个问题:直方图中各个矩形之间为什么没有空隙呢? [生]因为在分组时,各组之间范围的端点数是连续的,而矩形的宽表示的就是组距,所以直方图各矩形之间没有空隙. [师]说得不错,这说明大家都动了脑筋了.在学习过程中就要不断地发现为什么,解决为什么? 其实直方图实际上是用矩形面积表示频数的.当矩形的宽相等时,可以用矩形的高表示频数. 这又出现了新问题,如果用矩形的面积表示频数的话,那么矩形的高又表示什么呢? [生]这个很简单呀!既然面积表示频数,宽表示组距,那么根据矩形面积公式,面积=高×宽,所以高则表示面积与宽的比值,即频数与组距的比值. [师]正确!有关这些知识我们将在以后的统计学中逐步学到.现在请同学们认真观察上面体育老师画的直方图,回答下列问题: 1.脉搏次数x在_________范围的学生最多,有________个. 2.脉搏次数x在135≤x<140范围的学生有________个. 3.脉搏次数x在150≤x<155范围的学生比在160≤x<165?范围的学生多还是少? 4.全班一共有________学生. [生]根据表与图可以看出: 1.脉搏次数x在155≤x<160范围的学生最多,有14个. 2.脉搏次数x在135≤x<140范围的学生有2个. 3.脉搏次数x在150≤x<155范围的学生比在160≤x<165范围的学生少.4.全班一共有1+2+4+6+9+14+11+2=49个学生.

直方图均衡化计算

直方图均衡化(色调均化) “图像(Image)>调整(Adjust)”菜单的功能 色调均化(Equalize) Photoshop菜单:图像>调整>色调均化 公式: (公式中Sk表示均衡化后的灰度值,∑表示总和,nj是原图中某个灰度色阶j 的像素数量,j的范围是0~k,N是图像像素总数。) “色调均化”命令重新分布图像中像素的亮度值,以便它们更均匀地呈现所有范围的亮度级。使用此命令时,Photoshop尝试对图像进行直方图均衡化(Histogram Equalization),即在整个灰度范围中均匀分布每个色阶的灰度值。 当扫描的图像显得比原稿暗,而您想平衡这些值以产生较亮的图像时,可以使用“色调均化”命令。配合使用“色调均化”命令和“直方图”命令,可以看到亮度的前后比较。 使用“色调均化”命令: 1. 选择菜单图像>调整>色调均化。 2. 如果已选择一个图像区域,在弹出的对话框中选择要均化的内容,然后点按“好”。

?“仅色调均化所选区域”只均匀地分布选区的像素。 ?“基于所选区域色调均化整个图像”基于选区中的像素均匀分布所有图像的像素。 原理 直方图均衡化是一种灰度变换算法,所以我们重点研究灰度图像的直方图均衡化。 绝对的均匀 图A是一个黑白灰均匀渐变,0~255的每一个色阶的灰度数量都是相同的。图B 的是图A的像素打乱了顺序随机分布的,每种灰度的数量都与图A的相同,因而它的直方图也与图A的相同。 图A和图B的直方图。每种灰度数量是相同的,直方图呈一个黑色矩形。 近似的均匀 对于一般的图像,由于每种灰度的像素数量并不相同,我们没办法把每种灰度的分量调得像图A、B那么均匀,但是可以做到近似的均匀。也就是说,把直方图横向平均分成几份之后,使每一份的像素数量大致相等。 下面是一幅图片的直方图,共有19200个像素,从左到右平均分成三份。均衡化之后,每份的像素数量都在6400左右。

颜色直方图的计算、显示、处理、对比及反向投影

颜色直方图的计算、显示、处理、对比及反向投影(How to Use Histogram? Calculate, Show, Process, Compare and BackProject) 作者:王先荣 前言 颜色直方图直观的显示了图像在色彩空间的分布状况,本文将讨论在EmguCv及OpenCv中跟直方图相关的一些基本操作,包括:计算、显示、处理、对比及反向投影,并谈谈在实践过程中得到的一些经验。如无特别说明,下文所提的直方图均指颜色直方图。 直方图的计算 EmguCv将OpenCv的一系列直方图函数封装到了类DenseHistogram里面,可以用方法Calculate方便的计算图像的直方图。不过值得注意的是,该方法接受的第一个参 数是“单通道”图像数组;而一般情况下的图像都是3通道的,在计算之前我们需要用Image.Split方法将其分解成单通道图像,然后选择需要参与直方图计算的通道。下面有几段计算直方图的代码,分别计算单通道(红色)直方图、色调和饱和度直方图。 计算直方图 ///

///计算直方图(红色) /// private void CalcHistRed() { //计算 int rBins = 256; RangeF rRange = new RangeF(0f, 255f); Image imageSource = new Image((Bitmap)pbSource.Image); Image imageRed = imageSource.Split() [2]; DenseHistogram hist = new DenseHistogram(rBins, rRange);

颜色直方图

颜色直方图, HSV直方图, histogram bins 颜色特征是在图像检索中应用最为广泛的视觉特征,主要原因在于颜色往往和图像中所包含的物体或场景十分相关。此外,与其他的视觉特征相比,颜色特征对图像本身的尺寸、方向、视角的依赖性较小,从而具有较高的鲁棒性。 面向图像检索的颜色特征的表达涉及到若干问题。首先,我们需要选择合适的颜色空间来描述颜色特征;其次,我们要采用一定的量化方法将颜色特征表达为向量的形式;最后,还要定义一种相似度(距离)标准用来衡量图像之间在颜色上的相似性。在本节中,我们将主要讨论前两个问题,并介绍颜色直方图、颜色矩、颜色集、颜色聚合向量以及颜色相关图等颜色特征的表示方法。 1 颜色直方图 颜色直方图是在许多图像检索系统中被广泛采用的颜色特征。它所描述的是不同色彩在整幅图像中所占的比例,而并不关心每种色彩所处的空间位置,即无法描述图像中的对象或物体。颜色直方图特别适于描述那些难以进行自动分割的图像。 当然,颜色直方图可以是基于不同的颜色空间和坐标系。最常用的颜色空间是RGB颜色空间,原因在于大部分的数字图像都是用这种颜色空间表达的。然而,RGB空间结构并不符合人们对颜色相似性的主观判断。因此,有人提出了基于HSV空间、Luv空间和Lab空间的颜色直方图,因为它们更接近于人们对颜色的主观认识。其中HSV空间是直方图最常用的颜色空间。它的三个分量分别代表色彩(Hue)、饱和度(Saturation)和值(Value)。 计算颜色直方图需要将颜色空间划分成若干个小的颜色区间,每个小区间成为直方图的一个bin。这个过程称为颜色量化(color quantization)。然后,通过计算颜色落在每个小区间内的像素数量可以得到颜色直方图。颜色量化有许多方法,例如向量量化、聚类方法或者神经网络方法。最为常用的做法是将颜色空间的各个分量(维度)均匀地进行划分。相比之下,聚类算法则会考虑到图像颜色特征在整个空间中的分布情况,从而避免出现某些bin中的像素数量非常稀疏的情况,使量化更为有效。另外,如果图像是RGB 格式而直方图是HSV空间中的,我们可以预先建立从量化的RGB空间到量化的HSV空间之间的查找表(look-up table),从而加快直方图的计算过程。 上述的颜色量化方法会产生一定的问题。设想两幅图像的颜色直方图几乎相同,只是互相错开了一个bin,这时如果我们采用L1距离或者欧拉距离(见3.1.1节)计算两者的相似度,会得到很小的相似度值。为了克服这个缺陷,需要考虑到相似但不相同的颜色之间的相似度。一种方法是采用二次式距离[4](见3.1.3节)。另一种方法是对颜色直方图事先进行平滑过滤,即每个bin中的像素对于相邻的几个bin也有贡献。这样,相似但不相同颜色之间的相似度对直方图的相似度也有所贡献。 选择合适的颜色小区间(即直方图的bin)数目和颜色量化方法与具体应用的性能和效率要求有关。一般来说,颜色小区间的数目越多,直方图对颜色的分辨能力就越强。然而,bin的数目很大的颜色直方图不但会增加计算负担,也不利于在大型图像库中建立索引。而且对于某些应用来说,使用非常精细的颜色空间划分方法不一定能够提高检索效果,特别是对于不能容忍对相关图像错漏的那些应用。另一种有效减少直方图bin的数目的办法是只选用那些数值最大(即像素数目最多)的bin来构造图像特征,因为这些表示主要颜色的bin能够表达图像中大部分像素的颜色。实验证明这种方法并不会降低颜色直方图的检索效果。事实上,由于忽略了那些数值较小的bin,颜色直方图对噪声的敏感程度降低了,有时会使检索效果更好。两种采用主要颜色构造直方图的方法可以在文献[5,6]中找到。

基于改进的颜色直方图的图像检索算法

基于改进的颜色直方图的图像检索算法 作者:来源:https://www.360docs.net/doc/ba13061800.html,/tember/archive/2006/06/05/773456.asp发表时间:2006-06-05 浏 览次数:1819 字号:大中小 基于内容的图像检索(CBIR) 所谓基于内容图像的检索是指由图像分析软件对输入的图像先进行图像分析,根据图像中物体或区域的颜色(color)、形状(shape)或纹理(texture)等特征以及这些特征的组合,自动抽取特征,在将输入图像存入图像库的同时将其相应的特征向量也存入与图像库相连的特征库。在进行检索图像时,对每一幅给定的查询图,进行图像分析,并提取图像特征向量。将该图像的特征向量和特征库中的特征向量进行匹配,根据匹配的结果到图像库中搜索就可以提取出所需要的检索图。这是一种基于图像固有属性的机械匹配,特别适用于检索目标明确的查询要求(例如对商标的检索),产生的结果也比较准确。目前这种较成熟的检索技术主要应用于图像数据库的检索。在基于Web的图像搜索引擎中应用这种检索技术虽还具有一定的困难,但已有部分图像搜索引擎进行了尝试,如、yahoo, WebSEEK就提供了基于图像的形状或颜色直方图的粗陋的可视检索功能。 基于内容的图像检索是一个逐步求精的过程,大致可以经过以下几个步骤: (1).特征提取 对图像数据进行自动或半自动的特征提取,提取用户感兴趣的、适合检索要求的特征。特征提取可以是全局性的,如整幅图像,也可能是针对某个目标,如图像中的子区域等。 (2).图像匹配 在选取了特征之后,需要选择或寻找适当的判别准则,从而判断出待识别的图像的特征与数据库中的哪些图像的特征最接近。常用的度量准则是距离度量法。 (3).结果输出,将满足一定相似性条件的一组候选结果按相似度大小排列后返回给用户。 (4).特征调整,对系统返回的结果可通过浏览来挑选,直至找到满意的结果,或从候选结果中选择一个示例,经过特征调整,形成一个新的查询。 图像特征的提取的方法

基于颜色特征的图像检索算法的实现

目录 摘要 (1) 关键字 (1) 1绪论 (1) 1.1 基于内容的图像检索的概念 (1) 1.2 基于内容的图像检索的发展历史 (1) 1.3 基于内容的图像检索的特点和主要应用 (1) 1.4 基于内容的图像检索的关键技术 (2) 1.5 国内外研究现状 (3) 1.5.1 国外研究现状 (3) 1.5.2 国内研究现状 (4) 2 基于颜色特征的图像检索方法 (4) 2.1 颜色度量体系 (4) 2.2 颜色空间 (5) 2.2.1 RGB颜色空间 (5) 2.2.2 HSV颜色空间 (5) 2.2.3 CMY颜色空间 (6) 3 颜色特征的表达 (7) 3.1 颜色直方图 (7) 3.2 累加直方图 (8) 4 图像特征的相似性匹配 (9) 4.1 距离度量方法 (9) 4.2直方图的交集的方法 (9) 4.3 欧式距离法 (9) 5 图像检索算法实现 (10) 5.1程序开发运行环境 (10) 5.2 程序检索逻辑 (10) 5.3 算法具体实现 (11) 5.4 实例演示 (14) 6 全文总结与展望 (15) 6.1 全文总结 (15) 6.2 展望 (15) 致谢 (15) 参考文献 (16) 英文摘要 (16)

基于颜色特征的图像检索算法的实现 摘要:文章介绍了一种基于颜色特征的图像检索技术的算法并给出了程序实现。首先介绍了基于内容的图像检索技术、发展历史及基于内容的图像检索技术的特点和主要应用,并在此基础上探讨了该领域所用到的一些关键技术。文章着重探讨了图像的颜色空间、图像特征提取及图像相似性度量等内容,并利用matlab技术实现了一个简单图像检索的程序。文章最后则对当前基于内容图像检索技术研究热点和今后的发展方向进行简单的阐述。 关键字:基于内容的图像检索;颜色特征;颜色直方图;相似度度量方法 1 绪论 1.1 基于内容的图像检索的概念 基于内容的图像检索[1](Content Based Image Retrieval, CBIR)是一项从图像数据库中找出与检索式内容相似的图像的检索技术。它利用从图像中自动抽取出来的底层特征,如颜色、纹理、轮廓和形状等特征,进行计算和比较,检索出符合用户需求的结果图像集。目前图像检索系统技术实现的基础是对底层特征信息的计算和比较,也即是“视觉相似”。 1.2 基于内容的图像检索的发展历史 图像检索技术的发展[2]可以分为两个阶段,第一阶段始于70年代,当时的图像检索是通过人工的标注来实现的,随着计算机技术和通信网技术的发展,特别是因特网的快速发展,图像数据的容量越来越大了,这种“以关键字找图”的方法越来越不适应检索技术的发展了。由于图像内容的丰富内涵以及人们对图像内容进行抽象时的主观性不同的人对同一幅图像有不同的理解,这就引入了主观多义,不利于检索。为了克服文本标注检索的弊端,90年代研究者提出了基于内容的图像检索,其方法是:根据图像的颜色特征、纹理特征、形状特征以及空间关系等作为索引,计算查询图像和目标图像之间的相似距离,然后按相似度匹配进行检索,这种技术很大程度地利用了人们的视觉客观特性,避免不同人对图像主观理解的不同而达不到理想的搜索效果。从研究方向的层面来看,基于内容的图像检索可分为三层:第一层是根据图像的底层特性来进行检索,如颜色、纹理,形状等等,涉及图像信息处理、图像分析和相似性匹配技术;第二层是基于图像对象语义,如图像中实体及实体之间的拓扑关系的检索,对象级检索技术建立在下层特征基础上,并引入了对象模型库、对象识别和人工智能等图像理解技术;第三层是基于图像的抽象属性如行为语义,情感语义和场景语义的推理学习来进行检索。需要用到知识库和更加有效的人工智能和神经网络技术。这三个层次由低到高,与人的认知接近,下一个层次通常包含了比上一个层次更高级的语义,更高层的语义往往通过较低层的语义推理获得。尽管经过了多年的研究,较为成熟的基于内容的图像检索技术目前仍处于底层水平,由于底层研究是上层研究的基础,为了给上层建立准确、有效的图像特征提取方法,底层的研究仍在不断的发展。 1.3 基于内容的图像检索的特点和主要应用 基于内容的图像检索技术有以下特点[3]: 一是它突破了传统的基于表达式检索的局限,从媒体内容中提取信息线索。

一种基于直方图统计特征的直方图匹配算法的研究_朱磊

收稿日期:2004-01-21 作者简介:朱磊(1973— ),男,江苏南京人,工学博士,讲师,研究方向:多媒体信息处理与通信网络管理。文章编号:1003-6199(2004)02-0048-04 一种基于直方图统计特征的直方图匹配算法的研究 朱 磊 (解放军理工大学通信工程学院,江苏南京 210007) 摘 要:本文提出并验证了基于直方图统计特征的直方图匹配算法。直方图作为对图像 颜色或灰度分布的一种基本描述量,利用其统计特征进行直方图之间的相似性度量。实验结果表明,在获得相同查准率的情况下,利用直方图统计特征量测算的算法比经典的欧氏距离测算算法具有更高的查全率。 关键词:直方图;匹配算法;统计特征中图分类号:TP391 文献标识码:A The Application of Digital Library T echnology in the Integrated Management Platform for Military Information ZHU Lei (Institute of Communication Engineering ,PLAUST ,Nanjing ,210007,China ) Abstract :In this paper ,the histogram ’s matching that based on the histogram ’s statistical characteriza 2tion was put forward and implemented.As a basic descriptor of the distribution of color or gray ,histogram ’s statistical characterization was used to compute the similarity between each other.The experimental result in 2dicates that when compared with the classical Euclidean distance measure method ,the new matching algo 2rithm can achieve a higher recall and the same precision. K ey w ords :histogram ;matching algorithm ;statistical characterization 1 引言 在对图像颜色特征的描述上,直方图(his 2togram )是一个非常有效的工具。直方图描述了图像颜色的统计分布特征,且具有平移、尺度和旋转的不变性,因此在颜色检索中被广泛采用。经典的直方图匹配算法是计算直方图之间的欧氏距离,在这种计算方法中,对直方图之间的相似度测量是按照矢量距离测量的思路进行的。本文采用随机变量的数字特征分析方法,利用直方图的统计特征进行直方图之间的相似性度量,将直方图随机变量的均值、方差和K olmogorov -Smirnov 检测量结合起 来,利用三者的加权和来代替欧氏距离判决公式, 对两幅图像的直方图之间的相似性进行度量。本文对这部分的工作进行了实验比较,实验结果表明,在获得相同查准率的情况下,利用直方图统计特征量测算的算法比经典的欧氏距离测算算法具有更高的查全率。 2 基于随机变量统计特征的直方图匹配算法 灰度直方图是灰度级的函数,它表示图像中具有每种灰度级的像素的个数,反映图像中每种灰度出现的频率。如图1所示,灰度直方图的横坐标是灰度级,纵坐标是该灰度级出现的频率,是图像最 第23卷第2期2004年6月 计 算 技 术 与 自 动 化Computing Technology and Automation Vol 123,No 12 J un 12004

颜色特征提取

颜色特征提取 颜色特征是在图像检索中应用最为广泛的视觉特征,主要原因在于颜色往往和图像中所包含的物体或场景十分相关。此外,与其他的视觉特征相比,颜色特征对图像本身的尺寸、方向、视角的依赖性较小,从而具有较高的鲁棒性。 面向图像检索的颜色特征的表达涉及到若干问题。首先,我们需要选择合适的颜色空间来描述颜色特征;其次,我们要采用一定的量化方法将颜色特征表达为向量的形式;最后,还要定义一种相似度(距离)标准用来衡量图像之间在颜色上的相似性。在本节中,我们将主要讨论前两个问题,并介绍颜色直方图、颜色矩、颜色集、颜色聚合向量以及颜色相关图等颜色特征的表示方法。 1 颜色直方图 颜色直方图是在许多图像检索系统中被广泛采用的颜色特征。它所描述的是不同色彩在整幅图像中所占的比例,而并不关心每种色彩所处的空间位置,即无法描述图像中的对象或物体。颜色直方图特别适于描述那些难以进行自动分割的图像。 当然,颜色直方图可以是基于不同的颜色空间和坐标系。最常用的颜色空间是RGB颜色空间,原因在于大部分的数字图像都是用这种颜色空间表达的。然而,RGB空间结构并不符合人们对颜色相似性的主观判断。因此,有人提出了基于HSV 空间、Luv空间和Lab空间的颜色直方图,因为它们更接近于人们对颜色的主观认识。其中HSV空间是直方图最常用的颜色空间。它的三个分量分别代表色彩(Hue)、饱和度(Saturation)和值(Value)。 计算颜色直方图需要将颜色空间划分成若干个小的颜色区间,每个小区间成为直方图的一个bin。这个过程称为颜色量化(color quantization)。然后,通过计算颜色落在每个小区间内的像素数量可以得到颜色直方图。颜色量化有许多方法,例如向量量化、聚类方法或者神经网络方法。最为常用的做法是将颜色空间的各个分量(维度)均匀地进行划分。相比之下,聚类算法则会考虑到图像颜色特征在整个空间中的分布情况,从而避免出现某些bin中的像素数量非常稀疏的情况,使量化更为有效。另外,如果图像是RGB格式而直方图是HSV空间中的,我们可以预先建立从量化的RGB空间到量化的HSV空间之间的查找表(look-up table),从而加快直方图的计算过程。 上述的颜色量化方法会产生一定的问题。设想两幅图像的颜色直方图几乎相同,只是互相错开了一个bin,这时如果我们采用L1距离或者欧拉距离(见3.1.1节)计算两者的相似度,会得到很小的相似度值。为了克服这个缺陷,需要考虑到相似但不相同的颜色之间的相似度。一种方法是采用二次式距离[4](见3.1.3节)。另一种方法是对颜色直方图事先进行平滑过滤,即每个bin中的像素对于相邻的几个bin 也有贡献。这样,相似但不相同颜色之间的相似度对直方图的相似度也有所贡献。 选择合适的颜色小区间(即直方图的bin)数目和颜色量化方法与具体应用的性能和效率要求有关。一般来说,颜色小区间的数目越多,直方图对颜色的分辨能力就越强。然而,bin的数目很大的颜色直方图不但会增加计算负担,也不利于在大型图像库中建立索引。而且对于某些应用来说,使用非常精细的颜色空间划分方法不一定能够提高检索效果,特别是对于不能容忍对相关图像错漏的那些应用。另一

直方图使用中的常见问题

直方图使用中的常见问题 直方图是用来整理计量值的观测数据,分析其分布状态的统计方法,用于对总体的分布特征进行推断。直方图的作用如下: (1)检验数据分布的类型,分析数据是否服从正态分布,判断数据有无异常; (2)与产品规格界限做比较,可直观地判断分布中心是否偏离规格中心,以确定是否需要调整并求出其调整量;还可判断数据分布的散差(分布范围)是否满足规格范围的要求,以确定是否采取缩小散差的技术性措施; (3)用于进行过程能力调查和不合格品率估计; (4)客观地反映操作者的技术水平和主观努力程度。 直方图在过程能力调查中应用十分广泛;但在应用中也常常出现许多问题。 1.对直方图的作用理解不够 当在过程能力调查过程中,我们常常利用直方图整理讲理值的观测数据,用以分析其分布状态,但有时根据观测数据绘制的直方图呈非正态的异常分布。这说明数据已出现了异常。如果在这种状态下,仍旧要继续计算样本平均值、样本标准偏差和过程能力指数,则说明他们对直方图检验数据是否服从正态分布的作用理解不够。这种现象时有发生,应予纠正。 我们知道,只要有足够的数据,即使不画直方图也能计算过程能力指数,但如果不画直方图就无法判断数据分布的正态性,而过程能力指数计算的基础条件是数据必须服从正态分布;如果通过画直方图判断分布不属正态分布,就不能再继续进行相应计算。而应先分析数据异常的原因,予以排除后,再重新收集数据,经画直方图确认属正态分布后,才能计算过程能力指数。 2.样本容量太小 在绘制直方图前抽取的样本容量要适当,但在现场有时可以看到:抽取的样本仅有10-40个数据,就根据这少量观测值绘制直方图,用以分析,其结果误差很大,不宜提倡。 直方图在理论上属于大样本的分析方法,其样本容量要求n<50(一般经常采用n=50-100)。对于抽取数据比较容易的,最好多抽取些数据。

漂移系数优化颜色直方图的Mean Shift算法

2014,50(13)漂移系数优化颜色直方图的Mean Shift 算法 宋康康,陈恳,郭运艳 SONG Kangkang,CHEN Ken,GUO Yunyan 宁波大学信息科学与工程学院,浙江宁波315211 College of Information Science and Engineering ,Ningbo University,Ningbo,Zhejiang 315211,China SONG Kangkang,CHEN Ken,GUO Yunyan.Mean Shift algorithm with shift coefficient refined color https://www.360docs.net/doc/ba13061800.html,puter Engineering and Applications,2014,50(13):173-177. Abstract :The conventional Mean Shift video target tracking algorithm based on color histogram is very sensitive to the interference of background noise,lead to the target location error.To address this problem,a weighted background algo-rithm based on shift coefficient is proposed.According to the shift coefficient given by each pixel in the kernel window,the proposed approach can reduce color feature amount making small contribution to mean shift in the color space,enhance the characteristic of the target,update the template promptly by restraining background interference and introduce new target cues.Experimental results show that the proposed method performs better than background weighted histogram algorithm with less iterations,and even more stable with the template update mechanism. Key words :shift coefficient;weighted histogram;Mean Shift algorithm 摘要:基于颜色直方图的传统Mean Shift 视频目标跟踪算法,容易受到背景信息的干扰而造成定位偏差。针对此问题,提出了一种基于漂移系数的加权颜色直方图算法。根据核窗口内每个像素提供系数的大小,抑制对漂移贡献小的颜色特征,从而增强目标特征的刻画,并通过抑制背景信息和引入新的目标信息来更新模板。实验结果表明,该算法定位跟踪效果优于背景直方图加权算法,并且迭代次数更少。采用模板更新后,跟踪性能更加稳定。关键词:漂移系数;加权直方图;Mean Shift 算法 文献标志码:A 中图分类号:TP391doi :10.3778/j.issn.1002-8331.1207-0128 1引言近年来,Mean-Shift 算法以其无参数、快速模式匹配的特性被广泛应用到目标跟踪领域[1-3]。经典Mean Shift 算法利用空间核加权颜色直方图作为模板,通过搜索局部巴氏系数最大值,实现目标跟踪定位。颜色直方图是对图像在颜色空间中分布的一种简单的非参数估计,描述了图像的全局统计特征,具有旋转和平移不变性,而且特征提取方便,因此常常作为特征模型广泛应用于图像检索和目标跟踪之中。另一方面颜色特征容易受光照条件变化的影响,因此利用颜色特征的Mean Shift 算法的一个挑战是如何提高跟踪的鲁棒性。为克服上述颜色直方图的弱点,许多学者提出了许多改进方法。例如,用背景像素与目标像素定义加权系数,以此计算空间直方图,实施目标跟踪定位,主要存在 的问题是如何鲁棒的区分背景与目标[4]。文献[5-6]利用目标颜色空间和纹理特征,构建边缘直方图,用以区分目标与背景信息,提升颜色直方图的鲁棒性。 利用加权求取颜色特征和边缘特征的巴氏系数,进行目标特征匹配和跟踪,弥补了单一颜色特征不稳定的弱点,但未涉及模板更新问题[7]。利用可见光和红外双通道做目标多特征信息融合,克服了可见光条件下,颜色直方图对光照条件敏感的问题,但是也进行模板更新[8]。采用目标先验知识创建了多个颜色直方图模板,增强了颜色直方图模板描述目标特征的能力,并能实时选取最 优模型,但是计算稍微复杂[9-10]。 上述研究者主要利用多特征或多模型来增强颜色基金项目:宁波市科技局自然科学基金(No.2010A610109);宁波大学学校科研基金(理)(No.xkl11075)。 作者简介:宋康康(1986—),男,硕士,主要研究领域为视频目标跟踪,图像处理;陈恳(1962—),男,博士,副教授,主要研究领域为图像 与视频处理,智能控制;郭运艳(1987—),女,硕士,主要研究领域为视频目标跟踪,图像处理。E-mail :boyadme@https://www.360docs.net/doc/ba13061800.html, 收稿日期:2012-07-12修回日期:2012-12-06文章编号:1002-8331(2014)13-0173-05 CNKI 网络优先出版:2012-12-20,https://www.360docs.net/doc/ba13061800.html,/kcms/detail/11.2127.TP.20121220.1652.009.html Computer Engineering and Applications 计算机工程与应用 173

相关文档
最新文档