图像编解码技术及应用

图像编解码技术及应用
图像编解码技术及应用

图像编解码技术及应用

1.图像编解码技术概论:

在当前的图像压缩领域中常用的技术有:BMP、EPS、GIF、JPG、PDF、PIC、PNG、PSD、TIF。上述技术间的差异主要存在于图像编解码的算法不同,通过对算法的研究可以使我们更加容易的理解图像压缩的原理。

位图格式(BMP)是在DOS时代就出现的一种元老级文件格式,因此它是DOS 和WINDOWS操作系统上的标准的WINGDOWS点阵图像格式,以此文件格式存储时,采用一种非破坏性的RLE压缩,不会省略任何图像的细部信息。

EPS是最常见的线条稿共享文件格式,它是以PostScript语言为开发基础,所以EPS文件能够同时兼容矢量和点阵图形,所有的排版或图像处理软件如PageMaker或Illustrator等,都提供了读入或置入EPS格式文件的能力,而且RGB和CMYK对象也可以保有各自的原始的色彩模式。

GIF应该是在网络上最常见的一种压缩文件格式,它的英文全名Graphic Interchange format,当初研发的目的是为了最小化电缆上的传输,因此能采用LZW方式进行压缩,但可显示的颜色范围只局限于256索引色,目前所采用的GIF 图形共有两种格式:87a和89a,常见于网页上建议的小动画制作,其中GIF89a 还可提供透明色效果,点阵图形,灰度图形或者索引颜色模式皆可存储为此种文件格式

JPG跟GIF一样为网络上最常见道的图像格式,其英文正式名称为Joint Photographic Experts Group,它是以全彩模式进行显示色彩,是目前最有效率的一种压缩格式,常用于照片或连续色调的显示,而且没有GIF去掉图像细部信息的缺点,但需要注意的是此类图像需要自行设置压缩程度,在打开时JPG图像会自动解压缩,不过要注意的是JPG采用的压缩是破坏性的压缩,因此会在一定程度上减损图像本身的品质。

PDF是Adobe公司近几年权力推行的一种文件格式,它已Post Level2语言

为其开发基础,同时可显示矢量及点阵的数码图形,同时还具有文件搜寻及网上预览的功能,即所谓电子化文件的观念,我们只要利用PageMaker或Illustrator 设计完成一个出版文件,并以PDF格式输出便可发送出去,不会有分色、装订和印刷的烦恼,而且可适用相当多的平台,如Macintosh、Windows、UNIX以及DOS。PDF文件的浏览器为Acrobat Reader。

PIC是苹果(Macintosh)操作系统的标准文件格式,以QuickDraw显示语言为开发基础,是少数可以同时支持矢量和点阵的图像类型,利用Macintosh 色彩上的优势,PIC可以支持任何颜色深度,尺寸及分辨率,甚至可支持到32位的图像。

PNG是由GIF衍生出来的一种新的图像格式,似乎有取代GIF的趋势,同样适用于网页图像显示,同时采用非破坏性的压缩方式来缩减文件大小,在传输时亦可以渐次的方式将接收到的图像显示出来,不必苦等数据传输完毕后才能一窥全貌。

PSD是Photoshop中的标准文件格式,是Adobe公司为Photoshop量身定做的定制格式,也是唯一支持Photoshop所有功能的文件类型,包括图层、通道、路径等,在存储时会进行非破坏性压缩以减少存储空间,打开时速度也较其他格式快些,在作品未定稿前强烈建议以此种文件格式存储,以便日后修改。

TIF是由Aldus公司早期所研发的一种文件格式,至今仍然是图像文件的主流格式之一,同时横跨苹果(Macintosh)和个人电脑(PC)两大操作系统平台,可以说是跨平台操作的标准文件格式,而且也广泛支持图像打印的规格,如分色的处理功能,它所使用的是一种LZW的非破坏性压缩。遗憾的是不支持矢量图形。

2.BMP、GIF、JPEG图像编解码详解:

一、行程长度压缩

原理是将一扫描行中的颜色值相同的相邻像素用一个计数值和那些像素的颜色值来代替。例如:aaabccccccddeee,则可用3a1b6c2d3e来代替。对于拥有

大面积,相同颜色区域的图像,用RLE压缩方法非常有效。由RLE原理派生出许多具体行程压缩方法:

1.PCX行程压缩方法: 该算法实际上是位映射格式到压缩格式的转换算法,该算法对于连续出现1次的字节Ch,若Ch>0xc0则压缩时在该字节前加上0xc1,否则直接输出Ch,对于连续出现N 次的字节Ch,则压缩成0xc0+N,Ch这两个字节,因而N最大只能为ff-c0=3fh(十进制为63),当N大于63时,则需分多次压缩。

2.BI_RLE8压缩方法:在WINDOWS的位图文件中采用了这种压缩方法。该压缩方法编码也是以两个字节为基本单位。其中第一个字节规定了用第二个字节指定的颜色重复次数。如编码 0504表示从当前位置开始连续显示5个颜色值为04的像素。当第二个字节为零时第二个字节有特殊含义:0表示行末;1表示图末;2转义后面2个字节,这两个字节分别表示下一像素相对于当前位置的水平位移和垂直位移。这种压缩方法所能压缩的图像像素位数最大为8位(256色)图像。

3.BI_RLE压缩方法: 该方法也用于WINDOWS位图文件中,它与 BI_RLE8编码类似,唯一不同是:BI_RLE4的一个字节包含了两个像素的颜色,因此,它只能压缩的颜色数不超过16的图像。因而这种压缩应用范围有限。

4.紧缩位压缩方法(Packbits):该方法是用于Apple公司的Macintosh机上的位图数据压缩方法, TIFF 规范中使用了这种方法,这种压缩方法与BI_RLE8压缩方法相似,如1c1c1c2132325648 压缩为:83 1c 21 81 32 56 48,显而易见,这种压缩方法最好情况是每连续128个字节相同,这128个字节可压缩为一个数值7f。这种方法还是非常有效的。

二、霍夫曼编码压缩:

也是一种常用的压缩方法。是1952年为文本文件建立的,其基本原理是频繁使用的数据用较短的代码代替,很少使用的数据用较长的代码代替,每个数据的代码各不相同。这些代码都是二进制码,且码的长度是可变的。如: 有一个原始数据序列,ABACCDAA则编码为A(0),B(10),C(110),(D111),压缩后为010011011011100。产生霍夫曼编码需要对原始数据扫描两遍,第一遍扫描要精确地统计出原始数据中的每个值出现的频率,第二遍是建立霍夫曼树并进行编

码,由于需要建立二叉树并遍历二叉树生成编码,因此数据压缩和还原速度都较慢,但简单有效,因而得到广泛的应用。

三、LZW压缩方法

LZW压缩技术比其它大多数压缩技术都复杂,压缩效率也较高。其基本原理是把每一个第一次出现的字符串用一个数值来编码,在还原程序中再将这个数值还成原来的字符串,如用数值0x100代替字符串"abccddeee"这样每当出现该字符串时,都用0x100代替,起到了压缩的作用。至于0x100与字符串的对应关系则是在压缩过程中动态生成的,而且这种对应关系是隐含在压缩数据中,随着解压缩的进行这张编码表会从压缩数据中逐步得到恢复,后面的压缩数据再根据前面数据产生的对应关系产生更多的对应关系。直到压缩文件结束为止。LZW 是可逆的,所有信息全部保留。

四、算术压缩方法

算术压缩与霍夫曼编码压缩方法类似,只不过它比霍夫曼编码更加有效。算术压缩适合于由相同的重复序列组成的文件,算术压缩接近压缩的理论极限。这种方法,是将不同的序列映像到0到1之间的区域内,该区域表示成可变精度(位数 )的二进制小数,越不常见的数据要的精度越高(更多的位数),这种方法比较复杂,因而不太常用。

五、JPEG( 联合摄影专家组 Joint Photographic Exprerts Group)

JPEG标准与其它的标准不同,它定义了不兼容的编码方法,在它最常用的模式中,它是带失真的,一个从JPEG文件恢复出来的图像与原始图像总是不同的,但有损压缩重建后的图像常常比原始图像的效果更好。JPEG的另一个显著的特点是它的压缩比例相当高,原图像大小与压缩后的图像大小相比,比例可以从1%到80~90%不等。这种方法效果也好,适合多媒体系统。

介绍完了压缩算法,我们来简要介绍一下三种位图格式的异同和它们之间的相互转换。

2.1 BMP:

图象文件就是描绘了一幅图象的计算机磁盘文件。形成数字图象数据后,将其存储在计算机里的方法有2种,即位映射和向量处理方式。

我们这里主要讨论的是位图。不同图象软件几乎都用各种的方法处理图象,图象格式也多种多样,它主要包括文件识别头和图象数据。文件识别头用来让计算机判断是哪种文件格式,图象数据包含了整个对图象描绘相关数据,包括调色板、位图映象等。根据压缩算法不同,映象方式也不同,下面简要介绍一下压缩算法。

位图文件头:包含BMP图象文件的类型、显示内容等信息。

typedef struct tagBITMAPFILEHEADER {

WORD bfType; // 位图文件的类型,必须为BM

DWORD bfSize; // 位图文件的大小,以字节为单位

WORD bfReserved1; // 位图文件保留字,必须为0

WORD bfReserved2; // 位图文件保留字,必须为0

DWORD bfOffBits; // 位图数据的起始位置,以相对于位图文件头的偏移量表示 } BITMAPFILEHEADER;

0x0000H - 0x0001H 2 BYTES 文件标识基本上就是'BM'

0x0002H - 0x0005H 4 BYTES 表示整个文件的大小字节顺序是否固定 little_Endian or big_Endian?

0x0006H - 0x0009H 4 BYTES 保留必须设置为0

0x000AH - 0x000DH 4 BYTES 位图数据的偏移量从文件开始计算

位图信息数据结构由BITMAPINFOHEADER和RGBQUAD两个数据结构组成

接下来为位图信息头: typedef struct tagBITMAPINFOHEADER{

DWORD biSize; // 本结构所占用字节数

LONG biWidth; // 位图的宽度,以像素为单位

LONG biHeight; // 位图的高度,以像素为单位

WORD biPlanes; // 目标设备的级别,必须为1

WORD biBitCount // 每个像素所需的位数,必须是1(双色),

// 4(16色),8(256色)或24(真彩色)之一DWORD biCompression; // 位图压缩类型,必须是0(不压缩), // 1(BI_RLE8压缩类型)或2(BI_RLE4压缩类型)之一

DWORD biSizeImage; // 位图的大小,以字节为单位

LONG biXPelsPerMeter; // 位图水平分辨率,每米像素数

LONG biYPelsPerMeter; // 位图垂直分辨率,每米像素数

DWORD biClrUsed; // 位图实际使用的颜色表中的颜色数

DWORD biClrImportant; // 位图显示过程中重要的颜色数

} BITMAPINFOHEADER;

其中BITMAPINFOHEADER数据结构包含了有关BMP图象的宽、高、压缩方法等信息。

0x000EH - 0x0011H 4 BYTES 位图信息头的长度大小整个结构的大小,可能会增加字段,所以需要读取该值

0x0012H - 0x0015H 4 BYTES 位图宽度单位像素

0x0016H - 0x0019H 4 BYTES 位图高度单位像素

还有另一个用处,就是指明该图像是倒向的位图,还是正向的位图。如果该值是一个正数,图像是倒向的,如果该值是一个负数,图像是正向的。当高度值是一个负数时(正向图像)图像将不能被压缩,压缩方式不能是BI_RLE8或BI_RLE4。0x001AH - 0x001BH 2 BYTES 位图的位面数总是1

0x001CH - 0x001DH 2 BYTES 每个像素的位数值为1 4 8 16 24 32

0x001EH - 0x0021H 4 BYTES 压缩方式

([0] 不压缩 BI_RGB [1] RLE-8压缩,8位RLE压缩 BI_RLE8 每个象素8比特的RLE压缩编码,压缩格式由2字节组成 [2] RLE-4压缩,4位RLE压缩 BI_RLE4 每个象素4比特的RLE压缩编码,压缩格式由2字节组成 [3] Bitfields位域存放方式 BI_BITFILEDS 每个象素的比特由指定的掩码决定)

0x0022H - 0x0024H 4 BYTES 位图数据大小必须是4的整数倍,说明图象的大小,以字节为单位。当用BI_RGB格式时,可设置为0。

0x0026H - 0x0029H 4 BYTES 水平分辨率对于设备无关图,设置成为0 0x002AH - 0x002DH 4 BYTES 垂直分辨率对于设备无关图,设置成为0 typedef struct tagRGBQUAD {

BYTE rgbBlue; // 蓝色的亮度(值范围为0-255)

BYTE rgbGreen; // 绿色的亮度(值范围为0-255)

BYTE rgbRed; // 红色的亮度(值范围为0-255)

BYTE rgbReserved; // 保留,必须为0

} RGBQUAD;

0x002EH - 0x0031H 4 BYTES 使用的颜色数说明位图实际使用的颜色表中的颜色索引数,设为0的话,则说明使用所有调色板项,如果有调色板,则大小等于2^VALUE(0x001CH - 0x001DH) 16位及以上位图不使用颜色表。

0x0032H - 0x0035H 4 BYTES 重要的颜色数指定重要的颜色数,一般设置为0,表示所有的颜色一样重要如果设置的不等于0或者颜色数,就只有这么多值

数据结构RGBQUAD定义一种颜色。

位图阵列:

位图阵列记录了图象的每一个象素值。从图象的左下角开始逐行扫描图象。从左到右,从上到下,将图象的象素值逐一记录下来,这些记录象素值的字节组成了位图阵列。

位图阵列数据的存储格式有压缩和非压缩两种格式。

1.非压缩格式位图中的每一个点的象素值对应与位图阵列的若干位,而位图阵列的若干位由图象的高度、宽度及图象的颜色数决定。

2.压缩格式在bmp格式文件中,Windows支持BI-RLE8和BI-RLE4两种压缩类型的存储格式。

图象数据:

BMP图象数据的存储顺序是由下而上(图象上下颠倒存储),而图象的宽度(以字节为单位)必须是4的倍数。

如果不足4的倍数必须补足。虽然BMP图象数据有BI_RLE8和BI_RLE4两种压缩格式,但是使用很少。

BI_RLE8和BI_RLE4(RunLength压缩):二者的差别在于前者以8位为一个处理单位,后者以4位为一个处理单位。

解压缩时,每次读取2字节数据(BYTE1 , BYTE2)

BYTE1!= 0x0 BYTE1为数据重复值,将BYTE2重复BYTE1次

BYTE1=0x00,BYTE2=0x00表示此扫描线结束(end of line)BYTE1=0x00, BYTE2=0x01表示文档结束(end of file)BYTE1=0x00, BYTE2=0x02坐标位移指示,表示后面两个字节分别是指下一个像素位置与目前像素位置的水平和垂直位移数值。

BYTE1=0x00, BYTE2=0x03~0xFF BYTE2为数据读取值。连续读取BYTE2个字节的数据,而BYTE2必须是2的整数倍,否则必须补足。

例:

一段压缩数据(BI_RLE8)如下:

0x03 0x04 0x05 0x06 0x00 0x03 0x45 0x56 0x67 0x00 0x02 0x78 0x00 0x02 0x05 0x01 0x02 0x78 0x00 0x00 0x04 0x1E 0x00 0x01

BYTE1 BYTE2

0x03 0x04 0x04 0x04 0x04

0x05 0x06 0x06 0x06 0x06 0x06 0x06

0x00 0x03 (0x45 0x56 0x67 0x00) 0x45 0x56 0x67

0x02 0x78 0x78 0x78

0x00 0x02 (0x05 0x01) 右移5点,下移一点

0x02 0x78 0x78 0x78

0x00 0x00 End of line

0x04 0x1E 0x1E 0x1E 0x1E 0x1E

0x00 0x01 End of file

一段压缩数据(BI_RLE4)如下:

0x03 0x04 0x05 0x06 0x00 0x03 0x45 0x60 0x04 0x63 0x03 0x78 0x00 0x02 0x05 0x01 0x03 0x78 0x00 0x00 0x05 0xD4 0x00 0x01 0x03 0x04 0x00 0x04 0x00 0x05 0x06 0x00 0x06 0x00 0x06 0x00 0x00 0x03 (0x45 0x60) 0x04 0x05 0x06 0x04 0x63 0x06 0x03 0x06 0x03 0x03 0x78 0x07 0x08 0x07 0x00 0x02 (0x05 0x01)右移5点,下移一点 0x03 0x78 0x07 0x08 0x07 0x00 0x00 End of line 0x05 0xD4 0x0D 0x05 0x0D 0x05 0x0D 0x00 0x01 End of file

紧跟在彩色表之后的是图象数据字节阵列。图象的每一扫描行由表示图象象素的连续的字节组成,每一行的字节数取决于图象的颜色数目和用象素表示的图象宽度。扫描行是由底向上存储的,这就是说,阵列中的第一个字节表示位图左下角的象素,而最后一个字节表示位图右上角的象素。(只针对与倒向DIB,如果是正向 DIB,则扫描行是由顶向下存储的),倒向DIB的原点在图像的左下角,而正向DIB的原点在图像的左上角。同时,每一扫描行的字节数必需是4的整倍数,也就是DWORD对齐的。如果你想确保图像的扫描行DWORD对齐,可使用下面的代码:(((width*biBitCount)+31)>>5)<<2

起始地址为:(如果该部分存在的话)

sizeof(第一部分) + sizeof(第二部分)

读取位图文件的时候第一部分应该不变,需要根据第二部分的0x000EH-0x0011H 的值

大小来确定第二部分的数据大小。

整个区域的大小:

N * 4

BYTES

4个字节依次表示BGRA, 编程中是RGBA 这里是little_Endian

具体大小依赖很多数值

起始地址为:VALUE(0x000AH - 0x000DH)

整个区域的大小:

具体每个像素的表示方法,依赖0x001CH - 0x001DH每个像素的位数

0x001EH -

0x0021H压缩方式

0x002EH -

0x0031H颜色表大小

0x001CH - 0x001DH 每个像素的位数

biBitCount=1 表示位图最多有两种颜色,缺省情况下是黑色和白色,你也可以自己定义这两种颜色。

图像信息头装调色板中将有两个调色板项,称为索引0和索引1。图象数据阵列中的每一位表示一个象素。如果一个位是0,显示时就使用索引0的RGB值,如果位是1,则使用索引1的RGB值。

biBitCount=4 表示位图最多有16种颜色。每个象素用4位表示,并用这4位作为彩色表的表项来查找该象素的颜色。例如,如果位图中的第一个字节为0x1F,它表示有两个象素,第一象素的颜色就在彩色表的第2表项中查找,而第二个象素的颜色就在彩色表的第16表项中查找。此时,调色板中缺省情况下会有16

个RGB项。对应于索引0到索引15。

biBitCount=8 表示位图最多有256种颜色。每个象素用8位表示,并用这8位作为彩色表的表项来查找该象素的颜色。

例如,如果位图中的第一个字节为0x1F,这个象素的颜色就在彩色表的第32表

项中查找。此时,缺省情况下,调色板中会有256个RGB项,对应于索引0到索引255。

biBitCount=16 表示位图最多有2^16种颜色。每个色素用16位(2个字节)表示。这种格式叫作高彩色,或叫增强型16位色,或64K色。它的情况比较复杂,当 biCompression成员的值是BI_RGB时,它没有调色板。16位中,最低的5

位表示蓝色分量,中间的5位表示绿色分量,高的5位表示红色分量,一共占用了15位,最高的一位保留,设为0。这种格式也被称作555 16位位图。如果biCompression成员的值是BI_BITFIELDS,那么情况就复杂了,首先是原来调色板的位置被三个DWORD变量占据,称为红、绿、蓝掩码。分别用于描述红、绿、蓝分量在16位中所占的位置。在Windows 95(或98)中,系统可接受两种格式的位域:555和565,在555格式下,红、绿、蓝的掩码分别是:0x7C00、0x03E0、0x001F,而在565格式下,它们则分别为:0xF800、0x07E0、0x001F。你在读取一个像素之后,可以分别用掩码“与”上像素值,从而提取出想要的颜色分量(当然还要再经过适当的左右移操作)。在NT系统中,则没有格式限制,只不过要求掩码之间不能有重叠。

biBitCount=24 表示位图最多有2^24种颜色。这种位图没有调色板,在位数组中,每3个字节代表一个象素,分别对应于颜色R、G、B。

biBitCount=32 表示位图最多有2^32种颜色。这种位图的结构与16位位图结构非常类似,当biCompression成员的值是BI_RGB时,它也没有调色板,32位中有24位用于存放RGB值,顺序是:最高位—保留,红8位、绿8位、蓝8位。这种格式也被成为888 32位图。如果 biCompression成员的值是BI_BITFIELDS 时,原来调色板的位置将被三个DWORD变量占据,成为红、绿、蓝掩码,分别用于描述红、绿、蓝分量在32位中所占的位置。在Windows 95(or 98)中,系统只接受888格式,也就是说三个掩码的值将只能是:0xFF0000、0xFF00、0xFF。而在NT系统中,你只要注意使掩码之间不产生重叠就行。(注:这种图像格式比较规整,因为它是DWORD对齐的,所以在内存中进行图像处理时可进行汇编级的代码优化(简单))。

0x002EH - 0x0031H 4 BYTES 使用的颜色数

指定实际使用的颜色数目。如果设置成0,位图使用的颜色数目就等于biBitCount成员中的数目。请注意,如果不是可用颜色的最大值或不是0,则在编程时应该注意调色板尺寸的计算,比如在4位位图中,调色板的缺省尺寸应该是16*sizeof(RGBQUAD),如果不是,那么调色板的尺寸就应该是 VALUE(0x002EH - 0x0031H)*sizeof(RGBQUAD)。

图象数据压缩

BI_RLE8:每个象素为8比特的RLE压缩编码,可使用编码方式和绝对方式中的任何一种进行压缩,这两种方式可在同一幅图中的任何地方使用。

编码方式:由2个字节组成,第一个字节指定使用相同颜色的象素数目,第二个字节指定使用的颜色索引。此外,这个字节对中的第一个字节可设置为0,联合使用第二个字节的值表示:

第二个字节的值为0:行的结束。

第二个字节的值为1:图象结束。

第二个字节的值为2:其后的两个字节表示下一个象素从当前开始的水平和垂直位置的偏移量。

绝对方式:第一个字节设置为0,而第二个字节设置为0x03~0xFF之间的一个值。在这种方式中,第二个字节表示跟在这个字节后面的字节数,每个字节包含单个象素的颜色索引。压缩数据格式需要字边界(word boundary)对齐。下面的例子是用16进制表示的8-位压缩图象数据:

03 04 05 06 00 03 45 56 67 00 02 78 00 02 05 01 02 78 00 00 09 1E 00 01 这些压缩数据可解释为:

压缩数据

扩展数据

03 04 04 04 04

05 06 06 06 06 06 06

00 03 45 56 67 00 45 56 67

02 78 78 78

00 02 05 01 从当前位置右移5个位置后向下移一行

02 78 78 78

00 00 行结束

09 1E 1E 1E 1E 1E 1E 1E 1E 1E 1E

00 01 RLE编码图象结束

BI_RLE4:每个象素为4比特的RLE压缩编码,同样也可使用编码方式和绝对方式中的任何一种进行压缩,这两种方式也可在同一幅图中的任何地方使用。这两种方式是:

编码方式:由2个字节组成,第一个字节指定象素数目,第二个字节包含两种颜色索引,一个在高4位,另一个在低4位。第一个象素使用高4位的颜色索引,第二个使用低4位的颜色索引,第3个使用高4位的颜色索引,依此类推。绝对方式:这个字节对中的第一个字节设置为0,第二个字节包含有颜色索引数,其后续字节包含有颜色索引,颜色索引存放在该字节的高、低4位中,一个颜色索引对应一个象素。此外,BI_RLE4也同样联合使用第二个字节中的值表示:第二个字节的值为0:行的结束。第二个字节的值为1:图象结束。第二个字节的值为2:其后的两个字节表示下一个象素从当前开始的水平和垂直位置的偏移量。下面的例子是用16进制数表示的4-位压缩图象数据:03 04 05 06 00 06 45 56 67 00 04 78 00 02 05 01 04 78 00 00 09 1E 00 01这些压缩数据可解释为:压缩数据扩展数据

03 04 0 4 0

05 06 0 6 0 6 0

00 06 45 56 67 00 4 5 5 6 6 7

04 78 7 8 7 8

00 02 05 01 从当前位置右移5个位置后向下移一行

04 78 7 8 7 8

00 00 行结束

09 1E 1 E 1 E 1 E 1 E 1

00 01 RLE图象结束

2.2 GIF:

GIF的全称是Graphics Interchange Format,.译做图形交换格式。GIF是一种公用的图象文件格式标准。

GIF文件结构包含一个文件头,在一个GIF文件中首先碰到的是GIF的标志,这个标志告诉解码程序这是个GIF文件。这个标志是3字节的串:GIF。一个GIF 文件中可以存放多幅图象,但绝大多数的文件都只包含一幅图象。

然后是屏幕描述字(screen descriptor),说明了用来生成的显示文件中的图象的显示器分辨率,分别表示屏幕的宽和高。

紧跟下来的一个字节是全局标志,其低三位说明了即将碰到的图象是多少颜色的。最高位表示是否存在一个全局色彩表。

背景色表示把背景置成适当的颜色,实际上是一个指向全局色彩表的数。

Struct Global_Data{

Unsigned short screen_width;

Unsigned short screen_height;

Unsigned char background;

har tail='\0';

}

接下来是全局色彩表,按顺序存放所有的颜色,每一种颜色由色彩表的一项来描述,每项是3字节,分别表示红、绿、蓝三种原色的强度。其长度有全局标志的低三位表示。

以后的数据都是局部的了。是些数据块的集合。下面是图象数据块的结构。

Struct Local_Head{

Char heading=',';

Unsigned short image_left;//图象的屏幕上显示的起始位置Unsigned short image_top;

Unsigned short image_width;

Unsigned short image-height;

Unsigned char local_flag;//局部标志

}

局部标志和全局标志的不同之处在于次高位,如果这位被置成1则表示图像的位图数据是以隔行方式存放的。也就是说,在解开的位图数据中,第一行存放的是屏幕上第一行,第二行对应屏幕上的第9行,第三行对应屏幕上的第17行,以此递增--这是第一遍扫描;第二遍扫描是从屏幕上的第5行开始,两行之间也是以8递增;第三遍扫描是从屏幕上的第3行开始,两行之间以4递增;第四遍扫描,也是最后一遍,从第2行开始,两行之间以2递增。隔行存放的GIF 图像在边解码边显示的时候可分成四遍扫描。第一遍扫描虽然只显示了整个图像的八分之一,第二遍的扫描后也只显示了四分之一,但这已经把整个图像的概貌显示出来了。在显示GIF图像的时,隔行存放的图像会给你这样一个印象:向它的显示速度似乎要比其他图像快一些,这是隔行存放的优点。

在GIF图像的编解码中用到了LZW压缩算法--把这些字符流转换成另一种形式的代码流,解码过程则是把这种代码流还原成原来的字符流。

2.3 JPEG:

JPEG文件是当前网络最为流行的图像文件格式,具有高压缩比、多种质量选择等特征。JPEG是Joint Photographic Experts Group(联合摄影专家小组)的首字母缩写。JPEG的主要作用是用于数字化图象的标准编码技术。JPEG图象文件是一种象素格式文件格式,但它比诸如象GIF、BMP等图象文件要复杂的多。所幸,我们在使用由JPEG组成的JPEG库时,只要对该文件格式有个一般的了解就可以了。而没有必要对JPEG文件格式做一个全面细致的了解。

JPEG格式是种有损的编码格式,但如果GIF文件比,他经过解码后的重构图象要比GIF图象更接近于原始的图象。 JPEG编码技术是由颜色转换、DCT变

换、进行量化、编码。其压缩格式由著名的JPEG集团所著的4.0版本的库所定。关于这3种图象格式的互相转换,主要是用c语言或c++和汇编语言,因为这些语言可以直接进行底层的操作,把图象解压缩后按用另一种格式要求进行压缩即可。

详见附录《JPEG+图像解码方案.pdf》

2.4 RGB< -- >YUV

把RGB 24bit 的格式转换为YUV 4:1:1的格式,然后再转换回来保存成BMP文件,为什么失真特别大呢?我用的是下面的公式:

YUV与RGB图象之间的变换关系:

Y= 0.2990R + 0.5870G + 0.1140B

U= -0.1687R-0.3313G+0.5000B + 128

V= 0.5000R-0.4187G-0.0813B + 128

反变换关系:

R= 1.0Y + 0 +1.402 (V-128)

G= 1.0Y - 0.34413(U-128) - 0.71414(V-128)

B= 1.0Y + 1.772 (U-128)+0

3.图像编解码的代码实现:

见附录: cximage600_demo.zip cximage600_full.zip

图像处理在航天航空中的应用-结业论文

图像处理在航天航空中的应用-结业论文

论文题目:图像处理在航天和航空技术方面的运用 学院:机械电气工程学院 班级: 2012级机制3班 姓名:张娜 学号: 20125009077

摘要:图像处理技术的研究和应用越来越受到社会发展的影响,并以自身的技术特点反过来影响整个社会技术的进步。本文主要简单概括了数字图像处理技术的特点、优势,列举了数字图像处理技术的应用领域并详细介绍了其在航天航空领域中的发展。 关键字:图像处理简介技术的优点发展技术应用 一、引言 数字图像处理是通过计算机采用一定的算法对图像图形进行处理的技术,它已经在各个领域上都有了较广泛的应用。图像处理的信息量很大,对处理速度要求也很高。本文就简单的介绍图像处理技术及其在各个领域的应用,详细说明图像处理在航天航空技术方面的应用。 二、数字图像处理简介 (一)图像的概念 图像包含了它所表达的物体的描述信息。我们生活在一个信息时代,科学研究和统计表明,人类从外界获得的信息约有百分之七十来自视觉系统,也就是从图像中获得,即我们平常所熟知的照片,绘画,动画。视像等。 (二)数字图像处理技术 数字图像处理又称为计算机图像处理,它是指将图像信号转换成数字信号并利用计算机对其进行处理的过程。图像处理技术着重强调在图像之间进行的变换,主要目标是要对图像进行各种加工以改善图像的视觉效果并为其后的目标自动识别打基础,或对图像进行压缩编码以减少图像存储所需要的空间或图像传输所需的时间。图像处理是比较低层的操作,它主要在图像像素级上进行处理,处理的数据量非常大。数字图像处理的早期应用是对宇宙飞船发回的图像所进行的

数字图像处理在医学上的应用

数字图像处理在医学上的应用 1 引言 自伦琴1895年发现X射线以来,在医学领域可以用图像的形式揭示更多有用的医学信息,医学的诊断方式也发生了巨大的变化。随着科学技术的不断发展,现代医学已越来越离不开医学图像的信息处理, 医学图像在临床诊断、教学科研等方面有重要的作用。目前的医学图像主要包括CT (计算机断层扫描) 图像、MRI( 核磁共振)图像、B超扫描图像、数字X 光机图像、X 射线透视图像、各种电子内窥镜图像、显微镜下病理切片图像等。但是由于医学成像设备的成像机理、获取条件和显示设备等因素的限制, 使得人眼对某些图像很难直接做出准确的判断。计算机技术的应用可以改变这种状况,通过图像变换和增强技术来改善图像的清晰度, 突出重要的内容,抑制不重要的内容,以适应人眼的观察和机器的自动分析,这无疑大大提高了医生临床诊断的准确性和正确性。 数字图像处理的基本方法就是图像复原与图像增强。图像复原就是尽可能恢复原始图像的信息量,尽量保真。数字化的一个基本特征是它所固有的噪声。噪声可视为围绕真实值的随机波动, 是降低图像质量的主要因素。图像复原的一个基本问题就是消除噪声。图像增强就是通过利用人的视觉系统的生理特性更好地分辨图像细节。 与其他领域的应用相比较,医学影像等卫生领域信息更具独特性,医学图像较普通图像纹理更多,分辨率更高,相关性更大,存储空间要更大,并且为严格确保临床应用的可靠性,其压缩、分割等图像预处理、图像分析及图像理解等要求更高。医学图像处理跨计算机、数学、图形学、医学等多学科研究领域,医学图像处理技术包括图像变换、图像压缩、图像增强、图像平滑、边缘锐化、图像分割、图像识别、图像融合等等。在此联系数字图像处理的相关理论知识和步骤设计规划系统采集和处理的具体流程同时充分考虑到图像采集设备的拍摄效果以及最终处理结果的准确性,例举了基于图像处理技术的人体手指甲襞处微血管管袢直径的测量方法。 2人体微血管显微图像的采集 人体微血管显微图像的采集采用了如图1所示的显微光学系统和图像采集系统主要由透镜模组滤镜模组光源系统电荷耦合器件以及图像采集卡等构成。 图1显微光学系统与图像采集系统示意图

数字图像处理技术及其应用_李红俊

·620· 计算机测量与控制.2002.10(9)  Computer Measurement &Control 设计与应用 收稿日期:2001-12-04。作者简介:李红俊(1974-),男,山西省平遥县人,硕士研 究生,主要从事机械电子方向的研究。 文章编号:1671-4598(2002)09-0620-03 中图分类号:T P391.41 文献标识码:B 数字图像处理技术及其应用 李红俊,韩冀皖 (太原理工大学机械工程学院,山西太原 030024) 摘要:介绍了数字图像处理的基本概念、基本原理,对其中一些算法进行了详细的说明,对不同算法进行了比较。同时,在对现有图像处理方法进行应用的同时,对滤波做了一些新的尝试。最后,将像素细分算法应用于实际生产中, 获得了较好的效果。 关键词:数字图像处理;边缘检测;滤波;像素细分算法 Digital Image Processing and Its Application LI Hong -jun ,HAN Ji -w an (Taiy uan University of T echnolo gy ,T aiyuan 030024,China ) Abstract :T he basic co ncepts and basic principals of digital imag e processing are introduced .Some arithmetics and compari -so n between different arithme tics are expounded .New methods of sieve are adopted when existing image processing methods is being applied .A t last ,the arithmetic of subpixel is applied into practice and obtains effect preferably . Key words :digital image processing ;edge detecting ;sieve ;arithmetic of subpixel 1 序言 图像处理技术基本可以分成两大类:模拟图像处 理(Analog Image Processing )和数字图像处理(Dig -ital Image Processing )。数字图像处理,通俗地讲就是利用计算机对图像进行处理。因此也称之为计算机图像处理(Computer Image Processing )。其优点是处理精度高,处理内容丰富,可进行复杂的非线性处理,有灵活的变通能力,一般来说只要改变软件就可以改变处理内容。存在的问题主要在于处理速度,特别是进行复杂的处理更是如此。数字图像处理概括地说主要包括如下几项内容:几何处理(Geometrical Pro -cessing )、算术处理(Arithmetic Processing )、图像增强(Image Enhancement )、图像复原(Image Restora -tion )、图像重建(Image Reconstruction )、图像编码(Image Encoding )、图像识别(Im age Recognition )、图像理解(Image Understanding )。图像处理技术的发展涉及越来越多的基础理论知识,雄厚的数理基础及相关的边缘学科知识对图像处理科学的发展有越来越大的影响。总之,图像处理科学是一项涉及多学科的综合性科学。 2 边缘检测 所谓边缘应是物体的轮廓或物体不同表面之间的交界在图像中的反映。它的形成是由于物体的材料不同或表面的朝向不同,引起在图像中的边缘处存在明暗、色彩、纹理的变化。因此反过来在图像中检查不 同灰度、色彩等特性区域的交界处就可得到边缘。边缘轮廓是人类识别物体形状的重要因素,也是图像处理中重要的处理对象。 图1 边缘和灰度值模型示意图 如上所述,边缘常常发生在灰度突然变化的部 位,如图1(a )所示,两边为不同的灰度级g 1、g 2,则x 0处为边缘。但实际上由于物体表面交界处灰度常常缓慢变化,在图像中表现为边缘是有一定宽度的,如图1(b )所示,而且由于物体表面的曲折变化加上噪声干扰,边缘时常显得模糊不清,这给边缘的检测带来一定的困难。另外,有的物体本身为条状的区域,例如河流、道路或物体表面的裂缝,它们的边缘表现为狭长的平行线(1~2个像元宽度),如图1(c )所示,而且两边灰度相同或相近,因此检查的方法也有所不同。 边缘检测主要采用各种算法来发现、强化图像中那些可能存在边缘的像素点。边缘检测算子可分为微分(梯度)法、模板匹配法和区域拟合法3种基本方法。对于边缘检测影响较大的是图像中的噪声、退化、模糊等因素,这些都需要特殊的算法来解决。 3 滤波 当图像输入到计算机的时候,由于输入转换器件(如光敏器件、A /D 转换器等性质的差别)及周围环 DOI :10.16526/j .cn ki .11-4762/tp .2002.09.022

图像处理技术原理及其在生活中的应用探讨

图像处理技术原理及其在生活中的应用探讨 摘要在社会生活实践中,图像处理技术获得了广泛的应用。这种技术之所以可以得到广泛应用,与其极强的功能所分不开的。在计算机算法不断改善的过程中,图像处理技术的发展前景是非常广阔的。笔者对图像处理技术的原理进行了分析,并其对在生活中的应用进行了探究[1]。 关键词图像处理技术原理;生活;应用 1 图像处理技术的原理分析 所谓的图像处理技术,就是通过计算机技术以及相关的技术来对图像进行处理,从而使图像更好地为我们所利用的一种技术。在这个过程中,需要运用到几个技术要点。第一个就是使图像进行转换,从而得到计算机容易识别的矩阵,这种矩阵被称为是“数字矩阵”。这样得到的矩阵更容易被计算机所存储。第二就是通过多种算法来实现对计算机所存储的图像进行有关处理,其中用到的常用算法就有基于人眼视觉特性的阈值算法、具有去噪功能的图像增强算法等。第三就是在进行了一些技术性的处理,然后获取图像信息。通过中国知网、万方数据库等平台所查阅到的图像类型相关资料可知,图像的类型主要可以分为两大类,一类是数字化图像,另一类是模拟图像。前者不仅处理便捷,而且精度较高,能够适应现代社会的发展要求,后者在现实生活中的应用更为常见,比如在相机图片中的应用。模拟图像输出较为简单,灵活性和精度不太高,因此其使用的限制性较大[2]。 2 图像处理技术原理在生活中的应用探讨 2.1 图像处理技术原理在安全防范中的应用 在安全防范监控系统不断发展的过程中,系统从模拟向数字的方向发展,这跟人们要求图像的精准度越来越高有关。在安防领域,图像处理技术如果能够得到很好的利用,那么就可以实现对图像的去噪声处理,对失真的图像进行矫正处理。在公安部门破案的过程中,有时会根据犯罪现场的指纹特征来对视频采集参数进行调节,比如色彩补偿就是一种很好的调節方法,这样方便公安部门更快地破案。尽管现在的监控系统越来越完善,但是如果遇到暴风暴雨和雾霾或者光线较弱的天气,那么监控得到的视频图像往往还是比较模糊的,对于这些模糊的图像,可以通过图像增强技术进行一些处理,从而为后续的公安部门调查和取证提供便利,模糊图像处理技术这时就排上了用场[3]。 2.2 图像处理技术原理在娱乐休闲领域的应用 在娱乐休闲领域,图像处理技术原理主要的应用场合就是平时我们利用手机或数码相机摄影以及电影特效制作等场合。在数码相机出现以前,图像只能使用传统相机通过胶片的形式保存。在数码相机出现之后,人们就可以短时间内对相

数字图像处理技术的应用与发展

郑州航空工业管理学院 2013 - 2014 学年第2 学期 《信息管理前沿讲座》(双语I) 课程论文 题目数字图像处理技术的应用与发展 专业信息管理与信息系统班级1304972 姓名学号 任课教师职称副教授 二О一四年五月三十日

数字图像处理技术的应用与发展 130497227王琼菲 摘要数字图像处理是将图像信号转换成数字信号并利用计算机对其进行处理的过程。文章简述了数字图像处理技术的主要特点和优点、以及数字图像处理的过程、数字图像处理技术的应用、数字图像处理技术的研究方向和内容,并根据最新进展,阐述了数字图像处理技术5个主要研究方面的最新热点,最后总结了数字图像处理技术领域中面临的主要发展领域和未来发展方向。 关键词数字图像处理,采集,识别,应用 Application and Development of the Digital Image Processing Technology 130497227 Wang Qiongfei A bstract D igital image processing is to process the image signal into digital signal and processed by computer to its。This paper briefly introduces the digital image processing technology, and the main characteristics and advantages of digital image processing, the application of digital image processing technology, the digital image processing technology research direction and content, and according to the latest advances in digital image processing technology, introduces 5 new hot main research aspects, summarizes the main development faces in the field of technology in the field of digital image processing and the development direction in the future。Key words Digital image processing, Collection, Identification, Application

图像处理技术及其应用

图像处理技术及其应用 姓名: (班级:学号:) 【摘要】图像处理技术的研究和应用越来越收到社会发展的影响,并以自身的技术特点反过来影响整个社会技术的进步。本文主要简单概括了数字图像处理技术近期的发展及应用现状,列举了数字图像处理技术的主要优点和制约其发展的因素,同时设想了图像处理技术在未来的应用和发展。 【关键字】图像处理;发展;技术应用 1 引言 计算机图像处理技术是在20世纪80年代后期,随着计算机技术的发展应运而生的一门综合技术。图像处理就是利用计算机、摄像机及其它有关数字技术,对图像施加某种运算和处理,使图像更加清晰,以提取某些特定的信息,从而达到特定目的的技术。随着多媒体技术和网络技术的快速发展,数字图像处理已经广泛应用到了人类社会生活的各个方面,如:遥感,工业检测,医学,气象,通信,侦查,智能机器人等。无论在哪个领域中,人们喜欢采用图像的方式来描述和表达事物的特性与逻辑关系,因此,数字图像处理技术的发展及对其的要求就越来显得重要。 2 图像处理技术发展现况 进入21世纪,随着计算机技术的迅猛发展和相关理论的不断完善,数字图像处理技术在许多应用领域受到广泛重视并取得了重大的开拓性成就。随着计算机技术和人工智能、思维科学研究的迅速发展,数字图像处理向更高、更深层次发展。人们已开始研究如何用计算机系统解释图像,实现类似人类视觉系统理解外部世界,这被称为图像理解或计算机视觉。 从图像变换方面来讲,目前新兴研究的小波变换在时域和频域中都具有良好的局部化特性,它在图像处理中也有着广泛而有效的应用;而图像增强和复原图像增强和复原的目的是为了提高图像的质量,如去除噪声,提高图像的清晰度等,目前主要在指纹图像增强处理技术,医学影像学方面有显著的成果。这项技术使得各自图像的空间分辨率和对比度有了更大的提高,而最新的医学图像融合则是指对医学影像信息如CT、MRI、SPECT和PET所得的图像,利用计算机技术将它们综合在一起,实现多信息的同步可视化,对多种医学影像起到互补的作用。图像分割图像分割是数字图像处理中的关键技术之一。图像分割是将图像中有意义的特征部分提取出来,这是进一步进行图像识别、分析和理解的基础。虽然目前已研究出不少边缘提取、区域分割的方法,但还没有一种普遍适用于各种图像的有效方法。因此,对图像分割的研究还在不断深入之中,是目前图像处理中研究的热点之一。 图像描述图像描述是图像识别和理解的必要前提。作为最简单的二值图像可采用其几何特性描述物体的特性,一般图像的描述方法采用二维形状描述,它有边界描述和区域描述两类方法。对于特殊的纹理图像可采用二维纹理特征描述。随着图像处理研究的深入发展,已经开始进行三维物体描述的研究,提出了体积描述、表面描述、广义圆柱体描述等方法;图像分类(识别)图像分类(识别)属于模式识别的范畴,其主要内容是图像经过某些预处理(增强、复原、压缩)后,进行图像分割和特征提取,从而进行判决分类。近年来新发展起来的模糊模式识别和人工神经网络模式分类在图像识别中也越来越受到重视。 3 图像处理技术应用现状 图像是人类获取和交换信息的主要来源,因此,图像处理的应用领域必然涉及到人类生活和工作的方方面面。随着人类活动范围的不断扩大,图像处理的应用领域也将随之不断扩大。 3.1航天和航空技术方面的应用 数字图像处理技术在航天和航空技术方面的应用,许多国家每天派出很多侦察飞

图像识别技术发展状况及前景

医学图像配准技术 罗述谦综述 首都医科大学生物医学工程系(100054) 吕维雪审 浙江大学生物医学工程研究所(310027) 摘要医学图像配准是医学图像分析的基本课题,具有重要理论研究和临床应用价 值。本文较全面地介绍了医学图像配准的概念、分类、配准原理、主要的配准技术及评 估方法。 关键词医学图像配准多模 1 医学图像配准的概念 在做医学图像分析时,经常要将同一患者的几幅图像放在一起分析,从而得到该患者的多方面的综合信息,提高医学诊断和治疗的水平。对几幅不同的图像作定量分析,首先要解决这几幅图像的严格对齐问题,这就是我们所说的图像的配准。 医学图像配准是指对于一幅医学图像寻求一种(或一系列)空间变换,使它与另一幅医学图像上的对应点达到空间上的一致。这种一致是指人体上的同一解剖点在两张匹配图像上有相的空间位置。配准的结果应使两幅图像上所有的解剖点,或至少是所有具有诊断意义的点及手术感兴趣的点都达到匹配。 医学图像配准技术是90年代才发展起来的医学图像处理的一个重要分支。涉及“配准”的技术名词除registration外,mapping、matching、co-registration、integration、align-ment和fusion 等说法也经常使用。从多数文章的内容看,mapping偏重于空间映射;fu-sion指图像融合,即不仅包括配准,而且包括数据集成后的图像显示。虽然在成像过程之前也可以采取一些措施减小由身体移动等因素引起的空间位置误差,提高配准精度(称作数据获取前的配准preacquisition),但医学图像配准技术主要讨论的是数据获取后的(post-acquisition)配准,也称作回顾式配准(retrospective registration)。当前,国际上关于医学图像配准的研究集中在断层扫描图像( tomographic images,例如CT、MRI、SPECT、PET等)及时序图像(time seriesimages,例如fMRI及4D心动图像)的配准问题。 2 医学图像基本变换 对于在不同时间或/和不同条件下获取的两幅图像I1(x1,y1,z1)和I2(x2,y2,z2)配准,就是寻找一个映射关系P:(x1,y1,z1) (x2,y2,z2),使I1的每一个点在I2上都有唯一的点与之相对应。并且这两点应对应同一解剖位置。映射关系P表现为一组连续的空间变换。常用的空间几何变换有刚体变换(Rigid body transformation)、仿射变换(Affine transformation)、投影变换(Projec-tive transformation)和非线性变换(Nonlin-ear transformation)。 (1)刚体变换: 所谓刚体,是指物体内部任意两点间的距离保持不变。例如,可将人脑看作是一个刚体。 处理人脑图像,对不同方向成像的图像配准常使用刚体变换。刚体变换可以分解为旋转和平移:P(x)=Ax+b(1) x=(x,y,z)是像素的空间位置;A是3×3的旋转矩阵,b是3×1的平移向量。

数字图像处理试卷及答案-百度文库

1、列举数字图像处理的三个应用领域 2、存储一幅大小为10241024,256个灰度级的图像,需要 8M bit。 3、亮度鉴别实验表明,韦伯比越大,则亮度鉴别能力越差。 4、直方图均衡化适用于增强直方图呈分布的图像。 5、依据图像的保真度,图像压缩可分为 6、图像压缩是建立在图像存在编码冗余、像素间冗余、心理视觉冗余 三种冗余基础上。 7、对于彩色图像,通常用以区别颜色的特性是、亮度。 8、对于拉普拉斯算子运算过程中图像出现负值的情况,写出一种标定方法:(g(x,y)mgin)*255gm/(g ax 二、选择题(每题2分,共20分) 1、采用幂次变换进行灰度变换时,当幂次取大于1时,该变换是针对如下哪一类图像进行增强。( B ) A 图像整体偏暗 B 图像整体偏亮 C图像细节淹没在暗背景中 D图像同时存在过亮和过暗背景 2、图像灰度方差说明了图像哪一个属性。( B ) A 平均灰度 B 图像对比度 C 图像整体亮度 D图像细节 3、计算机显示器主要采用哪一种彩色模型( A ) A、RGB B、CMY或CMYK C、HSI D、HSV T4、采用模板[-1 1]主要检测( A )方向的边缘。 A.水平 B.45 C.垂直 D.135 5、下列算法中属于图象锐化处理的是:( C ) A.低通滤波 B.加权平均法 C.高通滤波 D. 中值滤波 6、维纳滤波器通常用于( C ) A、去噪 B、减小图像动态范围 C、复原图像 D、平滑图像 7、彩色图像增强时,RGB彩色模型。 A. 直方图均衡化 B. 同态滤波 C. 加权均值滤波 D. 中值滤波 8、__B__滤波器在对图像复原过程中需要计算噪声功率谱和图像功率谱。 A. 逆滤波 B. 维纳滤波 C. 约束最小二乘滤波 D. 同态滤波 9、高通滤波后的图像通常较暗,为改善这种情况,将高通滤波器的转移函数加上一常数量以便引入一些低频分量。这样的滤波器叫 B 。 A. 巴特沃斯高通滤波器 B. 高频提升滤波器 C. 高频加强滤波器 D. 理想高通滤波器

图像识别技术

伴随着通信技术与信息处理技术的迅猛发展,越来越多的纸质文档通过数字采集设备转换成文本图像,从而使文本图像数据能够快捷的在网络、卫星、传真通信信道中传输,因此,文本图像已逐渐成一个重要的信息来源。但是,现有的文本图像处理系统自动化程度低,且通用性不高,无法满足文本图像处理广泛性与实时性的要求。因此,研究如何对文本图像进行分析与处理,以便高效、快捷的获取文本图像的信息,是一项十分有意义的研究课题。本文在总结已有研究成果的基础上对文本图像的识别检索、预处理、版面分析和表格图像识别展开研究。所做的主要工作如下:1.依据图像的灰度分布和结构特征差异,对基于图像信息度量的文本图像识别检索算法进行改进,构造一种基于信息度量与Radon变换的文本图像识别检索算法。该算法综合利用文本图像与连续色调】图像的灰度分布与结构特征差异进行文本图像的识别检索。实验结果表明,所构造算法可有效降低文本图像识别检索的误识率。2.对基于Hough变换的文本图像倾斜检 图像识别,是利用计算机对图像进行处理、分析和理解,以识别各种不同模 式的目标和对像的技术。 图像识别可能是以图像的主要特征为基础的。每个图像都有它的特征,如字 母A有个尖,P有个圈、而Y的中心有个锐角等。对图像识别时眼动的研究表明, 视线总是集中在图像的主要特征上,也就是集中在图像轮廓曲度最大或轮廓方向 突然改变的地方,这些地方的信息量最大。由此可见,在图像识别过程中,知觉 机制必须排除输入的多余信息,抽出关键的信息。 图像识别的目的在于用计算机自动处理图像信息,以代替人去完成图像分类 及辨识的任务。数字图像处理与识别技术是模式识别领域一个重要的研究方向, 近几十年来,图像识别技术取得了深入和迅速的发展,并广泛应用于图像遥感、机 器人视觉、生物医学、地质勘探等多个领域。 随着图像识别技术在多领域的发展,由其在计算机视觉和图像处理研究中,已经取得了一定的研究成果。Mallat在小波变换中滤波器的设计、Belhumeur在Fisher变换中的识别模型和Largrange优化方式建立支持向量机。本文在总结上述研究成果的基础上,首先对摄像头采集的数据进行了处理,完成JPEG的编码,详细讨论了JPEG图像解码的过程并实现了其算法。

数字图像处理学习报告

数字图像处理学习报告 在这一学期,我选修了《数字图像处理基础》这门课程,同时,老师还讲授了一些视频处理的知识。在这里,梳理一下这学期学到的知识,并提出一些我对这门课程的建议。 图像处理是指对图像信息进行加工,从而满足人类的心理、视觉或者应用的需求的一种行为。图像处理方法一般有数字法和光学法两种,其中数字法的优势很明显,已经被应用到了很多领域中,相信随着科学技术的发展,其应用空间将会更加广泛。数字图像处理又称为计算机图像处理,它是指将图像信号转换成数字信号并利用计算机对其进行处理的过程.数字图像处理是从20世纪60年代以来随着计算机技术和VLSL的发展而产生、发展和不断成熟起来的一个新兴技术领域。数字图像处理技术其实就是利用各种数字硬件与计算机,对图像信息通过转换而得到的电信号进行相应的数学运算,例如图像去噪、图像分割、提取特征、图像增强、图像复原等,以便提高图像的实用性。其特点是处理精度比较高,并且能够对处理软件进行改进来优化处理效果,操作比较方便,但是由于数字图像需要处理的数据量一般很大,因此处理速度有待提高。目前,随着计算机技术的不断发展,计算机的运算速度得到了很大程度的提高。在短短的历史中,它却广泛应用于几乎所有与成像有关的领域,在理论上和实际应用上都取得了巨大的成就。 1. 数字图像处理需用到的关键技术 由于数字图像处理的方便性和灵活性,因此数字图像处理技术已经成为了图像处理领域中的主流。数字图像处理技术主要涉及到的关键技术有:图像的采集与数字化、图像的编码、图像的增强、图像恢复、图像分割、图像分析等。 图像的采集与数字化:就是通过量化和取样将一个自然图像转换为计算机能够处理的数字形式。 图像编码:图像编码的目的主要是来压缩图像的信息量,以便能够满足存储和传输的要 求。 图像的增强:图像的增强其主要目的是使图像变得清晰或者将其变换为机器能够很容易 分析的形式,图像增强方法一般有:直方图处理、灰度等级、伪彩色处理、边缘锐化、干扰抵制。 图像的恢复:图像恢复的目的是减少或除去在获得图像的过程中因为各种原因而产生的 退化,可能是由于光学系统的离焦或像差、被摄物与摄像系统两者之间的相对运动、光学或电子系统的噪声与介于被摄像物跟摄像系统之间的大气湍流等等。 图像的分割:图像分割是将图像划分为一些互相不重叠的区域,其中每一个区域都是像素的一个连续集,通常采用区域法或者寻求区域边界的境界法。 图像分析:图像分析是指从图像中抽取某些有用的信息、数据或度量,其目的主要是想得到某种数值结果。图像分析的内容跟人工智能、模式识别的研究领域有一定的交叉。

图像处理技术的应用论文

图像处理技术的应用先展示一下自己用Photoshop处理的图片(做的不好望见谅)

摘要:图像处理技术的研究和应用越来越收到社会发展的影响,并以自身的技术特点反过来影响整个社会技术的进步。本文主要简单概括了数字图像处理技术近期的发展及应用现状,列举了数字图像处理技术的主要优点和制约其发展的因素,同时设想了图像处理技术在未来的应用和发展。 关键字:图像处理发展技术应用 1.概述 1.1图像的概念 图像包含了它所表达的物体的描述信息。我们生活在一个信息时代,科学研究和统计表明,人类从外界获得的信息约有百分之七十来自视觉系统,也就是从图像中获得,即我们平常所熟知的照片,绘画,动画。视像等。 1.2图像处理技术 图像处理技术着重强调在图像之间进行的变换,主要目标是要对图像进行各种加工以改善图像的视觉效果并为其后的目标自动识别打基础,或对图像进行压缩编码以减少图像存储所需要的空间或图像传输所需的时间。图像处理是比较低层的操作,它主要在图像像素级上进行处理,处理的数据量非常大。 1.3优点分析 1.再现性好。数字图像处理与模拟图像处理的根本不同在于,它不会因图像的存储、传输或复制等一系列变换操作而导致图像质量的退化。 2.处理精度高。按目前的技术,几乎可将一幅模拟图像数字化为任意大小的二维数组,这主要取决于图像数字化设备的能力。现代扫描仪可以把每个像素的灰度等级量化为16位甚至更高,这意味着图像的数字化精度可以达到满足任一应用需求。 3.适用面宽。图像可以来自多种信息源,它们可以是可见光图像,也可以是不可见的波谱图像(例如X射线图像、射线图像、超声波图像或红外图像等)。从图像反映的客观实体尺度看,可以小到电子显微镜图像,大到航空照片、遥感图像甚至天文望远镜图像。即只要针对不同的图像信息源,采取相应的图像信息采集措施,图像的数字处理方法适用于任何一种图像。 4.灵活性高。图像处理大体上可分为图像的像质改善、图像分析和图像重建三大部分,每一部分均包含丰富的内容。而数字图像处理不仅能完成线性运算,而且能实现非线性处理,即凡是可以用数学公式或逻辑关系来表达的一切运算均可用数字图像处理实现。 2.应用领域 2.1图像技术应用领域

浅析人工智能中的图像识别技术

浅析人工智能中的图像识别技术 本文从网络收集而来,上传到平台为了帮到更多的人,如果您需要使用本文档,请点击下载按钮下载本文档(有偿下载),另外祝您生活愉快,工作顺利,万事如意! 图像识别技术是信息时代的一门重要的技术,其产生目的是为了让计算机代替人类去处理大量的物理信息。随着计算机技术的发展,人类对图像识别技术的认识越来越深刻。图像识别技术的过程分为信息的获取、预处理、特征抽取和选择、分类器设计和分类决策。文章简单分析了图像识别技术的引入、其技术原理以及模式识别等,之后介绍了神经网络的图像识别技术和非线性降维的图像识别技术及图像识别技术的应用。从中可以总结出图像处理技术的应用广泛,人类的生活将无法离开图像识别技术,研究图像识别技术具有重大意义。 1 图像识别技术的引入 图像识别是人工智能科技的一个重要领域。图像识别的发展经历了三个阶段:文字识别、数字图像处理与识别、物体识别。图像识别,顾名思义,就是对

图像做出各种处理、分析,最终识别我们所要研究的目标。今天所指的图像识别并不仅仅是用人类的肉眼,而是借助计算机技术进行识别。虽然人类的识别能力很强大,但是对于高速发展的社会,人类自身识别能力已经满足不了我们的需求,于是就产生了基于计算机的图像识别技术。这就像人类研究生物细胞,完全靠肉眼观察细胞是不现实的,这样自然就产生了显微镜等用于精确观测的仪器。通常一个领域有固有技术无法解决的需求时,就会产生相应的新技术。图像识别技术也是如此,此技术的产生就是为了让计算机代替人类去处理大量的物理信息,解决人类无法识别或者识别率特别低的信息。 图像识别技术原理 其实,图像识别技术背后的原理并不是很难,只是其要处理的信息比较繁琐。计算机的任何处理技术都不是凭空产生的,它都是学者们从生活实践中得到启发而利用程序将其模拟实现的。计算机的图像识别技术和人类的图像识别在原理上并没有本质的区别,只是机器缺少人类在感觉与视觉差上的影响罢了。人类的图像识别也不单单是凭借整个图像存储在脑海中

数字图像处理的应用

数字图像处理技术的应用研究 图像处理也就是按照人们视觉、心理或实际应用的需要,对 图像信息进行加工修改的过程,在不同的时期、不同的领域往往 会采用不同的图像处理技巧。数字图像处理技术是伴随着计算机 信息功能的日益强大以及人们对高精度图像的需求而产生的,随 着社会的发展,尤其是计算机信息技术的进步,数字图像处理技 术被广泛应用于各个领域,其重要性变得日益突出。 一、数字图像处理技术的概念内涵 当前,我国通常采用的图像处理技术主要有两种,即光学处 理法和数字(电子)处理法。前者产生的时间较早,从最开始的 光学滤波技术到现在的激光全息技术,无论是理论研究,还是应 用技巧,光学图像处理法已日臻完善。但其图像处理精度低、稳 定性差以及操作不便的特点极大地限制了其应用领域拓展,在这 种情况下,数字图像处理技术便应运而生。 数字图像处理,也即是Digital Image Processing,产生于 20世纪50年代,是指人们采用计算机及其它数字硬件设备,对图 像信息转换而来的电信号根据数学运算的方式,进行增强、提取、复原、分割以及去除噪音等处理的方法和技术,以此提高图像的实用性,因此,该技术的产生与发展建立在计算机运用、离算数学理论的产生与完善以及社会诸多领域的需求之上的。其最大特点是不仅图像处理精度高,而且可以通过改进硬件系统配置和优化软件系统功能的方式来提高图像处理效果,一切以计算机运行为基础,操作极为方便。最初,由于数字图像处理技术的数据需求量大,处理速度慢,极大地限制了其应用领域,但随着计算机技术的快速发展,尤其是运算速度的提升,这一瓶颈早已被突破。 二、数字图像处理技术的功能内容分析 (一)增强图像的视觉效果。在某些特殊领域,图像在传输与 转换的过程中容易造成信息的丢失,从而形成失真现象,比如航天拍摄的图片在传回地球的过程中,由于光学系统、大气流、空气介质等原因造成图像模糊;在图像扫描、采样、量化的过程中,所形成的噪音污染等等。我们可以采用数字图像处理技术,一方面突出重要信息而衰减次要信息;另一方面根据失真原因,补偿丢失的信息因素,从而使改善后的图像效果尽可能的接近原始图像。 (二)图像的重建功能。随着电子计算机体层摄影技术的发 展,图像的重建成为一种新兴的数字图像处理技术,它主要是对 目标对象进行观察和测量,重新构建出图像中的大量信息的直观 显示,从而在计算机模拟系统中进行二维或者三维的图像处理, 这也是对特殊实体进行图像回归的过程。 (三)模式识别功能。模式识别也是数字图像处理技术的一

图像识别技术报告

图像识别技术 课程教师:桑爱军老师 报告组成员: 五里雾

一、图像识别简介 图像识别是指图形刺激作用于感觉器官,人们辨认出它是经验过的某一图形的过程,也叫图像再认。在图像识别中,既要有当时进入感官的信息,也要有记忆中存储的信息。只有通过存储的信息与当前的信息进行比较的加工过程,才能实现对图像的再认。 人的图像识别能力是很强的。图像距离的改变或图像在感觉器官上作用位置的改变,都会造成图像在视网膜上的大小和形状的改变。即使在这种情况下,人们仍然可以认出他们过去知觉过的图像。甚至图像识别可以不受感觉通道的限制。例如,人可以用眼看字,当别人在他背上写字时,他也可认出这个字来。 图像识别技术可能是以图像的主要特征为基础的。每个图像都有它的特征,如字母A有个尖,P有个圈、而Y的中心有个锐角等。对图像识别时眼动的研究表明,视线总是集中在图像的主要特征上,也就是集中在图像轮廓曲度最大或轮廓方向突然改变的地方,这些地方的信息量最大。而且眼睛的扫描路线也总是依次从一个特征转到另一个特征上。由此可见,在图像识别过程中,知觉机制必须排除输入的多余信息,抽出关键的信息。同时,在大脑里必定有一个负责整合信息的机制,它能把分阶段获得的信息整理成一个完整的知觉映象。

在人类图像识别系统中,对复杂图像的识别往往要通过不同层次的信息加工才能实现。对于熟悉的图形,由于掌握了它的主要特征,就会把它当作一个单元来识别,而不再注意它的细节了。这种由孤立的单元材料组成的整体单位叫做组块,每一个组块是同时被感知的。在文字材料的识别中,人们不仅可以把一个汉字的笔划或偏旁等单元组成一个组块,而且能把经常在一起出现的字或词组成组块单位来加以识别。 图像识别技术是人工智能的一个重要领域。为了编制模拟人类图像识别活动的计算机程序,人们提出了不同的图像识别模型。例如模板匹配模型。这种模型认为,识别某个图像,必须在过去的经验中有这个图像的记忆模式,又叫模板。当前的刺激如果能与大脑中的模板相匹配,这个图像也就被识别了。例如有一个字母A,如果在脑中有个A模板,字母A的大小、方位、形状都与这个A模板完全一致,字母A就被识别了。这个模型简单明了,也容易得到实际应用。但这种模型强调图像必须与脑中的模板完全符合才能加以识别,而事实上人不仅能识别与脑中的模板完全一致的图像,也能识别与模板不完全一致的图像。例如,人们不仅能识别某一个具体的字母A,也能识别印刷体的、手写体的、方向不正、大小不同的各种字母A。同时,人能识别的图像是大量的,如果所识别的每一个图像在脑中都有一个相应的模板,也是不可能的。 为了解决模板匹配模型存在的问题,格式塔心理学家又提出了一个原型匹配模型。这种模型认为,在长时记忆中存储的并不是所要识

图像处理与识别论文.doc

辽宁工业大学 关于图像识别技术的论述 --图像处理与识别结课论文 学院:电子与信息工程学院 班级:电子102班 学号:100404054 姓名:包媛

关于图像识别技术的论述 随着科学技术的不断发展,计算机应用领域的不断开拓,一种全新的图像处理方法应运而生,这就是数字图像处理技术,即利用计算机设备将图像转变成数字信息来进行保存、处理、传输和重现。数字图像识别技术则是从数字图像处理技术中延伸出来的一个重要的研究方向。目前,数字图像处理与识别的应用范围越来越广。但就目前的水平而言,计算机对外部的感知能力还比较薄弱,还需要投入大量人力、物力从事数字图像处理与识别的理论和应用的研究。图像处理与识别的应用有很多种,如指纹识别,条码识别,人脸识别,车牌识别,残损纸币识别等等在生活,生产中,和警方侦破案件中都有很多很重要的应用。数字图像处理方法的分类以及数字图像处理系统的基本部件,“数字图像处理的基本方法”、“人脸识别”及“残损纸币识别”进行详细叙述。一些数字图像处理的基本方法,包括图像增强与图像检测两部分。人脸识别”当中,可采用SN-tuple神经网络的方法进行识别,同时网络参数的变化对识别率也会有所影响影响。对于“残损纸币识别”,可以选择边缘检测、Fisher判别和神经网络三种方法进行识别。其中,边缘检测需要区分纸币的面值和正反,之后方可识别,但性能较为稳定,识别效果较好;Fisher判别无需区分纸币的面值和正反,但识别率受样本选择的影响,不同样本,识别率有可能相差较大;神经网络方法也可不区分纸币的面值与正反,但识别率较低,若区分面值与正反,则可获得较高的识别率。下面分别对车牌识别,纸币、票据识别和手势识别做陈述。 随着我国国民经济的迅速增长,机动车的规模与流量大幅增加,随之而来的管理问题也日益严重。因此迫切需要采用高科技手段,对这些违法违章车辆牌照进行登记,汽车牌照识别系统的出现成为了交通管制必不可少的有力武器。汽车牌照的识别系统在公共安全,交通管理,及相关军事部门有着重要的应用价值。它是一个基于数字图像处理和字符识别的智能化交通管理系统,该系统先通过图像采集,再对图像进行处理以克服图像干扰,改善识别效果,而后进行二值化,归一化等处理,最后进行识别。车牌识别系统使得车辆管理更趋于数字化,网络化,大大提高了交通管理的有效性与方便性。车牌识别系统作为整个智能交通系统的一部分,其重要性不言而喻。 车牌识别是一项涉及到数字图像处理、计算机视觉、模式识别、人工智能等多门学科的技术,它在交通监视和控制中占有很重要的地位,已成为现代交通工程领域中研究的重点和热点之一。该项技术应用前景广泛,例如用在自动收费系统、不停车缴费、失窃车辆的查寻、停车场车辆管理、特殊部门车辆的出入控制

浅谈计算机图像处理技术的应用

浅谈计算机图像处理技术的应用 摘要:随着人类正加快步入信息时代,使得计算机技术得到了飞速发展。计算机技术的广泛应用,使人们越来越多地开始将将先进的计算机技术应用到我们捕捉到的图像上,并希望通过计算机图像处理技术的应用,获得理想的效果并提取我们想要的信息。相信在先进图像处理技术发展的推动下,计算机图像处理技术的应用也将渗透到社会的各个领域。 关键词:计算机;图像处理技术;应用 The Application of Computer Image Processing Technology Abstract:As human being accelerated into the information age,making computer technology has been rapid development.Extensive application of computer technology,more and more people began to be advanced computer technology to our captured image,and that through computer image processing technology,to obtain the desired results and extract the informat ion we want.I believe the development of advanced image processing technology,driven by the application of computer image processing technology will permeate all spheres of society. Keywords:Computer;Image processing technology;Application

完整版数字图像处理简答题及答案

1、数字图像处理的主要研究内容包含很多方面,请列出并简述其中的4种。 ①图像数字化:将一幅图像以数字的形式表示。主要包括采样和量化两个过程。②图像增强:将一幅图像中的有用信息进行增强,同时对其无用信息进行抑制,提高图像的可观察性。③图像的几何变换:改变图像的大小或形状。④图像变换:通过数学映射的方法,将空域的图像信息转换到频域、时频域等空间上进行分析。⑤图像识别与理解:通过对图像中各种不同的物体特征进行定量化描述后,将其所期望获得的目标物进行提取,并且对所提取的目标物进行一定的定量分析。如要从一幅照片上确定是否包含某个犯罪分子的人脸信息,就需要先将照片上的人脸检测出来,进而将检测出来的人脸区域进行分析,确定其是否是该犯罪分子。 4、简述数字图像处理的至少4种应用。 ①在遥感中,比如土地测绘、气象监测、资源调查、环境污染监测等方面。②在医学中,比如B 超、CT机等方面。③在通信中,比如可视电话、会议电视、传真等方面。④在工业生产的质量检测中,比如对食品包装出厂前的质量检查、对机械制品质量的监控和筛选等方面。⑤在安全保障、公安方面,比如出入口控制、指纹档案、交通管理等。 5、简述图像几何变换与图像变换的区别。 ①图像的几何变换:改变图像的大小或形状。比如图像的平移、旋转、放大、缩小等, 这些方法在图像配准中使用较多。②图像变换:通过数学映射的方法,将空域的图像信息转换到频域、时频域等空间上进行分析。比如傅里叶变换、小波变换等。 6、图像的数字化包含哪些步骤?简述这些步骤。 图像的数字化主要包含采样、量化两个过程。采样是将空域上连续的图像变换成离散采样点集合,是对空间的离散化。经过采样之后得到的二维离散信号的最小单位是像素。量化就是把采样点上表示亮暗信息的连续量离散化后,用数值表示出来,是对亮度大小的离散化。经过采样和量化后,数字图像可以用整数阵列的形式来描述。 7、图像量化时,如果量化级比较小会出现什么现象?为什么? 如果量化级数过小,会出现伪轮廓现象。量化过程是将连续变化的颜色划分到有限个级 别中,必然会导致颜色信息损失。当量化级别达到一定数量时,人眼感觉不到颜色信息的丢失。当量化级数过小时,图像灰度分辨率就会降低,颜色层次就会欠丰富,不同的颜色之间 过度就会变得突然,可能会导致伪轮廓现象。 8、二值图像是指每个像素不是黑,就是白,其灰度值没有中间过渡的图像。这种图像又称 为黑白图像。二值图像的矩阵取值非常简单,每个像素的值要么是1,要么是0,具有数据量小的特点。 彩色图像是根据三原色成像原理来实现对自然界中的色彩描述的。红、绿、蓝这三种基色的的灰度分别用256级表示,三基色之间不同的灰度组合可以形成不同的颜色。 灰度图像是指每个像素的信息由一个量化后的灰度级来描述的数字图像,灰度图像中不 包含彩色信息。标准灰度图像中每个像素的灰度值是0-255之间的一个值,灰度级数为256级。 11、简述直角坐标系中图像旋转的过程。 (1)计算旋转后行、列坐标的最大值和最小值。(2)根据最大值和最小值,进行画布扩大,原则是以最小的面积承载全部的图像信息。(3)计算行、列坐标的平移量。(4)利用图像旋转公式计算每个像素点旋转后的位置。(5)对于空穴问题,进行填充。 12、如何解决直角坐标系中图像旋转过程中产生的图像空穴问题? (1)对于空穴问题,需要进行填充。可以采用插值的方法来解决填充问题。 13、举例说明使用邻近行插值法进行空穴填充的过程。 邻近插值法就是将判断为空穴位置上的像素值用其相邻行(或列)的像素值来填充。例如对 f23=f22. 进行填充时,使用相邻行的像素值来填充。即:f23于下图中的空穴点.

相关文档
最新文档