数字图像与模式识别

数字图像与模式识别
数字图像与模式识别

实验一 MATLAB图像处理基本操作

一、实验目的

1.掌握MATLAB语言中图象数据与信息的读取方法;

2.掌握图像灰度调整

二、实验要求

1.打开一个BMP文件

2. 将其局部区域的灰度值进行改变

3. 另存为一个新的BMP文件

4. 要求显示出原BMP图像和新BMP图像

三、实验源程序

clear

I=imread('bit.bmp'); %读入原图像

subplot(1,2,1);

imshow(I); %显示原始图像

title('原始BMP图像');

J=imadjust(I,[0.3,0.7],[]); %调整图像灰度值

imwrite(J,'newbit.bmp'); %另存为新图像

subplot(1,2,2);

imshow(J); %显示局部灰度改变后的图像

title('局部灰度改变后的图像');

四、实验结果

五、实验总结

1.掌握MATLAB基本图像读入读出操作,以及对图像灰度改变的操作。

2.初步熟悉了MATLAB工具软件对图像处理的应用。

实验二图像低通、高通滤波

一、实验内容

1.对图像进行傅里叶变换,显示其频谱图

2.用理想滤波器对图像进行低通、高通滤波

3.编程实现图像DCT高低通滤波,并与傅里叶的结果比较。

4.尝试傅里叶压缩

二、实验目的

学会用Matlab软件对图像傅里叶变换;对图像进行低、高通滤波,观察频谱和图像变化。

三、实验部分源程序

1.高通、低通滤波

d0=30; %低通滤波截止频率,可以修改取值

g0=20; %高通滤波截止频率,可以修改取值

yd=zeros(m,n);

yg=zeros(m,n);

%理想低通滤波%

for i=1:1:m;

for j=1:1:n;

if((sqrt((i-n1)^2+(j-n2)^2))

yd(i,j)=J(i,j);

end

end

end

%理想高通滤波%

for i=1:1:m;

for j=1:1:n;

if((sqrt((i-n1)^2+(j-n2)^2))>g0)

yg(i,j)=J(i,j);

end

end

end

YD=fftshift(yd);

YG=fftshift(yg);

YDD=uint8(abs(ifft2(YD))); %理想低通滤波后图像

YGG=uint8(abs(ifft2(YG))); %理想高通滤波后图像

%理想DCT高通低通滤波

d=dct2(I);

[n1 n2]=size(I);

for i=1:n1

for j=1:n2

if(i<25)&(j<25)

d(i,j)=d(i,j);

else

d(i,j)=0;

end

end

end

g=idct2(d);

figure(3)

subplot(1,2,1);

imshow(uint8(g));title('DCT低通滤波后的图像');

e=dct2(I);

for i=1:n1

for j=1:n2

if(i<25)&(j<25)

e(i,j)=0;

else

e(i,j)=e(i,j);

end

end

end

g1=idct2(e);

subplot(1,2,2);

imshow(uint8(g1));title('DCT高通滤波后的图像');%DCT高通滤波后图像2.傅里叶压缩

YS=J;

YS(1:4/9*m,1:4/9*n)=0;

YS(5/9*m:m,1:4/9*n)=0;

YS(1:4/9*m,5/9*n:n)=0;

YS(5/9*m:m,5/9*n:n)=0;

Y=ifft2(fftshift(YS));

四、实验结果

五、实验总结

通过编程熟悉了MATLAB编程结构。学会使用MATLAB提供的库函数进行图像傅里叶变化。学会设计理想的低通和高通滤波器设计以及DCT高通低通滤波器设计。傅里叶压

缩后图像效果尚可,损失的细节部分并不明显。

实验三图像直方图均衡化

一、实验内容

对一副曝光率不足的照片进行直方图均衡化处理,提高其对比度。

二、实验目的

通过用Matlab仿真,掌握直方图均衡化的原理及步骤,了解均衡化对图像效果的影响。

三、实验程序

clc;

clear;

PS=rgb2gray(imread('3.jpg'));

subplot(2,2,1)

imshow(PS)

title('曝光不足的图像')

%绘制直方图

[m,n]=size(PS);

P=zeros(1,256); %预创建存放灰度出现概率的向量

for i=1:256

P(i)=length(find(PS==(i-1)))/(m*n); %计算灰度概率,存入GP相应位置

end

subplot(2,2,2)

bar(0:255,P,'g') %绘制直方图

title('原图像直方图')

xlabel('灰度值')

ylabel('出现概率')

%直方图均衡化

S1=zeros(1,256);

for i=1:256

for j=1:i

S1(i)=P(j)+S1(i); %计算Sk

end

end

S2=round(S1*255); %将Sk归到相近级的灰度

for i=1:256

P1(i)=sum(P(find(S2==i))); %计算现有每个灰度级出现的概率

end

subplot(2,2,4)

bar(0:255,P1,'b') %显示均衡化后的直方图

title('均衡化后的直方图')

xlabel('灰度值')

ylabel('出现概率')

%图像均衡化

PA=PS;

for i=0:255

PA(find(PS==i))=S2(i+1); %将各个像素归一化后的灰度值赋给这个像素end

subplot(2,2,3)

imshow(PA) %显示均衡化后的图像

title('均衡化后图像')

四、实验结果

五、实验总结

1.均衡化后直方图与之前相比,灰度范围更大,分散得更均匀;

2.灰度图像得亮度明显增强,对比度有所提高。

实验四 MATLAB实现图像平滑及锐化

一、实验目的

1.掌握图像加噪方法,并能在空间域中利用各种滤波算法对图像进行平滑,并能比较各种滤波性能。

2. 掌握多种图像锐化方法,并能比较锐化性能。

二、实验要求

1.打开一幅图像,添加椒盐、高斯噪声,然后使用邻域平均法、中值滤波法、K 邻近平均法进行平滑。

2.打开一幅图像,利用Roberts梯度法、Sobel算子和拉普拉斯算子进行锐化,并比较结果。

三、实验源程序

clc;

clear;

%打开一幅图像,添加高斯、椒盐噪声,用邻域平均法、中值滤波法和K邻近平均法处理。

%1.对图像添加高斯、椒盐噪声;

I=rgb2gray(imread('BIT.jpg'));

figure(1);

subplot(1,3,1);imshow(I);title('(a)原始图像');

P1=imnoise(I,'gaussian',0.06); %加入高斯噪声

subplot(1,3,2);imshow(P1);title('(b)高斯噪声污染的图片');

P2=imnoise(I,'salt & pepper',0.1); %加入椒盐噪声

subplot(1,3,3);imshow(P2);title('(c)椒盐噪声污染的图片');

%2.对图像进行均值滤波

L1=filter2(fspecial('average',3),P1)/255; %应用3*3窗的邻域平均滤波

figure(2);

subplot(1,2,1);imshow(L1); title('邻域平均法处理高斯噪声图片');

L2=filter2(fspecial('average',3),P2)/255; %应用3*3窗的邻域平均滤波

figure(2);

subplot(1,2,2);imshow(L2); title('邻域平均法处理椒盐噪声图片');

%3.对图像进行中值滤波

K1=medfilt2(P1); %应用缺省的3*3的邻域窗的中值滤波

figure(3);

subplot(1,2,1);imshow(K1,[]);title('中值滤波法处理高斯噪声图片');

K2=medfilt2(P2);

subplot(1,2,2);imshow(K2,[]);title('中值滤波法处理椒盐噪声图片');

%打开一幅图像,利用Roberts梯度法、Sobel算子和拉普拉斯算子进行锐化,并比较结果。

%Roberts梯度法锐化

figure(4);

subplot(1,2,1);imshow(I);title('原始图像');

J=double(I);

[IX,IY]=gradient(J); %计算梯度

A=sqrt(IX.*IX+IY.*IY);

subplot(1,2,2);imshow(A,[]);title('Roberts梯度法锐化图像');

%Sobel算子锐化

S=imfilter(I,fspecial('sobel'));

figure(5);

subplot(1,2,1);imshow(S);title('Sobel算子锐化图像');

%laplacian算子锐化

LP=imfilter(I,fspecial('laplacian'));

subplot(1,2,2);imshow(LP);title('Laplacian算子锐化图像');

四、实验结果

1.原始二值灰度图像及添加椒盐噪声和高斯噪声后的图像

2.噪声图像经过领域平均法处理后图像

3.噪声图像经中值滤波后的图像

4.原始图像及经过Robet梯度锐化后的图像

5.经过Sobel和Laplacian算子锐化后的图像

五、实验总结

1.对于椒盐噪声,中值滤波比均值滤波效果好。对于高斯噪声均值滤波比中值滤波

效果好。

2.Robet算子锐化效果较明显,Sobel算子锐化后的边缘显得粗而亮,Laplance算子使噪声也增强,锐化不明显。

3.掌握了基本加噪方法及平滑处理,并能够利用不同算子对图像进行锐化处理。

实验五图像霍夫曼编码压缩

一、实验内容

1.对图像进行霍夫曼编码并计算平均码字长度

2.将图像进行霍夫曼压缩并解压

二、实验目的

通过用Matlab仿真,掌握霍夫曼编码的原理以及基本方法步骤,了解霍夫曼编码的性能和效率。

三、实验程序

主程序:Main.m

求熵函数:Entroy.m 获取原图像的熵

霍夫曼编码函数:huffman.m 获得编码表和平均码长

霍夫曼压缩函数:Coding.m 根据编码表将灰度图像转换为码字序列

解压缩函数:Decode.m 将码字序列解压为灰度图像

四、实验结果

原图像的熵为: 6.903

Huffman编码后的平均码长: 6.931

Huffman编码效率: 0.996

Huffman编码冗余度 0.004

五、实验总结

1. 通过本次实验掌握了Huffamn编码原理,并掌握了Matlab基本编程结构。

2.霍夫曼编码效率很高,解压缩后图像恢复较好;

3. 由于编码步骤较为繁琐,加上对MATLAB函数运用得不太合理,导致程序冗余度偏高,运行很慢,编程效率有待改进。

实验六图像匹配

一、实验内容

1.在被搜索图中选取匹配模板;

2.运用ssda算法实现模板匹配

二、实验目的

通过用Matlab仿真,掌握SSDA算法实现模板匹配过程的原理以及步骤,检验匹配效果。

三、实验程序

clc;

clear;

I=rgb2gray(imread('xiaohai.jpg'));

figure(1);

imshow(I);

%选取匹配模板;

model=imcrop(I);

figure(2);

imshow(model);

title('选取匹配模板');

[M,N]=size(I);

[m,n]=size(model);

I=double(I);

model=double(model);

figure(1),imshow(uint8(I));

axis on;

%SSDA算法

double Dist=zeros(M-m,N-n);

for x=1:M-m

for y=1:N-n

Temp=0;

for i=0:m-1

for j=0:n-1

Temp = Temp+abs(I(i+x,j+y)-model(i+1,j+1));

end

end

Dist(x,y)=Temp/(m*n);

end

end

%求每一行的最小值

D=zeros(1,M-m);

for x=1:M-m % 行

D(x)=Dist(x,1);

for y=1:N-n-1 % 列

if(D(x)>Dist(x,y+1)) %

D(x)=Dist(x,y+1);

end

end

end

%求最小值的坐标点

min0=D(1); % min0为最小值

for i=1:M-m-1

if(min0>D(i+1))

min0=D(i+1);

end

end

%最小值匹配

for x=1:M-m

for y=1:N-n-1

if(min0 == Dist(x,y))

x % 实时图像的坐标

y

P=I(x:x+m-1,y:y+n-1);

M(1:M,1:N)=100;

M(x:x+m-1,y:y+n-1)=P;

end

end

end

figure(1);

figure(1);

subplot(1,2,1)

imshow(I,[]);title('原始图像');

subplot(1,2,2)

imshow(uint8(M));title('匹配结果');

四、实验结果

1.运行Work.m;

在产生的图像中用鼠标选取矩形区域作为匹配模板;

2.双击该模板开始SSDA算法匹配。

查找匹配矩阵在图像中的像素位置(226,290)

五、实验总结

1.算法精确度较高,选取模板匹配过程准确,速度尚可;

2.通过该实验更好地掌握了图像匹配的算法原理以及步骤,学会了应用imcrop函数抓图。

课程总结

通过为期一学期的学习,使我从一个数字图像小白,慢慢的了解了数字图像的处理原理及具体编程操作原理。从一开始对MATLAB处理图像的一穷二白,到现在可以摸索着使用它来编程处理图像。总体上王老师讲课还是很风趣幽默的,也许是因为排课的缘故吧,下午上课的时候,自己注意力有时总是不能集中,嘿嘿。

提点建议吧,王老师的这门课,个人感觉,理论讲的有点多,有时候使人听完后不知道在实际操作时如何应用。希望以后能够结合具体案例,来多讲一下实际操作中的方法和思路。学期末最后的那几节课结合了车牌识别的案例讲的挺好,不仅普及了车牌的一般知识,还丰富了车牌识别应用时所遇到的各种问题,使同学们能够对设计一个完整系统有了一个比较全面的了解。

总之,本学期,通过这个门课,自己学习了很多的知识,自己动手操作,完成老师留下的作业,对图像处理这门课有了比较全面的认识。最后,感谢王卫江老师这一学期的细心指导,祝您身体健康、工作顺利。

模式识别的研究现状与发展趋势

模式识别的研究现状与发展趋势 摘要:随着现今社会信息技术的飞速发展, 人工智能的应用越来越广泛, 其中模式识别是人工智能应用的一个方面。而且现今的模式识别的应用也越来越得到大家的重视与支持,在各方面也有重大的进步。模式识别也成为人们身边不可或缺的一部分。关键词:人工智能,技术,模式识别,前景 Abstract:In the modern society with the rapid development of information technology, the application of a rtificial intelligence is more and more extensive, among them pattern recognition is one of the ap ply of artificial intelligence. And now the application of pattern recognition is also more and more to get everyone's attention and support, in various aspects have significant progress. Pattern rec ognition has become an integral part of people around. Keywords: Artificial Intelligence, Technology,Pattern Recognition, prospects 一,引言 如今计算机硬件的高速发展, 以及计算机应用领域的不断开拓, 人们开始要求计算机能够更有效地感知诸如声音、文字、图像、温度、震动等人类赖以发展自身、改造环境所运用的信息资料。但就一般意义来说, 目前一般计算机却无法直接感知它们, 我们常用的键盘、鼠标等外部设备, 对于这些外部世界显得无能为力。虽然摄像机、图文扫描仪、话筒等设备业已解决了上述非电信号的转换, 并与计算机联机, 但由于识别技术不高, 而未能使计算机真正知道采录后的究竟是什么信息。计算机对外部世界感知能力的低下, 成为开拓计算机应用的瓶颈, 也与其高超的运算能力形成强烈的对比。于是, 着眼于拓宽计算机的应用领域, 提高其感知外部信息能力的学科———模式识别, 便得到迅速发展。 人工智能所研究的模式识别是指用计算机代替人类或帮助人类感知模式, 是对人类感知外界功能的模拟, 研究的是计算机模式识别系统, 也就是使一个计算机系统具有模拟人类通过感官接受外界信息、识别和理解周围环境的感知能力。现将人工智能在模式识别方面的一些具体和最新的应用范围遍及遥感、生物医学图象和信号的分析、工业产品的自动无损检验、指纹鉴定、文字和语音识别、机器视觉地圈模式识别等方面。 二,现状 以地图模式识别为例,地图模式识别是由计算机来对地图进行识别与理解, 并借助一定的技术手段, 让计算机研究和分析地图上的各种模式信息, 获取地图要素的质量意义。其计算处理的过程类似于人对地图的阅读。 地图模式识别是近年来在地图制图领域中新兴的一门高新技术, 是信息时代人工智能、模式识别技术在地图制图中的具体应用。由于它是传统地图制图迈向数字地图制图的一座桥梁, 因此,地图模式识别遥感技术、地理信息系统一起, 被称为现代地图制图的三大技术。 目前, 地图模式识别由于具有广泛的应用价值和发展潜力,因而受到了人们的普遍重视。尤其是随着现今的计算机及其外部硬件环境的不断提高, 科技不过发展的情况下,

完整word版,中科院-模式识别考题总结(详细答案)

1.简述模式的概念及其直观特性,模式识别的分类,有哪几种方法。(6’) 答(1):什么是模式?广义地说,存在于时间和空间中可观察的物体,如果我们可以区别它们是否相同或是否相似,都可以称之为模式。 模式所指的不是事物本身,而是从事物获得的信息,因此,模式往往表现为具有时间和空间分布的信息。 模式的直观特性:可观察性;可区分性;相似性。 答(2):模式识别的分类: 假说的两种获得方法(模式识别进行学习的两种方法): ●监督学习、概念驱动或归纳假说; ●非监督学习、数据驱动或演绎假说。 模式分类的主要方法: ●数据聚类:用某种相似性度量的方法将原始数据组织成有意义的和有用的各种数据 集。是一种非监督学习的方法,解决方案是数据驱动的。 ●统计分类:基于概率统计模型得到各类别的特征向量的分布,以取得分类的方法。 特征向量分布的获得是基于一个类别已知的训练样本集。是一种监督分类的方法, 分类器是概念驱动的。 ●结构模式识别:该方法通过考虑识别对象的各部分之间的联系来达到识别分类的目 的。(句法模式识别) ●神经网络:由一系列互相联系的、相同的单元(神经元)组成。相互间的联系可以 在不同的神经元之间传递增强或抑制信号。增强或抑制是通过调整神经元相互间联 系的权重系数来(weight)实现。神经网络可以实现监督和非监督学习条件下的分 类。 2.什么是神经网络?有什么主要特点?选择神经网络模式应该考虑什么因素? (8’) 答(1):所谓人工神经网络就是基于模仿生物大脑的结构和功能而构成的一种信息处 理系统(计算机)。由于我们建立的信息处理系统实际上是模仿生理神经网络,因此称它为人工神经网络。这种网络依靠系统的复杂程度,通过调整内部大量节点之间相互连接的关系,从而达到处理信息的目的。 人工神经网络的两种操作过程:训练学习、正常操作(回忆操作)。 答(2):人工神经网络的特点: ●固有的并行结构和并行处理; ●知识的分布存储; ●有较强的容错性; ●有一定的自适应性; 人工神经网络的局限性: ●人工神经网络不适于高精度的计算; ●人工神经网络不适于做类似顺序计数的工作; ●人工神经网络的学习和训练往往是一个艰难的过程; ●人工神经网络必须克服时间域顺序处理方面的困难; ●硬件限制; ●正确的训练数据的收集。 答(3):选取人工神经网络模型,要基于应用的要求和人工神经网络模型的能力间的 匹配,主要考虑因素包括:

人工智能与模式识别

人工智能与模式识别 摘要:信息技术的飞速发展使得人工智能的应用范围变得越来越广,而模式识别作为其中的一个重要方面,一直是人工智能研究的重要方向。在介绍人工智能和模式识别的相关知识的同时,对人工智能在模式识别中的应用进行了一定的论述。模式识别是人类的一项基本智能,着20世纪40年代计算机的出现以及50年代人工智能的兴起,模式识别技术有了长足的发展。模式识别与统计学、心理学、语言学、计算机科学、生物学、控制论等都有关系。它与人工智能、图像处理的研究有交叉关系。模式识别的发展潜力巨大。 关键词:模式识别;数字识别;人脸识别中图分类号; Abstract:The rapid development of information technology makes the application of artificial intelligence become more and more widely. Pattern recognition, as one of the important aspects, has always been an important direction of artificial intelligence research. In the introduction of artificial intelligence and pattern recognition related knowledge at the same time, artificial intelligence in pattern recognition applications were discussed.Pattern recognition is a basic human intelligence, the emergence of the 20th century, 40 years of computer and the rise of artificial intelligence in the 1950s, pattern recognition technology has made great progress. Pattern recognition and statistics, psychology, linguistics, computer science, biology, cybernetics and so have a relationship. It has a cross-correlation with artificial intelligence and image processing. The potential of pattern recognition is huge. Key words:pattern recognition; digital recognition; face recognition; 1引言 随着计算机应用范围不断的拓宽,我们对于计算机具有更加有效的感知“能

计算机视觉与图像处理、模式识别、机器学习学科之间的关系

计算机视觉与图像处理、模式识别、机器学习学科之间的关系 在我的理解里,要实现计算机视觉必须有图像处理的帮助,而图像处理倚仗与模式识别的有效运用,而模式识别是人工智能领域的一个重要分支,人工智能与机器学习密不可分。纵观一切关系,发现计算机视觉的应用服务于机器学习。各个环节缺一不可,相辅相成。 计算机视觉(computer vision),用计算机来模拟人的视觉机理获取和处理信息的能力。就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,用电脑处理成为更适合人眼观察或传送给仪器检测的图像。计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取‘信息’的人工智能系统。计算机视觉的挑战是要为计算机和机器人开发具有与人类水平相当的视觉能力。机器视觉需要图象信号,纹理和颜色建模,几何处理和推理,以及物体建模。一个有能力的视觉系统应该把所有这些处理都紧密地集成在一起。 图像处理(image processing),用计算机对图像进行分析,以达到所需结果的技术。又称影像处理。基本内容图像处理一般指数字图像处理。数字图像是指用数字摄像机、扫描仪等设备经过采样和数字化得到的一个大的二维数组,该数组的元素称为像素,其值为一整数,称为灰度值。图像处理技术的主要内容包括图像压缩,增强和复原,匹配、描述和识别3个部分。常见的处理有图像数字化、图像编码、图像增强、图像复原、图像分割和图像分析等。图像处理一般指数字图像处理。 模式识别(Pattern Recognition)是指对表征事物或现象的各种形式的(数值的、文字的和逻辑关系的)信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程,是信息科学和人工智能的重要组成部分。模式识别又常称作模式分类,从处理问题的性质和解决问题的方法等角度,模式识别分为有监督的分类(Supervised Classification)和无监督的分类(Unsupervised Classification)两种。模式还可分成抽象的和具体的两种形式。前者如意识、思想、议论等,属于概念识别研究的范畴,是人工智能的另一研究分支。我们所指的模式识别主要是对语音波形、地震波、心电图、脑电图、图片、照片、文字、符号、生物传感器等对象的具体模式进行辨识和分类。模式识别研究主要集中在两方面,一是研究生物体(包括人)是如何感知对象的,属于认识科学的范畴,二是在给定的任务下,如何用计算机实现模式识别的理论和方法。应用计算机对一组事件或过程进行辨识和分类,所识别的事件或过程可以是文字、声音、图像等具体对象,也可以是状态、程度等抽象对象。这些对象与数字形式的信息相区别,称为模式信息。模式识别与统计学、心理学、语言学、计算机科学、生物学、控制论等都有关系。它与人工智能、图像处理的研究有交叉关系。 机器学习(Machine Learning)是研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合而不是演绎。机器学习在人工智能的研究中具有十分重要的地位。一个不具有学习能力的智能系统难以称得上是一个真正的智能系统,但是以往的智能系统都普遍缺少学习的能力。随着人工智能的深入发展,这些局限性表现得愈加突出。正是在这种情形下,机器学习逐渐成为人工智能研究的核心之一。它的应用已遍及人工智能的各个分支,如专家系统、自动推理、自然语言理解、模式识别、计算机视觉、智能机器人等领域。机器学习的研究是根据生理学、认知科学等对人类学习机理的了解,建立人类学习过程的计算模型或认识模型,发展各种学习理论和学习方法,研究通用的学习算法并进行理论上的分析,建立面向任务的具有特定应用的学习系统。这些研究目标相互影响相互促进。

模式识别与智能系统

模式识别与智能系统 (081104) 一、培养目标 培养热爱祖国,拥护中国共产党的领导,拥护社会主义制度,遵纪守法,品德良好,具有服务国家、服务人民的社会责任感,掌握本学科坚实的基础理论和系统的专业知识,具有创新精神、创新能力和从事科学研究、教学、管理等工作能力的高层次学术型专门人才。 模式识别与智能系统是20世纪60年代以来在信号处理、人工智能、控制论、计算机技术等学科基础上发展起来的新型学科。该学科以各种传感器为信息源,以信息处理与模式识别的理论技术为核心,以数学方法与计算机为主要工具,探索对各种媒体信息进行处理、分类、理解并在此基础上构造具有某些智能特性的系统或装置的方法、途径与实现,以提高系统性能。模式识别与智能系统是一门理论与实际紧密结合,具有广泛应用价值的控制科学与工程的重要学科分支。 本学科培养德智体全面发展,具有坚实和系统的模式识别与智能系统理论知识和实践技能,了解模式识别与智能系统学科发展的前沿和动态,能够适应我国经济、科技、教育发展需要,面向二十一世纪的科学研究、工程技术和高等教育的高层次人才。学位获得者业务上应具有具备从事在本学科及相关学科领域独立开发研究工作的能力,注意理论联系实际,能够分析和解决现代经济建设和交叉学科中涌现出的新课题;能够熟练利用计算机解决本学科的有关问题;较为熟练地掌握一门外国语;具有健康的体格。 二、研究方向 (一)智能机器人系统 主要进行智能机器人控制与决策系统的研究与开发,包括自主移动机器人、特种机器人、服务机器人、工业机器人等内容。机器人的自主定位、导航、避障与多机器人协调控制为主要研究方向。 (二)系统仿真技术与应用 主要研究方向为控制系统仿真与计算机辅助设计、半实物仿真与实时控制、分数阶与网络控制系统仿真、系统建模校验与验证及仿真算法和高层体系结构理论与应用技术、工业过程建模仿真和提高控制效果与系统性能的方法研究。 (三)图像处理与计算机视觉 研究图像信息获取、处理、分析、理解与识别分类等理论与技术,研究图像处理技术在医学影像处理、动态目标识别与跟踪、智能交通系统、军事等领域的工程应用问题。 (四)建筑智能化技术 本方向以建筑智能化技术为背景,主要研究智能建筑系统集成理论与技术、

模式识别期末试题

一、填空与选择填空(本题答案写在此试卷上,30分) 1、模式识别系统的基本构成单元包括:模式采集、特征提取与选择 和模式分类。 2、统计模式识别中描述模式的方法一般使用特真矢量;句法模式识别中模式描述方法一般有串、树、网。 3、聚类分析算法属于(1);判别域代数界面方程法属于(3)。 (1)无监督分类 (2)有监督分类(3)统计模式识别方法(4)句法模式识别方法 4、若描述模式的特征量为0-1二值特征量,则一般采用(4)进行相似性度量。 (1)距离测度(2)模糊测度(3)相似测度(4)匹配测度 5、下列函数可以作为聚类分析中的准则函数的有(1)(3)(4)。 (1)(2) (3) (4) 6、Fisher线性判别函数的求解过程是将N维特征矢量投影在(2)中进行。 (1)二维空间(2)一维空间(3)N-1维空间 7、下列判别域界面方程法中只适用于线性可分情况的算法有(1);线性可分、不可分都适用的有(3)。 (1)感知器算法(2)H-K算法(3)积累位势函数法 8、下列四元组中满足文法定义的有(1)(2)(4)。 (1)({A, B}, {0, 1}, {A→01, A→ 0A1 , A→ 1A0 , B→BA , B→ 0}, A) (2)({A}, {0, 1}, {A→0, A→ 0A}, A) (3)({S}, {a, b}, {S → 00S, S → 11S, S → 00, S → 11}, S) (4)({A}, {0, 1}, {A→01, A→ 0A1, A→ 1A0}, A) 9、影响层次聚类算法结果的主要因素有(计算模式距离的测度、(聚类准则、类间距离门限、预定的 类别数目))。 10、欧式距离具有( 1、2 );马式距离具有(1、2、3、4 )。 (1)平移不变性(2)旋转不变性(3)尺度缩放不变性(4)不受量纲影响的特性 11、线性判别函数的正负和数值大小的几何意义是(正(负)表示样本点位于判别界面法向量指向的 正(负)半空间中;绝对值正比于样本点到判别界面的距离。)。 12、感知器算法1。 (1)只适用于线性可分的情况;(2)线性可分、不可分都适用。

模式识别与图像处理习题及解答

1. 判断题(在题目后面的括号中填入T或F,分别代表正确或错误)。 (1) 灰度直方图是灰度级的函数,描述的是图像中具有该灰度级像素的个数,其纵坐标是灰度级,横坐标是该灰度出现的频率。( F ) (2) 中值滤波是一种线性滤波,它在实际应用中需要图像的统计特性。(F ) (3) 图像经频域变换后其特点是变换结果能量分布向高频成分方向集中,图像上的边缘、线条等信息在低频成分上得到反映。( F ) (4) 观察直方图可以看出不适合的数字化。(T ) 2. 单选题(每题只有一个选项是正确的) (1) 锐化(高通)滤波器的作用:A A 能减弱或削除傅立叶空间的低频分量,但不影响高频分量。 B 能减弱或削除傅立叶空间的高频分量,但不影响低频分量。 C 对傅立叶空间的低、高频分量均有减弱或削除作用。 D 对傅立叶空间的低、高频分量均有增强作用。 (2) 下列说法不正确的是 C A 点运算是对一副图像的灰度级进行变换。 B 线性点运算仅能拉伸或压缩直方图,以及使之左移或右移。 C 点运算可以改变图形内的空间关系。 D 点运算以预定的方式改变一幅图像的灰度直方图。 (3) 在所有颜色模型中,最常用于彩色图像的是:D A GMY B YIQ C HSV D HSI (4) 以下说法正确的是:B A 用数学形态学处理一些图像时,膨胀运算会收缩图像,腐蚀运算会扩大图像。 B 用数学形态学处理一些图像时,开运算和闭运算都可以平滑图像的轮廓。 C 在形态算法设计中,结构元的选择非常重要,它可以在几何上比原图像复杂,且 无界。 D 在形态算法设计中,用非凸子集作为结构元也是可以的。 (5) 数字图像的灰度直方图的横坐标表示:A A 灰度级 B 出现这种灰度的概率 C 像素数 D 像素值 (6) 以下说法正确的是 C A 先膨胀后腐蚀的运算称为开运算。 B 先腐蚀后膨胀的运算称为闭运算。 C 细化是将一个曲线型物体细化为一条单像素宽的线,从而图形化的显示出其拓扑 性质。 D 消除连续区域内的小噪声点,可以通过连续多次使用开闭运算。 (7) 下列描述正确的有 D A 只有傅立叶变换才能够完成图像的频率变换。 B 图像经频域变换后,变换结果是能量分布向高频方向集中,图像上的边缘、线条

模式识别与智能系统硕士点_研究生入学复试大纲pris_test

模式识别与智能系统硕士点 研究生入学复试大纲 复试笔试满分为150分,包括基本能力测试(45分)和专业基础知识测试(105分)两部分。采取闭卷考试,考试时间一般为2至3小时。 有关专业基础知识测试的说明 专业基础知识测试(105分)由21道题目组成,参加笔试同学可从中任意选择7道完成,每题15分。专业知识点包括以下七个方面: 一.图象处理(共3题) 考试知识点:数字图象直方图、基于直方图均衡化的图象增强、边缘检测算子、梯度大小/方向计算、频域滤波基础、频域滤波操作的基本步骤。 辅导材料:冈萨雷斯等,《数字图象处理》,第二版,电子工业出版社, 2003.3, ISBN 7-5053-8236-5。认真阅读该书的3.3, 4.2, 10.1。 二.信息安全(共2题) 考试知识点:信息熵的计算、信源编码。 辅导材料:《信息与编码理论基础》,万旺根,上海大学出版社。 三.人工智能(共2题) 考试知识点:人工智能的基本概念。 辅导材料:廉师友,人工智能技术导论(第二版)廉师友西安电子科技大学出版社, 2002.7, ISBN 7-5606-0811-6。认真阅读该书的第一章。 四.微型计算机原理(共5题) 考试知识点:80x86指令寻址模式及汇编指令的书写格式;不同进制数之间的转换;汇编程序的阅读;计数器模块8253及其编程;可编程中断控制器8259模块及其编程。 注:相关硬件模块控制字格式不需记忆。(提供)

辅导材料:微型计算机技术及应用(第3版),戴梅萼等,清华大学出版社,2003 五.多媒体信息处理(共4题) 考试知识点:1.多媒体基本概念 多媒体技术,多媒体系统的层次结构,多媒体系统的组成 2.多媒体数据压缩: 数据压缩算法概念及分类,统计编码,预测编码,变换编码,分形编码 静态图像压缩标准JPEG,运动图像压缩标准MPEG,音频压缩标准 3.音频信息处理 声音数字化,音频文件格式,声卡的组成与设计(含声卡的工作原理、硬件设计、软件结构、编程接口等) 4.视频信息处理 视频信号数字化,视频的文件格式,视频压缩卡的设计 辅导材料:多媒体技术基础及应用,钟玉琢等,北京:清华大学出版社,2006.2 六.生物特征识别(共2题) 考试知识点:生物信息学序列联配(双序列比对,多序列比对)。 辅导材料:David W. Mount,《生物信息学:序列与基因组分析(影印)》,Bioinformatics: Sequence and Genome Analysis, Cold Spring Harbor Lab(CSHL) Press。认真阅读sequence alignment 的相关内容。 七.射频识别(共3题) 考试知识点:电子标签的基本概念。 辅导材料:纪震,李慧慧等,《电子标签原理与应用》,西安电子科技大学出版社, 2005.12, ISBN 705606-1599-6。认真阅读该书的第一章。

2014模式识别练习题

2013模式识别练习题 一. 填空题 1、模式识别系统的基本构成单元包括:模式采集、特征的选择和提取和模式分类。 2、统计模式识别中描述模式的方法一般使用特征矢量;句法模式识别中模式描述方法一般有串、树、 网。 3、影响层次聚类算法结果的主要因素有计算模式距离的测度、聚类准则、类间距离阈值、预定的类别数目。 4、线性判别函数的正负和数值大小的几何意义是正负表示样本点位于判别界面法向量指向的正负半空间中, 绝对值正比于样本点与判别界面的距离。 5、感知器算法1 ,H-K算法 2 。 (1)只适用于线性可分的情况;(2)线性可分、不可分都适用。 6、在统计模式分类问题中,聂曼-皮尔逊判决准则主要用于某一种判别错误较另一种判别错误更为重要的情 况;最小最大判别准则主要用于先验概率未知的情况。 7、 。一般在可 8、散度J ij越大,说明ωi类模式与ωj类模式的分布差别越大; 当ωi类模式与ωj类模式的分布相同时,J ij= 0。 二、选择题 1、影响聚类算法结果的主要因素有(B、C、D )。 A.已知类别的样本质量; B.分类准则; C.特征选取; D.模式相似性测度 2、模式识别中,马式距离较之于欧式距离的优点是(C、D)。 A.平移不变性; B.旋转不变性;C尺度不变性;D.考虑了模式的分布 3、影响基本K-均值算法的主要因素有(ABD)。 A.样本输入顺序; B.模式相似性测度; C.聚类准则; D.初始类中心的选取 4、位势函数法的积累势函数K(x)的作用相当于Bayes判决中的(B D)。 A. 先验概率; B. 后验概率; C. 类概率密度; D. 类概率密度与先验概率的乘积 5、在统计模式分类问题中,当先验概率未知时,可以使用(BD)。 A. 最小损失准则; B. 最小最大损失准则; C. 最小误判概率准则; D. N-P判决 6、散度J D是根据(C )构造的可分性判据。 A. 先验概率; B. 后验概率; C. 类概率密度; D. 信息熵; E. 几何距离 7、似然函数的概型已知且为单峰,则可用(ABCDE)估计该似然函数。 A. 矩估计; B. 最大似然估计; C. Bayes估计; D. Bayes学习; E. Parzen窗法 8、KN近邻元法较之Parzen窗法的优点是(B)。 A. 所需样本数较少; B. 稳定性较好; C. 分辨率较高; D. 连续性较好 9、从分类的角度讲,用DKLT做特征提取主要利用了DKLT的性质:(A C )。 A.变换产生的新分量正交或不相关; B.以部分新的分量表示原矢量均方误差最小; C.使变换后的矢量能量 更集中 10、如果以特征向量的相关系数作为模式相似性测度,则影响聚类算法结果的主要因素有(BC)。 A. 已知类别样本质量; B. 分类准则; C. 特征选取; D. 量纲 11、欧式距离具有(A B );马式距离具有(A B C D )。 A. 平移不变性; B. 旋转不变性; C. 尺度缩放不变性; D. 不受量纲影响的特性 12、聚类分析算法属于(A );判别域代数界面方程法属于(C )。 A.无监督分类; B.有监督分类; C.统计模式识别方法; D.句法模式识别方法 13、若描述模式的特征量为0-1二值特征量,则一般采用(D)进行相似性度量。 A. 距离测度; B. 模糊测度; C. 相似测度; D. 匹配测度 14、下列函数可以作为聚类分析中的准则函数的有(ACD)。

模式识别与智能系统

模式识别与智能系统 Pattern Recognition & Intelligent System (专业代码:081104) 一、学科概况 本校模式识别与智能系统学科为国务院1993年批准的博士学位授予权学科,2001年经国务院学位委员会批准为国家级重点学科(二级学科);本学科所在的控制科学与工程学科具有一级学科博士学位授予权,同时拥有一级学科博士后流动站。本学科主要从事模式识别与智能系统的理论与应用研究,为本校“211工程”重点建设学科。经过多年的建设,现有博士生导师七名,百余名的博士生研究队伍,和先进的教学与科研硬设备环境。多年来,一批科研成果达到国际与国内先进水平。 二、培养目标 本学科培养的模式识别与智能系统的硕士研究生应具有较宽广的基础理论及较深入的专业知识,能解决国家经济建设与国防中在本领域内的工程技术的应用课题,具有较好的理论联系实际的能力。 三、学制和学分 全日制硕士研究生实行以两年半制为主的弹性学制,原则上不超过5年。 总学分33学分,其中必修课程不少于14学分。

四、硕士课程设置 五、科研能力与水平 1. 掌握本学科的基础理论和专业知识,对所研究的课题有新的见解,取得新的成果。对于学术型学位的硕士研究生,还应熟悉国内外相关的学术研究动态。 2. 工作认真踏实,能独立进行科研工作并圆满完成科研任务。 3. 对于应用型、复合型学位的硕士研究生,能发现实践中与本学科相关的需求,能提出工程解决方案;对于学术型学位的硕士研究生,能提出和界定科学问题。

4. 硕士研究生在校期间应积极发表学术论文,参与学术交流。 六、开题报告 为确保学位论文的质量,指导教师应针对每个硕士研究生的类型和层次,确定选题范围。硕士研究生在导师的指导下,通过阅读文献、收集资料和调查研究后确定研究课题,提交开题报告。开题报告的主要内容包括: (1)课题来源及研究的目的和意义; (2)国内外在该方向的研究现状及分析; (3)主要研究内容; (4)研究方案及进度安排,预期达到的目标; (5)预计研究过程中可能遇到的困难和问题以及解决的措施; (6)主要参考文献。 提交开题报告的时间一般为第四小学期,开题报告字数应在5000字以上。开题报告的评议结果为通过或不通过。硕士研究生学位论文选题、开题的要求详见《南京理工大学硕士学位论文选题、开题及撰写的有关规定 七、学位论文 学位论文工作是研究生培养的重要组成部分,是对研究生进行科学研究或承担专业技术工作的全面训练,是培养研究生创新能力、综合运用所学知识发现问题、分析问题和解决问题能力的重要环节。 硕士学位论文要求概念清楚、立论正确、分析严谨、计算正确、数据可靠、文句简练、图表清晰、层次分明,能体现硕士研究生具有宽广的理论基础,较强的独立工作能力和优良的学风。在阐明论文的目的、意义和成果时,应有实事求是的科学态度。 硕士研究生的论文工作必须在导师指导下,由研究生独立完成。完成后应按照《中华人民共和国学位条理暂行实施办法》和《南京理工大学博士、硕士学位授予细则》的规定,组织论文评审和答辩。获准参加答辩的前提条件是:必须修满规定的学分,外语通过学位英语考试或通过国家英语六级考试,其余学科基础课程成绩不得低于70分并完成教学实践、科研实习。

人工智能的模式识别与机器视觉

人工智能的模式识别与机器视觉 模式识别 “模式”(Panern)一词的本意是括完整天缺的供模仿的标本或标识。模式识别就是识别出给定物体所模仿的标本或标识。计算机模式识别系统使一个计算机系统具有模拟人类通过感官接受外界信息、识别和理解周围环境的感知能力。 模式识别是一个不断发展的学科分支,它的理论基础和研究范围也在不断发展。在二维的文字、图形和图像的识别方而,已取得许多成果。三维景物和活动目标的识别和分析是目前研究的热点。语音的识别和合成技术也有很大的发展。基于人工神经网络的模式识别技术在手写字符的识别、汽车牌照的识别、指纹识别、语音识别等方面已经有许多成功的应用。模式识别技术是智能计算机和智能机器人研究的十分重要的基础 机器视觉 实验表明,人类接受外界信息的80%以上来自视觉,10%左右来自听觉,其余来自嗅觉、味觉及触觉。在机器视觉方面,只要给计算机系统装上电视摄像输入装置就可以“看见”周围的东西。但是,视觉是一种感知,机器视觉的感知过程包含一系列的处理过程,例如,一个可见的景物由传感器编码输入,表示成一个灰度数值矩阵;图像的灰度数值由图像检测器进行处理,检测器检测出图像的主要成分,如组成景物的线段、简单曲线和角度等;这些成分又校处理,以便根据景物的表面特征和形状特征来推断有关景物的特征信息;最终目标是利用某个适当的模型来表示该景物。 视觉感知问题的要点是形成一个精练的表示来取代极其庞大的未经加工的输入情息,把庞大的视觉输人信息转化为一种易于处理和有感知意义的描述。 机器视觉可分为低层视觉和高后视觉两个层次,低层视觉主要是对视觉团像执行预处理,例如,边缘检测、运动目标检测、纹理分析等,另外还有立体造型、曲面色彩等,其目的是使对象凸现出来,这时还谈不上对它的理解。高层视觉主要是理解对象,显然,实现高层视觉需要掌捏与对象相关的知识。 机器视觉的前沿研究课题包括:实时图像的并行处理,实时图像的压缩、传输与复原,三绍景物的建模识别,动态和时变视觉等。 人娄的钉能活动过程主要是一个获得知识并运用知识的过程,知识是智能的基础。为了使计算机具有钉能,能模拟人类的智能行为,就必须使它具有知识。把人类拥有的知识采用适当的模式表示出来以便存储到计算机中,这就是知识表示要解决的问题。知识表示是对知识的一种描述,或者说是一组约定,是一种计算机可以接受的用于描述知识的数据结构,对知识进行表木就是把知识表示咸便于计算机存储和利用的菜种数据结构。知识表示方法给出的知识表示形式称为知识表示程式,知识表示模式分为外部表示模式和内部表示模式两个层次。知识外部表示模式是与软件开发的工具、运行的软件平台无关的知识表示的形式化描述。知

图像模式识别的方法介绍

2.1图像模式识别的方法 图像模式识别的方法很多,从图像模式识别提取的特征对象来看,图像识别方法可分为以下几种:基于形状特征的识别技术、基于色彩特征的识别技术以及基于纹理特征的识别技术。其中,基于形状特征的识别方法,其关键是找到图像中对象形状及对此进行描述,形成可视特征矢量,以完成不同图像的分类,常用来表示形状的变量有形状的周长、面积、圆形度、离心率等。基于色彩特征的识别技术主要针对彩色图像,通过色彩直方图具有的简单且随图像的大小、旋转变换不敏感等特点进行分类识别。基于纹理特征的识别方法是通过对图像中非常具有结构规律的特征加以分析或者则是对图像中的色彩强度的分布信息进行统计来完成。 从模式特征选择及判别决策方法的不同可将图像模式识别方法大致归纳为两类:统计模式(决策理论)识别方法和句法(结构)模式识别方法。此外,近些年随着对模式识别技术研究的进一步深入,模糊模式识别方法和神经网络模式识别方法也开始得到广泛的应用。在此将这四种方法进行一下说明。 2.1.1句法模式识别 对于较复杂的模式,如采用统计模式识别的方法,所面临的一个困难就是特征提取的问题,它所要求的特征量十分巨大,要把某一个复杂模式准确分类很困难,从而很自然地就想到这样的一种设计,即努力地把一个复杂模式分化为若干

较简单子模式的组合,而子模式又分为若干基元,通过对基元的识别,进而识别子模式,最终识别该复杂模式。正如英文句子由一些短语,短语又由单词,单词又由字母构成一样。用一组模式基元和它们的组成来描述模式的结构的语言,称为模式描述语言。支配基元组成模式的规则称为文法。当每个基元被识别后,利用句法分析就可以作出整个的模式识别。即以这个句子是否符合某特定文法,以判别它是否属于某一类别。这就是句法模式识别的基本思想。 句法模式识别系统主要由预处理、基元提取、句法分析和文法推断等几部分组成。由预处理分割的模式,经基元提取形成描述模式的基元串(即字符串)。句法分析根据文法推理所推断的文法,判决有序字符串所描述的模式类别,得到判决结果。问题在于句法分析所依据的文法。不同的模式类对应着不同的文法,描述不同的目标。为了得到于模式类相适应的文法,类似于统计模式识别的训练过程,必须事先采集足够多的训练模式样本,经基元提取,把相应的文法推断出来。实际应用还有一定的困难。 2.1.2统计模式识别 统计模式识别是目前最成熟也是应用最广泛的方法,它主要利用贝叶斯决策规则解决最优分类器问题。统计决策理论的基本思想就是在不同的模式类中建立一个决策边界,利用决策函数把一个给定的模式归入相应的模式类中。统计模式识别的基本模型如图2,该模型主要包括两种操作模型:训练和分类,其中训练主要利用己有样本完成对决策边界的划分,并采取了一定的学习机制以保证基于样本的划分是最优的;而分类主要对输入的模式利用其特征和训练得来的决策函数而把模式划分到相应模式类中。 统计模式识别方法以数学上的决策理论为基础建立统计模式识别模型。其基本模型是:对被研究图像进行大量统计分析,找出规律性的认识,并选取出反映图像本质的特征进行分类识别。统计模式识别系统可分为两种运行模式:训练和分类。训练模式中,预处理模块负责将感兴趣的特征从背景中分割出来、去除噪声以及进行其它操作;特征选取模块主要负责找到合适的特征来表示输入模式;分类器负责训练分割特征空间。在分类模式中,被训练好的分类器将输入模式根据测量的特征分配到某个指定的类。统计模式识别组成如图2所示。

模式识别方法简述

XXX大学 课程设计报告书 课题名称模式识别 姓名 学号 院、系、部 专业 指导教师 xxxx年 xx 月 xx日

模式识别方法简述 摘要:模式识别(Pattern Recognition)是指对表征事物或现象的各种形式的( 数值的、文字的和逻辑关系的) 信息进行处理和分析, 以对事物或现象进行描述、辨认、分类和解释的过程, 是信息科学和人工智能的重要组成部分。模式识别研究主要集中在两方面, 一是研究生物体( 包括人) 是如何感知对象的,属于认识科学的范畴, 二是在给定的任务下, 如何用计算机实现模式识别的理论和方法。前者是生理学家、心理学家、生物学家和神经生理学家的研究内容, 后者通过数学家、信息学专家和计算机科学工作者近几十年来的努力, 已经取得了系统的研究成果。 关键词:模式识别; 模式识别方法; 统计模式识别; 模板匹配; 神经网络模式识别 模式识别(Pattern Recognition)是人类的一项基本智能,在日常生活中,人们经常在进行“模式识别”。随着2 0 世纪4 0 年代计算机的出现以及5 0 年代人工智能的兴起,人们当然也希望能用计算机来代替或扩展人类的部分脑力劳动。(计算机)模式识别在2 0 世纪6 0 年代初迅速发展并成为一门新学科。 模式识别研究主要集中在两方面, 一是研究生物体( 包括人) 是如何感知对象的,属于认识科学的范畴, 二是在给定的任务下, 如何用计算机实现模式识别的理论和方法。前者是生理学家、心理学家、生物学家和神经生理学家的研究内容, 后者通过数学家、信息学专家和计算机科学工作者近几十年来的努力, 已经取得了系统的研究成果。模式识别与统计学、心理学、语言学、计算机科学、生物学、控制论等都有关系。它与人工智能、图像处理的研究有交叉关系。例如自适应或自组织的模式识别系统包含了人工智能的学习机制;人工智能研究的景物理解、自然语言理解也包含模式识别问题。又如模式识别中的预处理和特征抽取环节应用图像处理的技术;图像处理中的图像分析也应用模式识别的技术。 模式识别是一种借助计算机对信息进行处理、判别的分类过程。判决分类在

上海交通大学图象处理与模式识别专业考研

上海交通大学图象处理与模式识别专业 考研 本学科创建于80年代初,是国内首批有权授予硕士学位、博士学位并设有博士后流动站的重点学科,也是国家“211工程”资助学科。1998年该学科改名为模式识别与智能系统。本学科点的创建人是我国著名图像处理和模式识别专家、美国匹兹堡大学访问学者李介谷教授。他的研究方向是模式识别和计算机视觉。 本学科依托图象处理与模式识别研究所,主要从事数字图象(图形)分析、文本信息处理、模式识别、机器视觉、自然语言理解、智能技术和系统等信息技术领域中前沿性的应用基础研究,具有基于数字信号处理器的硬件开发工具和网络环境下的工作站,个人机及专用的图象输入输出设备。包括序列图像分析,三维图像重构理论及应用,远程医疗和诊断;模式识别和计算机视觉是该学科的一个研究特色,已取得重大研究成果的项目有动态目标识别,字符和人脸识别,机器人视觉;计算机图形学和虚拟现实,多媒体技术和计算可视化;智能中文信息处理,中(英)文全文检索,基于内容的网上检索;人工智能和智能系统,主要从事人工神经网理论及应用,机器学习和推理、智能交通指挥系统等。目前正在进行的科研项目有国家高科技863项目,国家自然科学基金,国家教委博士点科研基金项目。省、部、市重大科技开发和国际合作项目。 模式识别和智能系统学科拥有设备先进的图像工程实验室。1978年恢复招收研究生来,已培养硕士、博士生216名,主要在国内外大学、科研机构和高新技术产业从事教学、科研及高新技术的开发研究工作。该学科有广泛的国际合作和交流,招收国内外访问学者和国外留学生。本学科所从事的研究项目曾多次荣获过国家科技进步一等奖、省部级的奖励,并有着广泛的国际合作和交流。 研究方向 a.数字图象处理 b.计算机模式识别 c.计算机图形学与CAD技术 d.人工智能与专家系统 e.计算机视觉 f.语音识别及机器翻译 g.人工神经网络 h.虚拟现实 i.算法理论与分析 j.网络信息处理 k.文本信息处理 l.网上三维图象重建 m.城市交通监控与管理系统 n.生物信息特征识别 o.网络信息智能处理 p.自然语言理解与人机界面 q.成像光谱技术与遥感 r.三维空间信息处理与分析 s.多媒体与网络信息智能处理 t.智能理论与系统。 本学科依托图象处理与模式识别研究所,主要从事数字图象(图形)分析、文本信息处理、模式识别、机器视觉、自然语言理解、智能技术和系统等信息技术领域中前沿性的应用基础研究,具有基于数字信号处理器的硬件开发工具和网络环境下的工作站,个人机及专用的图象输入输出设备。包括序列图像分析,三维图像重构理论及应用,远程医疗和诊断;模式识别和计算机视觉是该学科的一个研究特色,已取得重大研究成果的项目有动态目标识别,字符和人脸识别,机器人视觉;计算机图形学和虚拟现实,多媒体技术和计算可视化;

图像校正与分割处理软件设计与实现模式识别与智能系统方案

图像校正及分割处理软件设计与实现《图像分析与模式识别》课程期末大作业报告 课程名称:图像分析与模式识别

目录 图像校正及分割处理软件设计与实现 (1) 1 软件需求 (1) 1.1 操作界面需求分析 (1) 1.2 图像几何校正需求分析 (1) 1.2 ISODATA聚类算法的图像分割需求分析 (2) 2 算法原理及流程图 (2) 2.1 Hough变换 (2) 2.1.1 Hough变换原理 (2) 2.1.2 图像几何校正流程 (3) 2.2 ISODATA算法原理 (3) 2.2.1 ISODATA算法原理步骤 (3) 2.2.1 ISODATA算法流程图 (5) 3 程序设计框图 (6) 4 实验结果及分析 (7) 4.1 图像几何 (7) 4.1.1 支票图像几何校正结果 (7) 4.1.1 支票图像几何校正结果分析 (8) 4.2 图像分割 (8) 4.2.1图像分割结果 (8) 4.2.1图像分割结果分析 (10) 附录: (11) 附录一:图像几何校正代码 (11) 附录一:ISODATA聚类算法图像分割代码 (11) 附录一:MATLAB的GUI操作界面代码 (17)

图像校正及分割处理软件设计与实现 摘要:设计一种图像几何校正及图像分割处理软件,实现对倾斜支票图像校正为水平,及对已给的图像进行分割。图像几何校正主要通过边缘检测、Hough 变换、求倾斜角、图像旋转等算法实现;图像分割采用ISODATA聚类算法实现。实验结果表明,实现了对倾斜支票图像几何校正和对图像的分割功能。 关键词:边沿检测;Hough变换、图像旋转、ISODATA算法;图像分割; 1 软件需求 需求分析是指对要解决的问题进行详细的分析,弄清楚问题的要求,包括整个系统所要实现的功能。 根据题目,设计需要编写带有操作界面的图像处理软件,功能包含图像几何校和基于ISODATA聚类算法的图像分割。开发工具使用MATLAB。根据MATLAB的特点及需要实现的软件功能,软件需求分析如下: 1.1 操作界面需求分析 软件实现的功能是图像处理,因此操作界面中需要一个按钮,用于选择待处理的图像,称为“图像选择”按钮;选择的原始图像需要在操作界面中显示,因此需要一个用于显示原始图像的坐标控件;由于软件需要实现多功能,需要一个下拉框实现功能的选择;一个开始功能处理的按钮,称为“开始处理”按钮;一个用于显示图像处理结果的坐标控件。最后需要一个退出操作界面的按钮,称为“退出”按钮。 1.2 图像几何校正需求分析 原始图像在拍照时出现了倾斜,需要将图像校正,消除倾斜。通过对图像的观察,图像是一支票,支票上存在表格。因此想法是通过检测支票表格边框线的倾斜角,就是整图像的倾斜程度,然后根据这个倾斜角旋转,便可得到校正的水平图像。要检测支票图像表格边框直线。需要对图像的边缘进行检测,图像的边缘检测方法很多,如:sobel算子边缘检测,prewitt算子边缘检测,roberts 算子边缘检测,log算子边缘检测,canny算子边缘检测等,由于原图的噪声并不是很严重,因此上面这些边缘检测办法都能胜任,这里使用log算子进行边缘检测,为了适应其它边缘检测方法,本设计需要尽量在改变边缘检测方法时尽可能少地修改代码。边缘检测后,采用Hough变换提取直线,然后在提取的直线上找两个点,计算出直线的倾斜角度。最后根据这个倾斜角度对图像进行旋转。

相关文档
最新文档