第3章多媒体信息处理技术

第3章多媒体信息处理技术
第3章多媒体信息处理技术

第三章多媒体信息处理技术

通过本章学习,了解多媒体信息处理技术的基本问题,包括多媒体数据的分类、多媒体信息的计算机表示、多媒体数据压缩和编码技术、音频卡和视频卡的应用。重点掌握多媒体信息处理技术的基本概念,学会音频卡和视频卡的安装与使用,了解多媒体技术中数据的压缩与编码方法。

3.1 多媒体数据的分类

媒体是承载信息的载体,是信息的表示形式。信息媒体元素是指多媒体应用中可以显示给用户的媒体组成元素,目前主要包括文本、图形、图像、声音、动画和视频等媒体。

一、多媒体数据的特点

多媒体数据具有数据量巨大、数据类型多、数据类型间差别大、数据输入和输出复杂等特点。多媒体数据类型多,包括图形、图像、声音、文本和动画等多种形式,即使同属于图像一类,也还有黑白、彩色、高分辨率和低分辨率之分,由于不同类型的媒体内容和格式不同,其存储容量、信息组织方法等方面都有很大的差异。

二、多媒体数据的分类

1.文字

在计算机中,文字是人与计算机之间信息交换的主要媒体。文字用二进制编码表示,也就是使用不同的二进制编码来代表不同的文字。

文本是各种文字的集合,是人和计算机交互作用的主要形式。

文本数据可以在文本编辑软件里制作,如Word编写的文本文件大都可以直接应用到多媒体应用系统中。但多媒体文本大多直接在制作图形的软件或多媒体编辑软件时一起制作。

2.音频

音频泛指声音,除语音、音乐外,还包括各种音响效果。将音频信号集成到多媒体中,可提供其他任何媒体不能取代的效果,从而烘托气氛、增加活力。

3.图形、图像

凡是能被人类视觉系统所感知的信息形式或人们心目中的有形想象都称为图像。

图形文件基本上可以分为两大类:位图和向量图。

位图图像是一种最基本的形式。位图是在空间和亮度上已经离散化的图像,可以把一幅位图图像看成一个矩阵,矩阵中的任一元素对应于图像的一个点,而相应的值对应于该点的灰度等级。

图形是指从点、线、面到三维空间的黑白或彩色几何图形,也称向量图。图形是一种抽象化的图像,是对图像依据某个标准进行分析而产生的结果。

向量图形文件则用向量代表图中的文件,以直线为例,在向量图中,有一数据说明该元件为直线,另外有些数据注明该直线的起始坐标及其方向、长度或终止坐标,

图形文件保存的不是像素点的值,而是一组描述点、线、面等几何图形的大小、形状、位置、维数等其他属性的指令集合,通过读取指令可以将其转换为屏幕上显示的图像。由于大多数情况下不需要对图形上的每一个点进行量化保存,所以,图形文件比图像文件数据量小很多。图形与图像是两个不同的概念。

4.动画

图像或图形都是静止的。由于人眼的视觉暂留作用,在亮度信号消失后亮度感觉仍可保持1/20s~1/10s。利用人眼视觉惰性,在时间轴上,每隔一段时间在屏幕上展现一幅有上下关联的图像、图形,就形成了动态图像。任何动态图像都是由多幅连续的图像序列构成的,序列中的每幅图像称为一帧,如果每一帧图像是由人工或计算机生成的图形时,称为动画;若每帧图像为计算机产生的具有真实感的图像时,称为三维真实感动画;当图像是实时获取的自然景物图像时就称为动态影像视频,简称视频。

用计算机制作动画的方法有两种:一种称为造型动画,另一种称为帧动画。帧动画由一幅幅连续的画面组成图像或图形序列,是产生各种动画的基本方法。造型动画则是对每一个活动的对象分别进行设计,赋予每个对象一些特征(如形状、大小、颜色等),然后用这些对象组成完整的画面。

5.视频

影像视频是动态图像的一种。与动画一样,由连续的画面组成,只是画面图像是自然景物的图像。

计算机视频图像可来自录像带、摄像机等视频信号源,这些视频图像使多媒体应用系统功能更强、更精彩。

3.2 多媒体信息的计算机表示

一、文本文件格式

常用的文本文件的格式有TXT、RTF以及WORD格式的DOC、DOT文件。

二、声音文件格式

常用的声音文件格式有WAV、MID和MP3等。

Windwos使用的标准数字音频称为波形文件,文件的扩展名为WAV,记录了对实际声音进行采样的数据。在适当的硬件及计算机控制下,使用波形文件能够重现各种声音,无论是不规则的噪音还是CD 音质的音乐,也无论是单声道还是立体声。

通过Windows的对象连接与嵌入技术,波形文件可以嵌在其他Windows应用系统中使用。由于波形文件记录的是数字化音频信号,因此,可由计算机对其进行处理和分析。如放慢或加快放音速度,将声音重新组合或抽取一些片段单独处理等等。

WAV文件还原成的声音的音质取决于声音卡采样样本的尺寸。一般来说,采样的样本尺寸越大,采样频率越高,音质就越好,但波形音频文件也就越大,开销就越大。因此,波形音频一般适用于以下几个场合:

①播放的声音是讲话语音,音乐效果对声音的质量要求不太高的场合。

②需要从CD-ROM光盘驱动器同时加载声音和其他数据,声音数据的传输不能独占处理时间的场合。

③需要在PC硬盘中存储的声音数据在1分钟以下以及可用存储空间足够的场合。

2. MIDI文件

MIDI(Musical Instrument Digital Interface)是指乐器数字化接口,MIDI文件的扩展名是MID。MIDI标准是数字式音乐的国际标准。把一个MIDI设备连接到PC的主要目的是记录MIDI乐器产生的声音。然后,对记录的音乐进行编辑和后期处理,把它们与其他乐器的录音进行组合,以产生出类似管弦乐队演奏效果的音乐。

3.MP3文件

MP3格式的音乐越来越受到人们的欢迎。MP3文件是一种压缩格式的声音文件,其扩展名为MP3。MP3文件的特点是音质好、数据量小。

三、图形、图像文件格式

常见的图形文件的格式有如下几种:BMP、PCX、GIF、TIF、JPG、TGA等。

1.GIF(Graphic Interchange Format)文件

2.BMP(bitmap)文件

3.JPG文件

4.TGA文件

5.TIF文件

6.PCX文件

四、影像文件格式

影像文件通常泛指自扫描仪或视频卡读入的静态画面(影像)。

在动态图像的文件格式中,常用的有AVI 、MOV、MPG和DAT文件等。

1.AVI

2.MOV文件

3.MPG文件格式

4.DAT文件格式

5.DIR文件格式

五、动画文件格式

多媒体应用中使用的动画文件主要有GIF、AVI、SWF等等。

1.GIF文件

2.SWF文件

3.3 多媒体数据压缩和编码技术

一、多媒体的数据量、信息量和冗余

多媒体计算机面临的最大难题是大量数据的存储与传送问题。在所有可能的数据库中,图像是数据量最大的数据类型。

数据是用来记录和传送信息的,或者说数据是信息的载体。对于人类而言,真正有用的不是数据本身,而是数据所携带的信息。

信息量与数据量的关系是:信息量=数据量+数据冗余

多媒体数据中存在的数据冗余类型有:空间冗余、时间冗余、编码冗余、结构冗余、知识冗余和视觉冗余等。

1.空间冗余

空间冗余是图像数据中经常存在的一种冗余。在同一幅图像中,规则物体和规则背景的表面物理特性具有相关性,这些相关性在数字化图像中表现为数据冗余。

2.时间冗余

时间冗余是序列图像如电视图像、运动图像和语音数据中经常包含的冗余。图像序列中的两幅相邻的图像,后一幅与前一幅之间有较大的相关,反映为时间冗余。在语音中,由于人在说话时其发音的音频是一个连续渐变的过程,而不是一个时间上完全独立的过程,因而存在时间冗余。

3.编码冗余

编码冗余也称为信息熵冗余,信息熵是指对一团数据所携带的信息量。

4.结构冗余

有些图像从大域上看存在着非常强的纹理结构,表现为结构冗余。 5.知识冗余

对有许多图像的理解与某些背景知识使有相当大的相关性。例如,人脸的图形有固定的结构等。这类规律性的结构可由先验知识和背景知识得到,表现为知识冗余。

6.视觉冗余

人类的视觉系统对于图像场的注意是非均匀的、非线性的,视觉系统并不能对于图像场的任何变化都有所感知。换句话说,尽管在对图像的编码和解码处理时,由于压缩或者量化引入噪声而使图像发生了一系列的变化,如果这些变化不能被视觉所察觉的话,我们仍认为图像是完好的或足够好的。事实上,人类视觉系统的一般分辨能力约为26灰度级,而一般图像的量化采用的是28灰度级,这样的冗余称为视觉冗余。

7.其他冗余

例如由图像的空间非定常特性所带来的冗余等。

正是由于多媒体数据中存在各种各样的冗余,才使得多媒体数据可以被压缩。针对冗余的类型不同,人们已经提出了各种各样的方法实施对多媒体数据的压缩。

二、数据压缩的基本方法

数据压缩处理一般由两个过程组成:一是编码过程,将原始数据经过编码进行压缩,以便存储与传输;二是解码过程,对编码数据进行解码,还原为可以使用的数据。

数据压缩处理方法的分类:

1.按照解码后的数据与原始数据一致性分类

根据解码后的数据与原始数据是否完全一致来进行划分,数据压缩方法有两类:可逆编码方法和不可逆编码方法。

2.按方法的原理分类

根据方法的原理进行分类,可以划分为预测编码、变换编码、量化与向量量化编码、信息熵编码、分频带编码、结构编码和基于知识的编码等。

三、音频信号的压缩编码

音频信号分为电话质量的语音、调幅广播质量的音频信号和高保真立体声信号。语音信号的频率范围是300Hz到3400Hz。随着带宽的增加,信号的自然度将逐步得到改善。高保真音频信号的频率范围是20Hz到20000Hz。

声音信号的编码方式可以分为三大类:

波形编码:要求重构的声音信号尽可能地接近于原始声音。典型的波

形编码技术有脉冲编码调制(PCM)、自适应差分脉冲编码调制(ADPCM)、自适应预测编码(APC)、子带编码(SDC)、自适应变换编码(ATC)等。

分析合成编码:以声音信号产生模型为基础,将声音信号变换成模型参数后再进行编码,又称为参数编码方法。典型的分析和合成技术有通道声码器、共振峰声码器、同态声码器、线性预测声码器等。

混合型编码:是一种在保留分析合成编码技术精华的基础上,引用波形编码准则去优化激励源信号的方案,可以在4.8k位/秒~9.6k位/秒的编码率上获得较高质量的合成声音。

最简单的数字编码方法是对声音信号作直接的模/数转换。只要采样频率足够高,量化位数足够多,就能保证解码器恢复的声音有很好的质量。

四、视频信号的压缩编码

1.视频信号的压缩编码分类

图像压缩方法可以分成两种类型:有损压缩和无损压缩。

2.视频信号的压缩编码标准

JPEG和MPEG就是得到国际标准化组织认可并推荐的两个国际标准。 JPEG是联合专家小组(Joint Photographic Experts Group)的英文缩写。

MPEG是运动图像专家组(Moving Pictuer Experts Group)的英文缩写。MPEG标准包括MPEG视频、MPEG音频和MPEG系统三大部分。 3.JPEG静止图像压缩算法

JPEG标准是面向连续色调、多级灰度、彩色或单色静止图像的压缩标准,它定义了两种基本的压缩算法:一种是无失真压缩算法;另一种是有失真压缩算法。

4.MPEG运动图像压缩算法

3.4 音频卡

一、音频卡的功能

音频卡的主要功能包括:音频的录制与播放、编辑与合成、MIDI、文语转换、CD-ROM接口及游戏接口。

1.录制与播放

将外部的声音信号通过音频卡录入计算机,并以文件的形式进行保存。需要播放时,只要调出相应的声音文件,就像普通录放机一样,从而使计算机既具有图像显示又有声音输出。

2.编辑与合成

编辑与合成就像一部音频编辑器,它可以对声音文件进行多种特殊效

果处理:包括倒播、增加回音、静噪、淡入淡出、往返放音、交换声道以及声音由左向右或由右向左移位等。

3.MIDI和音乐合成

MIDI是乐器数字接口的标准,它规定了电子乐器与计算机之间相互数据通信的协议。通过软件,计算机可以直接对外部电子乐器进行控制和操作。

4.文语转换和语音识别

文语转换就是把计算机内的文本转换成声音。一般音频卡都提供英语文语转换软件。

音频卡的其他接口还有:CD-ROM接口、游戏棒接口等。

二、音频卡的组成与工作原理

音频卡通过环境音响效果技术,进行环绕音响渲染,产生栩栩如生、身临其境的音响效果,如置身于乐队中。

音频卡的组成:

①声音的合成与处理。

②混合信号处理器及功率放大器。

③计算机总线接口和控制器。

三、音频卡的安装

1.硬件安装

2.软件安装

四、用“录音机”生成和处理波形文件

1.生成波形文件

用“录音机”采集声音的分为三个步骤:

⑴设置混音器

⑵设置录音属性

⑶录音

2.编辑波形文件

编辑波形文件的操作步骤:

⑴剪辑文件

⑵对文件作特殊效果处理

3.5 音乐合成与MIDI

一、音乐合成

乐音必备的三要素是:音高、音色和音强。若把一个乐音放在运动的旋律中,它还应具备时值,即持续时间。这些要素的理想配合是产生优美动听的旋律的必要条件。

音高指声波的基频,基频越低,给人的感觉越低沉。

音色由声音的频谱决定,各个谐波的比例不同,随时间衰减的程度不

同,音色就不同。

音强是对声音强度的衡量,它是听判乐音的基础。

时值具有明显的相对性,时值的变化导致旋律或平缓、均匀,或跳跃、颠簸以表达不同的情感。

调频(FM)是使高频振荡波的频率按照调制信号规律变化的一种调制方式。

二、MIDI规范

MIDI是乐器数字接口(musical instrument digital interface)的英文缩写。

MIDI文件记录的不是声音本身,因此比较节省空间。

MIDI标准规定了不同厂家的电子乐器与计算机连接的电缆和硬件。它还指定从一个装置传送数据到另一个装置的通信协议。

MIDI标准中规定了多媒体个人计算机(MPC)包括一个内部合成器和标准MIDI端口。

3.6 视频卡

一、视频卡的功能

视频卡是一种处理活动影像数据的扩展卡。

视频卡种类:

①视频转换卡用来将视频信号转换成计算机存储的数字视频信号保存在计算机中或在VGA显示器上显示,或将VGA信号转换成电视信号,使计算机信号可以在电视或录像机上播放。

②视频捕捉卡用来从正在播放的动态画面中截取一些画面。

③窗口动态视频卡用来利用重叠、淡入、淡出等功能,提供窗口显示功能和数字化静止画面。

④动态视频捕捉播放卡用来同时抓取动态视频信号和声音信号并加以压缩、存储和播放。

⑤视频压缩卡用来根据JPEG/MPEG的标准对数据进行压缩和还原。

⑥视频还原卡用来实现将压缩后保存在计算机中的视频信号在计算机的显示器上播放出来。也称为视频回放卡、解压缩卡或电影卡。

⑦电视卡用来将计算机变成一台电视机,收看不同频道的电视节目。

二、视频卡的安装

1.硬件安装

2.软件安装

三、视频信息的处理

1.视频处理系统简介

多媒体计算机系统中,对视频信号的应用大致分为三个过程:视频信息的采集、视频信息的编辑以及视频信息的应用。

⑴视频信号的捕获

⑵视频信息的编辑

⑶视频信息的应用

2.视频采集和编辑软件的功能

视频采集和编辑软件的基本功能:

①提供视频获取功能,可以与视频采集卡协同工作以实现视频图像截取。

②提供无硬件视频回放功能。借助于某些算法可以在窗口中播放活动视频图像。

③提供AVI文件格式,它保存了声音和视频的所有信息,并有相应的同步机制以确保播放时声音和视频同步。

④从硬盘或CD-ROM中有效地读出并播放视频信息。

⑤将多种媒体数据综合处理为一个视频文件。

⑥具有多种活动图像的特技处理功能。

四、用“超级解霸”获取和处理视频信息

1.从VCD上抓取图像

2.从VCD上连续摄像

3.从VCD上截取片段并保存为MPG或MPV文件

4.VCD转为AVI

本章小结

通过本章学习,我们已经掌握了多媒体数据的基本概念。由于多媒体数据的多样性,使得多媒体数据文件的格式繁多,包括声音文件、图形文件和影像文件。了解这些文件的基本表示原理和存储格式是十分重要的。音频卡和视频卡是多媒体计算机系统中的重要设备,借助于音频卡,可以输入、处理、输出声音信息;视频卡则用于活动图像的输入、编辑加工处理和输出,从而向用户展示一个精彩纷呈的多媒体世界。

多媒体信息处理教学大纲

多媒体信息处理教学大纲 课程名称:多媒体信息处理 适用专业: 学时:44 学分: 开课学期:第二学期 课程类别:限定选修 先修课程:计算机应用基础 一、课程性质与任务 多媒体信息处理课程分为两大块:音视频处理技术(premiere)以及多媒体综合技术(Authorware)。课程的特点是概念多、实践性强、涉及面广,并有极广泛的实用性,其应用渗透到各个领域。本课程的目的与任务是使学生通过本课程的学习,理解音视频和多媒体综合技术的基本概念和主要功能,掌握相关软硬件的使用方法,具备音视频和多媒体处理的能力,从而为学生以后的学习和工作打下基础。 1、多媒体综合技术(Authorware): Authorware是多媒体信息处理中的重要综合技术。本课程基本任务是使学生掌握Authorware的具体设计方法。主要包括:基本操作,编辑功能,文件和图片的创建,显示效果,动画设计,声音、视频,流程管理,变量、函数和表达式的应用等,要求掌握有关概念,必要的理论,掌握具体操作,解决实际应用问题。 2、音视频处理技术(premiere) 主要讲授利用Premiere进行数码视频捕捉,并通过使用多轨的影像与声音合成来制作Microsoft Video for Windows(.avi)和QuickTime Movies(.mov)等动态影像格式的基础知识和基本技巧,使学生不仅使能全面地掌握Premiere软件的各

个知识点,还能运用这些知识点制作出实用的作品或实现某些较复杂视频、音频处理目的。其主要任务是为计算机多媒体技术人员进行多媒体视频处理奠定必要的理论基础和实际处理能力,并最终提高分析问题、解决问题的能力。 本课程注重讲解基本知识,训练基本技能,强化实践开发环节,使学生熟练运用Premiere环境进行简单视频处理,培养学生独立分析问题和解决问题的能力。为最终适应实际较复杂的工作奠定坚实的基础。 二、课程的教学内容与教学要求 第一部分:多媒体综合技术(Authorware) (一)Authorware基础 , 教学要求:熟悉Authorware编辑环境的各个组成部分,掌握流程设计的基本操作、程序设 计、运行和调试的具体步骤。 , 主要内容: (1) Authorware的运行环境,编辑环境 (2) 流程线的编辑和设计 (3) 窗口 (4) 程序的运行和调试 1 (二)文本和图片的创建 , 教学要求:熟练掌握文本和图形的创建。 , 主要内容: (1) 绘图工具箱 (2) 文本对象的创建 (3) 外部文本文件的引入 (4) 图形对象的创建

多媒体信息处理技术的发展现状

摘要:随着现在科学技术的发展,信息化时代已经成为现在社会的主流。信息化时代的实现主要来自于多媒体的发展。多媒体在给我们的生活带来便利的同时,也加快了社会发展的进程。多媒体具有更新快、系统复杂的特点。因此,要想适应现在社会的发展,跟上时代的脚步,必须对多媒体信息处理的技术进行探究,了解当代社会多媒体信息处理技术的发展现状。 关键词:多媒体;信息处理;发展现状 中图分类号:tp37 文献标识码:a 文章编号:1009-3044(2016)15-0214-02 当代社会已经进入信息化时代,信息化的发展离不开多媒体技术的进步。为了进一步了解多媒体的作用,最大限度的发挥多媒体的作用。我们就要对当前多媒体信息技术的发展现状进行研究。多媒体具有识别声、像、图的功能。多媒体是由单媒体组成的,主要包括感觉媒体、表示媒体、显示媒体、储存媒体和传输媒体五个部分。本文主要从多媒体的功能角度出发,探讨当代社会多媒体信息处理技术的发展。 1 多媒体与图像合成和编辑 图像合成是多媒体常用的一个信息处理技术。通过对多媒体的设置编程,构建出二维的图像空间。在实际的应用中,主要分为四个步骤。 1)要根据客户的需要,制定好图像的大小、颜色、版式。这一部分主要需要专业美术人员的参与制作。 2)采集图片素材。使用数码相机或摄影机,对所需的图片内容进行选景拍照。整个过程最好由专业的摄影人员进行操作。然后将所得到的素材传入到计算机中,并对多媒体图片素材进行筛选。 3)进行图片处理,合成和编辑。对筛选出的图片进行合成修饰和编辑。按照客户的需求,将二维的图片进行处理。 4)在图片中加入特效文字。图片处理完成后,可以按照客户的需要,加入一些特效的文字。特效的文字可采用透明、火焰等二维文字,也可采用立体的形象生动的三维文字。 利用多媒体进行图像合成与编辑可以应用在摄影图片、宣传广告和商业用途上。具有很高的应用价值。 2 多媒体与三维动画 现代动画的制作都离不开多媒体的制作合成。动画的制作过程主要包括二维或三维的动画图像、配音、字幕和背景音乐。通过动画制图软件,构建立体的三维动画,使其运用到商业广告、宣传片或动画片制作中。动画对于多媒体来说是一个不小的挑战。因为它所需要的素材内容信息量较大。而且现在对动画的需求越来越多,尤其是三维动画,让三维动画的虚拟空间更加接近现实空间,是现在多媒体动画制作的目标。为了实现这一目标,了解多媒体信息处理技术的发展现状成为了现在社会不可忽视的问题。 3 多媒体与教学 4 多媒体与管理信息系统 多媒体的发展给社会带来了许多的便利条件。多媒体给当代的许多管理方面带来了不小的价值。例如,利用多媒体,我们安装了电子监控系统。在刑事案件的破案中,这些系统发挥着重要的作用,是破案的关键。我们在出行时,各种售票服务窗口都与多媒体有着千丝万缕的联系。在办理银行业务时,金钱的存入与输出都离不开多媒体的服务。所以说,在信息化时代的今天,我们离不开多媒体,因此,了解多媒体信息处理技术的发展现状,是当近社会不可小觑的问题。 5 多媒体与经济发展 6 多媒体与科技的发展 众所周知,多媒体是促进科技发展的主要推动力,科技的发展也离不开多媒体的支持与运用。现在的一些科学技术,如航空航天的应用操作技术,都是是多媒体为基础的。多媒体

多媒体-名词解释及填空

◆多媒体:指信息表示媒体的多样化,常见的多媒体有文本、图像、图形、声音、音乐、视频、动画等多种形式。 ◆多媒体技术:是利用计算机技术把文本、声音、视频、动画、图形和图像等多种多媒体进行综合处理,使多种信息之间建立逻辑连接,集成一个完整的系统。 ◆多媒体(从本质上)的重要特征:多维化、继集成性、交互性、实时性。 ◆多媒体及多媒体技术产生于20世纪80年代 ◆多媒体计算机(MPC)标准:MPC1 1990年诞生;MPC2 1993年5月;MPC 1995年6月 ◆多媒体的核心任务:获取、处理、转发或分发多媒体信息,使多媒体信息之间建立逻辑链接 ◆多媒体信息处理的最终目标:能跨越各种网络和设备,透明的、强化的使用多媒体资源 ◆多媒体系统的关键技术:多媒体数据的处理、多媒体数据的存储、多媒体数据的传输、多媒体输入/输出技术 ◆多核处理器:指将多个运算核封装在一个芯片内部。 ◆多媒体信息以3种模式相互集成:制约式、协作式、交互式 ◆超媒体:是超文本和多媒体信息浏览坏境下的结合。它采用面向对象的信息组织与管理形式。 ◆超媒体信息网络:将多媒体各个信息单元组成一个由节点和各种链构成的网络。

◆虚拟现实(UR)就是采用计算机技术生成一个逼真的视觉、听觉、触觉及嗅觉的感觉世界,用户可以用人的自然技能对这个生成的虚拟实体进行交互考察 ◆人机界面设计目的:通过对用户需求的解释大道一种人机之间较好的通信能力 ◆高速多媒体通信技术:指为满足新一代信息系统中实时多媒体信息传输的需要。 ◆多媒体技术的应用:①音频/视频流点播;②电子出版物;③医疗卫生;④游戏与娱乐;⑤计算机视频会议;⑥多媒体展示和信息查询系统;⑦管理信息系统(MIS)和办公自动化系统(OA);⑧传媒、广告;⑨教学管理系统;⑩移动卫星。 ◆多媒体技术未来将朝着智能化和多维化方向发展 ★多媒体计算机硬件组成:主机、音频/视频处理设备、光盘驱动器、媒体输入/输出设备 ★CPU(central processing unit)中央处理器,其内部结构可分为控制单元、逻辑单元、存储单元 ★多媒体I/O设备可分为:输入设备、输出设备、用于网络通信的通信设备 ★触摸屏分类:电阻式、电容式、红外线式、声表面波式 ★视频捕捉卡:把输入的模拟视频信号通过内置芯片提供的捕捉功能转换成数字信号设备

论多媒体信息处理技术现状与应用发展

学院:计算机科学与教育软件学院班级:计科138姓名:叶海峰学号:1300002032 论多媒体信息处理技术现状与应用发展 多媒体技术被广泛的应用到生活学习中,并且以发展快、技术活跃等优点独占鳌头,现已成为新一代电子技术开发和竞争的主要焦点。多媒体技术中的媒体通常是指信息载体。现下对“媒体”有多种解释,但是其主要分为五类:感觉媒体、表示媒体、显示媒体、存储媒体、传输媒体。多媒体技术的出现使计算机领域更加的丰富多样,同时也使计算机世界充满了生机和活力。多媒体的快速发展已是当今网络趋势下的必然走势,并且会更加优质和高效地发展下去。 多媒体技术的现状: 如今,多媒体技术在私人电脑及生活中的普遍应用。 1、多媒体中的图像设计。每一个多媒体项目的创建都是十分复杂的,其中包括对图形元素、人物、截面按钮等的创建或对其他东西的创建,其都是由某种类型的图文信息来组成。直观的图像显示是媒体产品中不可或缺的一部分,二者关系的重要性不言而喻,因为图形是多媒体的基本要素之一。 2、多媒体中的动画设计。二维动画是多媒体动画中的主要表现形式。二维动画:无论是在卡通动画或是电影电视上,需要用到二维动画技术的地方较多。美工需要绘制出很多相关的画面并且要借助计算机来完成。在二维动画的制作中,计算机的作用相当重大。使用计算机进行二维动画创作可以提高工作效率和加强观赏效果。 3、多媒体中的数字视频。现代数字视频技术是将传统模拟视频片段捕获并转换成能被电脑调用的数字信号的技术。我们常见的VCD就是这样一种经过压缩而形成的数字视频媒介。数字视频有着使媒体作品生动完美、制作难度比动画制作低等优点。数字视频技术被国际标准化协会所认可,国际标准化协会对此还制定了三项有关图像压缩编码的国际标准:JPEG标准、H.261标准及MPEG标准。 4、多媒体中的数字音乐。多媒体声音主要分为两大类:音乐和音效,音乐不仅包括普通的音乐还包括MIDI音乐。 对声音的处理主要是应用音频信息处理技术,具体为:对音乐进行合成、特定对象与非特定对象的语音识别、文字到图像的相互转换。在多媒体技术被广泛应用的今天,存储信息的重要性日益明显,其包括:WAV文件、VOC文件、MIDI文件、AIF文件及AAC文件等。 5、多媒体中的语音识别。多媒体技术发展至今,由于科学技术的不断完善和发展,新技术的出现使语音识别有着实质性的发展。值得一提的是,对HMM的研究和应用推动了语音识别技术的发展。在科学技术快速发展的今天,对语音系统的研究也日益完善,之后陆续出现了很多在HMM模型基础上的多类别语音识别软件系统。 6、多媒体中的超文本。超文本是多媒体技术中的重要技术应用,超文本是在计算机和多媒体不断发展壮大的基础上发展起来的。超文本将声音、文字和图像进行了有机的结合,同时也对综合表达信息起到了至关重要的作用。超文本现在被广泛的应用同时且发挥着其巨大的作用,这对未来多媒体技术的发展起到了推动性作用。

多媒体信息处理

多媒体信息处理总结 PROJECT:深度图的优化 论文题目:Ef?cient Spatio-Temporal Hole Filling Strategy for Kinect Depth Maps 姓名:董有臣 学号:M201271706 学院:电信系 指导老师:喻莉

深度图的优化 ——深度图修复的结构引导融合 一、综述 深度对于计算机视觉非常重要,因为它是理解真是场景的一种内核信息。随着计算机视觉应用的日益广泛一级自动化程度的进一步提高,人们对于计算机视觉系统的要求也越来越高。然而,传统的计算机视觉系统所处理的是光学图像,这种光学图像反应的是场景的光强也颜色信息,由于投影成像的原理,它失去了现实世界中的三维深度信息,并且因为从二维光学图像中恢复物体的深度信息的困难性,使得计算机视觉系统在这些应用领域受到很大的限制。 近年来,随着激光测距技术的迅猛发展,直接包含物体深度信息的深度图像数据获取已经成为可能,基于深度信息的计算机视觉系统也随之引起人们的重视。深度成像传感器用来测量景物表面的三维坐标数据,它的输出称之为深度图像,深度图像与环境光照和阴影无关,它的像素点清晰地表达了景物表面的几何形状。从灰度图像中提取三维物体几何特征的方法,对景物的几何和物理特征都有特别的限制,与这些方法相比,深度图像可以直接利用三维信息,这就大大简化了三维物体的识别和定位问题。作为这种新型的计算机视觉系统的核心内容,深度图像处理方法的研究具有非常重要的意义。 由于受到人类双眼系统的影响,传统的获取深度信息的方法都是基于多视图几何体的,最近几年,对于深度获取引进了一些新的经济

设施,比如:时间飞行传感器,结构光,以及Kinect。继Kinect的产生之后,深度的获取变得相对容易了,对于计算机视觉应用,通过Kinect获取的深度图需要额外的处理来填补丢失的部分。然而,对于彩色图像中传统的修复方法并不能直接应用于深度图,因为没有足够的信息来对场景结构作出准确的判断。因此便提出了一种新的基于融合的修复方法来改善深度图,这种方法将传统的修复方法与最近研究的非局部滤波算法结合到一起。 二、翻译 1、基于融合的深度图修复 基于深度和彩色相机的几何关系,通过多视图几何体推导出了一个映射函数,由于队列较复杂,我们仅仅表示了垂直方向的映射函数: p=m(p’,d(p’)) (1)(其中:d(p’)表示深度像素p’,p代表彩色图像上的一个像素)这个映射函数将深度图上的像素p’投影到彩色图像上为p,通过对投影在彩色图像上的深度图的重新采样得到了一个增广数据阵列{d(p),J(p)}。在这个增广阵列上,彩色信息对于所有的像素都是有效的,然而,对于像素p,深度信息却丢失了,因此,深度图的修复就是在知道深度和彩色像素的条件下,恢复深度信息丢失的部分。由于传统的对像素研究的图像修复是在没有额外信道信息的条件下进行的,所以通过Kinect获取深度图的修复可以被认为是部分修复。 投影后,我们可以只用彩色图像坐标系统。在一个通用的修复结构中,我们能够通过已知的附近的像素q的深度d(q)来预测未知的像

多媒体信息处理技术(5)教学文稿

多媒体信息处理技术 (5)

多媒体信息处理技术 1 多媒体数据的分类 媒体是承载信息的载体,是信息的表示形式。信息媒体元素是指多媒体应用中可以显示给用户的媒体组成元素,目前主要包括文本、图形、图像、声音、动画和视频等媒体。 一、多媒体数据的特点 多媒体数据具有数据量巨大、数据类型多、数据类型间差别大、数据输入和输出复杂等特点。多媒体数据类型多,包括图形、图像、声音、文本和动画等多种形式,即使同属于图像一类,也还有黑白、彩色、高分辨率和低分辨率之分,由于不同类型的媒体内容和格式不同,其存储容量、信息组织方法等方面都有很大的差异。 二、多媒体数据的分类 1.文字 在计算机中,文字是人与计算机之间信息交换的主要媒体。文字用二进制编码表示,也就是使用不同的二进制编码来代表不同的文字。 文本是各种文字的集合,是人和计算机交互作用的主要形式。 文本数据可以在文本编辑软件里制作,如Word编写的文本文件大都可以直接应用到多媒体应用系统中。但多媒体文本大多直接在制作图形的软件或多媒体编辑软件时一起制作。 2.音频 音频泛指声音,除语音、音乐外,还包括各种音响效果。将音频信号集成到多媒体中,可提供其他任何媒体不能取代的效果,从而烘托气氛、增加活力。 3.图形、图像

凡是能被人类视觉系统所感知的信息形式或人们心目中的有形想象都称为图像。 图形文件基本上可以分为两大类:位图和向量图。 位图图像是一种最基本的形式。位图是在空间和亮度上已经离散化的图像,可以把一幅位图图像看成一个矩阵,矩阵中的任一元素对应于图像的一个点,而相应的值对应于该点的灰度等级。 图形是指从点、线、面到三维空间的黑白或彩色几何图形,也称向量图。图形是一种抽象化的图像,是对图像依据某个标准进行分析而产生的结果。 向量图形文件则用向量代表图中的文件,以直线为例,在向量图中,有一数据说明该元件为直线,另外有些数据注明该直线的起始坐标及其方向、长度或终止坐标, 图形文件保存的不是像素点的值,而是一组描述点、线、面等几何图形的大小、形状、位置、维数等其他属性的指令集合,通过读取指令可以将其转换为屏幕上显示的图像。由于大多数情况下不需要对图形上的每一个点进行量化保存,所以,图形文件比图像文件数据量小很多。图形与图像是两个不同的概念。 4.动画 图像或图形都是静止的。由于人眼的视觉暂留作用,在亮度信号消失后亮度感觉仍可保持1/20s~1/10s。利用人眼视觉惰性,在时间轴上,每隔一段时间在屏幕上展现一幅有上下关联的图像、图形,就形成了动态图像。任何动态图像都是由多幅连续的图像序列构成的,序列中的每幅图像称为一帧,如果每一帧图像是由人工或计算机生成的图形时,称为动画;若每帧图像为计算机产生的具有真实感的图像时,称为三维真实感动画;当图像是实时获取的自然景物图像时就称为动态影像视频,简称视频。 用计算机制作动画的方法有两种:一种称为造型动画,另一种称为帧动画。帧动画由一幅幅连续的画面组成图像或图形序列,是产生各种动画的基本方法。造型动画则是对

《多媒体信息处理综合课程设计》

《多媒体信息处理综合课程设计》要求 课程设计要求 1、提交时间:第19周周一 2、设计报告包括封面、目录、正文(正文双面打印)、附录附程序代码 3、课程正文设计提纲格式 (1)概述 (2)设计原理(包括原理框图) (3)模块设计 (4)实现(程序流程) (5)实验结果与分析 (6)附录 4、图片或视频自拍,且包含本人。 5、答疑时间:每周1、4下午15-17点

课题1 玉米(或大米)颗粒图像计数系统设计与实现 一.设计目的 1.熟悉图像图像处理与识别的基本原理和方法; 2.理解和掌握颗粒图像识别的基本方法以及实现; 3.熟悉图像处理的编程环境。 二.设备及材料 1.PC机一台,扫描仪或照相机一台; 2.软件matlab/VC++等; 3.拍摄玉米、大米或枸杞等颗粒图像。 三.设计原理 四.设计要求 1. 熟悉图像自动识别的原理方法; 2、运用图像分割的基本理论和方法以及图像识别的基本原理,在MATLAB或VC++等软件 环境下对颗粒图像进行检测及识别程序进行调试,进而完成设计; 3.设计源程序,运行,观察识别结果。 五.实验结果 (a)原始图像(b)灰度化图像(c)中值滤波(d)边缘检测

(e)膨胀后图像(f)孔洞填充(g)腐蚀后图像(h)细胞分割 六.报告要求 1、给出实验设计方法过程及实现代码(编程语言不限); 2、输入一幅颗粒图像,给出中间结果图像,输出分割的颗粒图像,并统计出颗粒数目; 3、对实验结果进行分析,指出存在的问题。 课题2视频运动目标检测与跟踪 一.设计目的 1、掌握视频运动目标检测与跟踪的基本原理及方法; 2、了解视频运动目标跟踪的实际应用; 3、熟练掌握软件编程工具并实现视频运动目标检测与跟踪视频稳像。 二.实验设备及材料 1、PC机一台; 2、摄像机; 3.软件Matlab/VC++/OpenCV等。 三.系统原理 图2.1 背景模型运动目标检测 图2.1差分模型运动目标检测

多媒体信息处理考试答案

1.多媒体:融合两种或两种以上媒体的人——机互动的信息交流和传播媒体。 2.超链接:两个对象或文档元素之间的定向逻辑链接,也称为“热链接”或称 为“超文本链接”。 3.超文本:包含指向其他文档或文档元素的指针的电子文档。 4.无损压缩:用压缩后的数据进行重构(也还原或解压缩),重构后的数据与原 来的数据完全相同的数据压缩技术。无损压缩用于要求重构的数据与原始数据完全一致的应用,如磁盘文件压缩就是一个应用实例。根据当前的技术水平,无损压缩算法可把普通文件的数据压缩到原来的1/2~1/4。常用的无损压缩算法包括哈夫曼编码和LZW等算法。 5.有损压缩:用压缩后的数据进行重构,重回后的数据与原来的数据有所不同, 但不影响人对原始数据资料表达的信息或造成误解的数据压缩技术。 6.LZ77算法和LZ78算法的差别在哪里? LZ77 算法针对过去的数据进行处理,而LZ78 算法却是针对后来的数据进行处理。 LZ77算法通过使用编码器或者解码器中已经出现过的相应匹配数据信息替换当前数据从而实现压缩功能。LZ78 通过对输入缓存数据进行预先扫描与它维护的字典中的数据进行匹配来实现这个功能,在找到字典中不能匹配的数据之前它扫描进所有的数据,这时它将输出数据在字典中的位置、匹配的长度以及找不到匹配的数据,并且将结果数据添加到字典中。 7.LZ78算法和LZW算法的核心思想是什么?它们之间有什么差别? 核心思想:如果匹配串的长度比指针本身的长度长就输出指针,否则就输出真实字符。 差别:LZ78是每读入一个字符的同时,将其编入自己的字典,然后,再读入字符的同时,则在已有的字典里查找,没有的话该字符就在新编入辞典。如此循环。LZW是先建立了ASCII 码的字典,这样就事先花费了8个字节(256个ASCII码)的存储空间,然后再像LZ78一样读入字符,没有的再进行编入字典,如此循环。 8.量化:幅值连续的模拟信号转化成为幅值离散的数字信号的过程。 线性量化:在量化时,信号幅度的划分是等间距的量化。 非线性量化:在量化时,信号幅度的划分是非等间距的量化。 9.样本精度为8位的信噪比等于多少分贝?SNR=6.02n=6.02*8=48位 10.选择采样频率为22.050kHz和样本精度为16位的录音参数。在不采用压缩技 术的情况下,计算录制2分钟的立体声需要多少MB(兆字节)的存储空间 (1MB=1024*1024B)。(22.050*1000*16/8*2*2*60)/(1024*1024)=10.09MB 11.均匀量化:采用相等的量化间隔对采样得到的信号进行量化.它是线性量化的另一种说法.非均匀量化:采用非相等的量化间隔对采样得到的信号进行量化。例如,对大的输入信号采用大的量化间隔,对小的输入信号采用小的量化间隔。它是非线性量化的另一种说法。12.(1)什么叫μ率压扩?(2)什么叫A率压扩? (1)在脉冲编码调制(PCM)系统中,一种模拟信号和数字信号之间进行转换的CCITT压扩标准。在北美PCM电话网中使用该算法。(2) 在脉冲编码调制(PCM)系统中,一种模拟信号和数字信号之间进行转换的CCITT压扩标准。在欧洲电话网中使用该算法。 13.G.711标准定义的输出数据率是多少?T1的数据率是多少?T2的数据率是多少? 答:(1)G.711使用μ率和A率压缩算法,信号宽带为3.4kHz,压缩后的数据率为64kb/s (2)T1总传输率:1.544Mb/s (3)T2总传输率:6.312Mb/s 14.一个像素的RGB分量分别用3,3,2位表示的图像,问该幅图像的颜色数目最大的多少?如果有一幅256色的图像,问该图的颜色深度是多少?2^(3+3+2)=256(2)8位 15.α通道的作用:在计算机环境下,α通道可存储在帧缓冲存储器中的附加位平面上。对32位帧缓冲存储器,除高8位是α通道外,其余24位是颜色位,红绿蓝各占8位。

多媒体信息处理与传输技术作业

多媒体信息处理与传输技术作业

目录 目录 ............................................................................................................................................. - 2 -作业1 .......................................................................................................................................... - 3 -一JPEG概述 ............................................................................................................................. - 3 -二利用Matlab实现Jpeg图像压缩的具体步骤 ..................................................................... - 3 -三最终结果................................................................................................................................ - 6 -四所用程序................................................................................................................................ - 7 -作业2 ........................................................................................................................................ - 22 -一JMF概述 ..................................................................................................................... - 22 -二JMF的主要特点 ......................................................................................................... - 22 -三JMF的高层应用架构 ................................................................................................. - 22 -四JMF的基本模型 ......................................................................................................... - 23 -五应用JMF开发视频应用 ............................................................................................ - 24 - 5.1配置开发环境...................................................................................................... - 24 - 5.2用APPLET在浏览器中播放视频短片 ............................................................. - 24 - 5.3采集摄像头数据.................................................................................................. - 24 - 5.4获取摄像头视频数据和麦克风音频数据.......................................................... - 25 - 5.5保存摄像头数据为视频文件.............................................................................. - 26 - 5.6 捕获音频、视频数据为QuickTime格式的文件............................................. - 26 - 5.7 发送实时媒体数据............................................................................................. - 27 - 5.8 接收实时视频数据............................................................................................. - 28 - 六效果总结...................................................................................................................... - 28 -七参考文献...................................................................................................................... - 29 -

第3章多媒体信息处理技术

第三章多媒体信息处理技术 通过本章学习,了解多媒体信息处理技术的基本问题,包括多媒体数据的分类、多媒体信息的计算机表示、多媒体数据压缩和编码技术、音频卡和视频卡的应用。重点掌握多媒体信息处理技术的基本概念,学会音频卡和视频卡的安装与使用,了解多媒体技术中数据的压缩与编码方法。 3.1 多媒体数据的分类 媒体是承载信息的载体,是信息的表示形式。信息媒体元素是指多媒体应用中可以显示给用户的媒体组成元素,目前主要包括文本、图形、图像、声音、动画和视频等媒体。 一、多媒体数据的特点 多媒体数据具有数据量巨大、数据类型多、数据类型间差别大、数据输入和输出复杂等特点。多媒体数据类型多,包括图形、图像、声音、文本和动画等多种形式,即使同属于图像一类,也还有黑白、彩色、高分辨率和低分辨率之分,由于不同类型的媒体内容和格式不同,其存储容量、信息组织方法等方面都有很大的差异。 二、多媒体数据的分类 1.文字 在计算机中,文字是人与计算机之间信息交换的主要媒体。文字用二进制编码表示,也就是使用不同的二进制编码来代表不同的文字。 文本是各种文字的集合,是人和计算机交互作用的主要形式。 文本数据可以在文本编辑软件里制作,如Word编写的文本文件大都可以直接应用到多媒体应用系统中。但多媒体文本大多直接在制作图形的软件或多媒体编辑软件时一起制作。 2.音频 音频泛指声音,除语音、音乐外,还包括各种音响效果。将音频信号集成到多媒体中,可提供其他任何媒体不能取代的效果,从而烘托气氛、增加活力。 3.图形、图像 凡是能被人类视觉系统所感知的信息形式或人们心目中的有形想象都称为图像。 图形文件基本上可以分为两大类:位图和向量图。 位图图像是一种最基本的形式。位图是在空间和亮度上已经离散化的图像,可以把一幅位图图像看成一个矩阵,矩阵中的任一元素对应于图像的一个点,而相应的值对应于该点的灰度等级。

多媒体信息处理技术

《多媒体信息处理技术》教学大纲 一、课程基本信息 课程名称:多媒体信息处理技术 课程性质:专业必修 先修课程:计算机应用基础 适用专业:计算机信息管理、软件技术 开课学期:第2学期 学时:54学时 学分:3学分 二、课程的性质和任务 《多媒体信息处理技术》课程是广东理工职业学院计算机信息管理专业与软件技术专业的一门专业必修课。主要任务是介绍多媒体技术的基本概念、硬件环境,多媒体音频、图像、视频、动画制作技术及多媒体作品的设计与制作。 三、相关课程的衔接 学习该课程前要求学生对计算机系统的构成和Windows操作界面的使用有所了解,多媒体信息音频、图像、视频、动画制作技术应用于计算机辅助教育,为其他专业课程做辅助。 四、教学方法与重点、难点 教学方法:理论+课内实践 重点和难点:第3章多媒体音频技术、第4章多媒体图像处理技术、第5章多媒体视频处理技术、第6章多媒体动画制作技术、第7章多媒体作品的设计与制作 五、建议学时分配 以表格方式表现各章节的学时分配,表格如下:

六、课程考核 本课采用闭卷上机操作考试,时间120分钟。平时成绩占总评成绩的50%,期末成绩占总评成绩的50%。 七、教材及主要参考书 教材: 《多媒体技术与应用教程》雷运发主编,清华大学出版社,2008年9月第1版。 参考书: 《Adobe Audition2.0经典教程》美国Adobe公司著,人民邮电出版社,2007年9月第1版 《计算机图像处理技术—Adobe Photoshop CS2》汪可、张明真主编,高等教育出版社,2007年1月第1版 《精通Authorware 7.0》张远龙王兢等编著,中国科学技术出版社,2004年4月第1版、 《Adobe Premiere Pro CS3经典教程》美国Adobe公司著,人民邮电出版社,2008年9月第1版 八、教学内容 以“章节”为单位说明本章节的教学内容、教学基本要求和重点、难点,各章节格式如下: 第一章多媒体的基本概念 1、教学内容 ●多媒体的基本概念 ●多媒体相关技术简介

多媒体信息处理的关键技术

7.1.3 多媒体信息处理的关键技术 1.多媒体数据压缩/解压缩技术 多媒体数据压缩技术是多媒体技术中的核心技术。随着多媒体技术在计算机以及网络中的广泛应用,多媒体信息中的图像、视频、音频信号都必须进行数字化处理,才能应用到计算机和网络上。但是这些多媒体信息数字化后的数据量非常庞大,给多媒体信息的存储、传输、处理带来了极大的压力。因此,必须对数据进行压缩编码。 2.多媒体数据存储技术 如何实现多媒体大容量信息的存储是多媒体技术的关键。目前海量存储设备有磁带机、光盘机、硬盘机、存储卡等。 3.多媒体专用芯片技术 专用芯片是多媒体计算机硬件的关键器件。为了实现音频、视频信号的快速压缩、解压缩和播放处理,需要大量的快速计算,而且图像的绘制、生成、合并、特殊效果等处理也需要大量的计算。多媒体计算机专用芯片可归纳为两种类型:一种是固定功能的芯片;另一种是可编程的数字信号处理器(DSP)芯片。专用芯片可用于多媒体信息的综合处理,如图像的特效、图形的生成和绘制、提高音频信号处理速度等。 7.1.4 多媒体计算机系统的构成 1. 多媒体计算机系统 多媒体计算机系统是指能综合处理多媒体信息,使信息之间能建立联系,并具有交互性的完整的计算机系统。多媒体计算机与其他具有声音、影像播放功能的电视机、录像机等家用电器的根本区别在于多媒体计算机具有信息集成、交互等特有的功能。多媒体计算机系统一般由多媒体硬件系统和多媒体软件系统组成。 按照MPC的标准,多媒体计算机包含5个基本单元:主机、CD-ROM驱动器、声卡、音箱和Windows操作系统。MPC4要求在普通微机的基础上增加以下四类软、硬件设备,以便将PC机升级成MPC。 2.多媒体计算机的硬件系统 从处理的流程来看,一个功能较齐全的多媒体计算机系统包括输入设备、计算机主机、输出设备、存储设备几个部分(见图7.1)。除了普通PC的部件之外,多媒体计算机最基本的硬件是音频卡(Audio Card,简称声卡)、CD-ROM和视频卡(Video Card) 3.多媒体计算机的软件系统 多媒体软件系统按功能可分为系统软件和应用软件。 (1)系统软件 系统软件是多媒体系统的核心,它不仅具有综合使用各种媒体、灵活调度多媒体数据进行媒体的传输和处理的能力,而且要控制各种媒体硬件设备协调地工作。多媒体系统软件主要包括: ①多媒体操作系统 ②多媒体素材制作软件及多媒体函数库 ③多媒体创作工具与开发环境 ④多媒体外部设备驱动程序和接口程序 (2)应用软件 多媒体应用软件又称多媒体应用系统。它是由各种应用领域的专家或开发人员利用多媒体开发工具软件或计算机语言,组织编排大量的多媒体数据而成的最终多媒体产品,是直接面向用户的。多媒体应用系统所涉及的应用领域主要有文化教育、信息系统、电子出版、音像影视特技、动画等。

论多媒体信息处理技术现状与应用发展

论多媒体信息处理技术现状 与应用发展 -标准化文件发布号:(9456-EUATWK-MWUB-WUNN-INNUL-DDQTY-KII

学院:计算机科学与教育软件学院班级:计科138姓名:叶海峰学号:1300002032 论多媒体信息处理技术现状与应用发展 多媒体技术被广泛的应用到生活学习中,并且以发展快、技术活跃等优点独占鳌头,现已成为新一代电子技术开发和竞争的主要焦点。多媒体技术中的媒体通常是指信息载体。现下对“媒体”有多种解释,但是其主要分为五类:感觉媒体、表示媒体、显示媒体、存储媒体、传输媒体。多媒体技术的出现使计算机领域更加的丰富多样,同时也使计算机世界充满了生机和活力。多媒体的快速发展已是当今网络趋势下的必然走势,并且会更加优质和高效地发展下去。多媒体技术的现状: 如今,多媒体技术在私人电脑及生活中的普遍应用。 1、多媒体中的图像设计。每一个多媒体项目的创建都是十分复杂的,其中包括对图形元素、人物、截面按钮等的创建或对其他东西的创建,其都是由某种类型的图文信息来组成。直观的图像显示是媒体产品中不可或缺的一部分,二者关系的重要性不言而喻,因为图形是多媒体的基本要素之一。 2、多媒体中的动画设计。二维动画是多媒体动画中的主要表现形式。二维动画:无论是在卡通动画或是电影电视上,需要用到二维动画技术的地方较多。美工需要绘制出很多相关的画面并且要借助计算机来完成。在二维动画的制作中,计算机的作用相当重大。使用计算机进行二维动画创作可以提高工作效率和加强观赏效果。 3、多媒体中的数字视频。现代数字视频技术是将传统模拟视频片段捕获并转换成能被电脑调用的数字信号的技术。我们常见的VCD就是这样一种经过压缩而形成的数字视频媒介。数字视频有着使媒体作品生动完美、制作难度比动画制作低等优点。数字视频技术被国际标准化协会所认可,国际标准化协会对此还制定了三项有关图像压缩编码的国际标准:JPEG标准、H.261标准及MPEG标准。 4、多媒体中的数字音乐。多媒体声音主要分为两大类:音乐和音效,音乐不仅包括普通的音乐还包括MIDI音乐。 对声音的处理主要是应用音频信息处理技术,具体为:对音乐进行合成、特定对象与非特定对象的语音识别、文字到图像的相互转换。在多媒体技术被广泛应用的今天,存储信息的重要性日益明显,其包括:WAV文件、VOC文件、MIDI文件、AIF文件及AAC文件等。 5、多媒体中的语音识别。多媒体技术发展至今,由于科学技术的不断完善和发展,新技术的出现使语音识别有着实质性的发展。值得一提的是,对HMM的研究和应用推动了语音识别技术的发展。在科学技术快速发展的今天,对语音系统的研究也日益完善,之后陆续出现了很多在HMM模型基础上的多类别语音识别软件系统。 6、多媒体中的超文本。超文本是多媒体技术中的重要技术应用,超文本是在计算机和多媒体不断发展壮大的基础上发展起来的。超文本将声音、文字和图像进行了有机的结合,同时也对综合表达信息起到了至关重要的作用。超文本现

(完整版)多媒体技术考试试题及参考答案

多媒体应用技术试题及参考答案 ——WORD文档,下载后可编辑修改—— 一、选择题 1、Photoshop是一款 B 软件。 A.多媒体操作系统 B.多媒体工具软件 C.视频处理软件 D.音乐播放软件 2、多媒体计算机的硬件系统除了要有基本计算机硬件以外,还要具备一些多媒体信息处理的 A 。 A. 外部设备和接口卡 B.主机 C.显示器 D.外部设备 3、在播放音频时,一定要保证声音的连续性,这就意味着多媒体系统在处理信息时有严格的 D 要求。 A.多样性 B.集成性 C.交互性 D.实时性 4、不进行数据压缩的、标准的Windows图像文件格式是 A 。 A.BMP B.GIF C.JPG D.TIFF 5、由CompuServe公司开发、可以存储多幅图像并形成动画效果的图像文件格式是 B 。 A.BMP B.GIF

C.JPG D.PNG 6、GIF图像文件可以用1~8位表示颜色,因此最多可以表示 C 种颜色。 A.2 B.16 C.256 D.65536 7、对于调频立体声广播,采样频率为44.1kHz,量化位数为16位,双声道。其声音信号数字化后未经压缩持续一分钟所产生的数据量是 D 。 A.5.3Mb B.5.3MB C.8.8Mb D.10.6MB 8、通常用来保存未压缩的音频、属于事实上的通用音频文件格式的是 C 。 A.MP3 B.MIDI C.W A V D.WMA 9、显示器所用的颜色模型是采用 C 三种基本颜色按照一定比例合成颜色的方法。

A.红色、黄色、蓝色 B.青色、品红、黄色 C.红色、绿色、蓝色 D.红色、黄色、绿色 10、PNG图像文件采用无损压缩算法,其像素深度可以高达 D 位。 A.8 B.24 C.32 D.48 11、既是图像文件格式,又是动画文件格式的文件格式是 A 。 A.GIF B.JPG C.SWF D.MPG 12、数据压缩是指对原始数据进行重新编码,去除原始数据中 C 数据的过程。 A.噪音 B.冗长

多媒体基本知识概述

多媒体专题 1、多媒体知识: 1.1多媒体知识概述 ?基本概念 多媒体信息一般指用文本、图形、图像、动画、音频和视频影像等形式表示的信息。多媒体计算机技术是指利用计算机交互地综合处理相互之间有联系的文本、图形、图像、动画、音频、视频等多种信息。多媒体的主要特性表现在信息载体的多样性、交互性和集成性。 多媒体技术是指能对多种载体上的信息和多种存储体上的信息进行处理的技术; 而媒体是指承载信息的载体; 多媒体具有交互性而媒体不具备交互性; 屏幕更新频率:显示器每秒更新的次数; 彩数:显示画面的色彩数;(bpp是指表示每个像素所需的2进制位数) 分辨率:显示画面的细腻程度; ?关键技术 在多媒体的研究与开放中,利用了许多关键技术,这些技术是支持多媒体研究与开发的核心。 ◆数据压缩技术 数字化的声音和图像包含了大量的数据。如果不进行数据压缩,实时处理数字化的声音和图像信息所需要的存储容量、传输率和计算速度都是目前计算机难以承受的。所以数据压缩技术一直是多媒体各项研究的重点。 ◆大规模集成电路(VLSI)制造技术 进行声音和图像信息的压缩处理要求进行大量的计算。VLSI技术的发展让我们可以生产低廉的数字信号处理器(DSP)芯片用硬件来完成复杂的计算处理。 ◆大容量的光盘存储器(CD-ROM) 多媒体信息虽然经过了压缩处理,但还是含有大量的数据,所以需要有大容量的存储设备来保存这些信息。 ◆实时多任务操作系统 多媒体技术需要同时处理声音、文字、图像等多种媒体信息,其中声音和视频图像还要求实时处理,需要有能支持对多媒体信息进行实时处理的操作系统。 ?构成 通常,多媒体系统由以下4个部分构成。 ◆硬件系统 最重要是根据多媒体技术标准而研制生产的多媒体信息处理芯片、板卡和光盘驱动器等。 ◆多媒体操作系统 这是多媒体的核心,具有实时任务调度、多媒体数据转换和同步控制、对多媒体设备的驱动和控制,以及图形用户界面管理等。 ◆媒体处理系统工具 它是多媒体重要的组成部分,也称为多媒体系统开发工具软件。 ◆用户应用软件 1.2图形和图像 ?基本原理 ◆亮度、色调和饱和度 亮度:表示光的明亮程度,它与被观察物体的发光强度和人类视觉系统的视敏功能有关。 色调:反映的是颜色的种类,是决定颜色的基本特性。 饱和度:指颜色的纯度,即掺入白光的程度,或者说是颜色的深浅程度。 色调和饱和度通称为色度。 ◆彩色空间 在多媒体技术中,用得最多的是RGB彩色空间表示。 而一般在彩色电视系统中,采用的是YUV彩色空间。 另外,还有CIE XYZ、CIE LAB、CCIR601-2YC b C r彩色空间等。 ◆图形图像文件 图形是指用计算机绘制工具绘制的画面,包括直线、曲线,圆/圆弧,方框等成分。图形一般按各个成分的参数形式存储,可以对各个成分进行移动、缩放、旋转和扭曲等变换,可以在绘图仪上将各个成分输出。 图像是由输入设备捕捉的实际场景或以数字化形式存储的任意画面。图像可以用位图或矢量图形式存储。 ●位图 也叫黑白图象,它是按图像点阵形式存储各像素的颜色编码或灰度级。位图适于表现含有大量细节的画面,并可直接、

相关文档
最新文档