数字音频基础知识

数字音频基础知识
数字音频基础知识

第一章数字音频基础知识

主要内容

声音基础知识

认识数字音频

数字音频专业知识

第1节声音基础知识

声音的产生

声音是由振动产生的。物体振动停止,发声也停止。当振动波传到人耳时,人便听到了声音。

人能听到的声音,包括语音、音乐和其它声音(环境声、音效声、自然声等),可以分为乐音和噪音。

乐音是由规则的振动产生的,只包含有限的某些特定频率,具有确定的波形。

噪音是由不规则的振动产生的,它包含有一定范围内的各种音频的声振动,没有确定的波形。

声音的传播

声音靠介质传播,真空不能传声。

介质:能够传播声音的物质。

声音在所有介质中都以声波形式传播。

音速

声音在每秒内传播的距离叫音速。

声音在固体、液体中比在气体中传播得快。

15oC 时空气中的声速为340m/s 。

声音的感知

外界传来的声音引起鼓膜振动经听小骨及其他组织传给听觉神经,听觉神经再把信号传给大脑,这样人就听到了声音。双耳效应的应用:立体声

人耳能感受到(听觉)的频率范围约为20Hz~

20kHz,称此频率范围内的声音为可听声(audible sound)或音频(audio),频率<20Hz声音为次声,频率>20kHz声音为超声。

人的发音器官发出的声音(人声)的频率大约是80Hz~3400Hz。人说话的声音(话音voice / 语音speech)的频率通常为300Hz~3000 Hz(带宽约3kHz)。

传统乐器的发声范围为16Hz (C2)~7kHz(a5),如钢琴的为 (A2)~4186Hz(c5)。

声音的三要素

声音具有三个要素:

音调、响度(音量/音强)和音色

人们就是根据声音的三要素来区分声音。

音调(pitch )

音调:声音的高低(高音、低音),由“频率”(frequency)决定,频率越高音调越高。

声音的频率是指每秒中声音信号变化的次数,用Hz 表示。例如,20Hz 表示声音信号在1 秒钟内周期性地变化20 次。高音:音色强劲有力,富于英雄气概。擅于表现强烈的感情。

低音:音色深沉浑厚,擅于表现庄严雄伟和苍劲沉着的感情。

响度(loudness )

响度:又称音量、音强,指人主观上感觉声音的大小,由“振幅”(amplitude)和人离声源的距离决定,振幅越大响度越大,人和声源的距离越小,响度越大。(单位:分贝dB)

音色(music quality)

音色:又称音品,由发声物体本身材料、结构决定。

每个人讲话的声音以及钢琴、提琴、笛子等各种乐器所发出的不同声音,都是由音色不同造成的。

声道

声道(sound channel / track)是分开录音然后结合起来以便同时听到的一段声音。

早期的声音重放(playback/ reproduction )技术落后,只有单一声道(mono / monophony ),只能简单地发出声音(如留声机、调幅AM 广播);

后来有了双声道的立体声(stereo )技术(如立体声唱机、调频FM 立体声广播、立体声盒式录音带、激光唱盘CD-DA ),利用人耳的双耳效应,感受到声音的纵深和宽度,具有立体感。

现在又有了各种多声道的环绕声(surround sound)重放方式(如、、、声道),将多只喇叭(扬声器speaker)分布在听者的四周,建立起环绕聆听者周围的声学空间,使听者感受到自己被声音包围起来,具有强烈的现场感(如电影院、家庭影院、DVD-Audio、SACD、DTS-CD、HDTV)。

第2节认识数字音频

模拟信号

音频信号是典型的连续信号,不仅在时间上是连续的,而且在幅度上也是连续的。在时间上“连续”是指在任何一个指定的时间范围里声音信号都有无穷多个幅值;在幅度上“连续”是指幅度的数值为实数。

我们把在时间(或空间)和幅度上都是连续的信号称为模拟信号(analog signal)。

数字信号

在某些特定的时刻对这种模拟信号进行测量叫做采样(sampling),在有限个特定时刻采样得到的信号称为离散时间信号。采样得到的幅值是无穷多个实数值中的一个,因此幅度还是连续的。把幅度取值的数目限定为有限个的信号就称为离散幅度信号。

我们把时间和幅度都用离散的数字表示的信号就称为数字信号(digital signal)。

从模拟信号到数字信号的转换为模数转换,记为A/D(Analog-to-Digital);

从数字信号到模拟信号的转换为数模转换,记为D/A(Digital-to-Analog)。

第3节

数字音频专业知识

人们日常生活听到的各种声音信息是典型的连续信号,它不仅在时间上连续,而且在幅度上也连续,我们称之为模拟音频。在数字音频技术产生之前,我们只能用磁带或胶木唱片来存储模拟音频,随着技术的发展,声音信号逐渐过渡到了数字化存储阶段,可以用计算机等设备将它们存储起来。

模拟音频的数字化

对于计算机来说,处理和存储的只可以是二进制数,所以在使用计算机处理和存储声音信号之前,我们必须使用模数转换(A/D)技术将模拟音频转化为二进制数,这样模拟音频就转化为数字音频了。所谓模数转换就是将模拟信号转化为数字信号,模数转换的过程包括采样、量化和编码三个步骤。模拟音频向数字音频的转换是在计算机的声卡中完成的。

采样

采样是指将时间轴上连续的信号每隔一定的时间间隔抽取出一个信号的幅度样本,把连续的模拟量用一个个离散的点表示出来,使其成为时间上离散的脉冲序列。

每秒钟采样的次数称为采样频率,用f表示;样本之间的时间间隔称为取样周期,用T表示,T=1/f。例如:CD的采样频率为,表示每秒钟采样44100次。

常用的采样频率有8kHz、、、15kHz、、48kHz等。

在对模拟音频进行采样时,取样频率越高,音质越有保证;若取样频率不够高,声音就会产生低频失真。

那么怎样才能避免低频失真呢

著名的采样定理(Nyquist 定理)中给出有明确的答案:要想不产生低频失真,采样频率至少应为所要录制的音频的最高频率的2 倍。例如,电话话音的信号频率约为 kHz ,采样频率就应该≥ kHz ,考虑到信号的衰减等因素,一般取为8kHz 。

量化

量化是将采样后离散信号的幅度用二进制数表示出来的过程。

每个采样点所能表示的二进制位数称为量化精度,或量化位数。

量化精度反映了度量声音波形幅度的精度。例如,每个声音样本用16位(2字节)表示,测得的声音样本值是在0~65536的范围里,它的精度就是输入信号的1/65536。

常用的采样精度为8bit/s、12 bit/s、16bit/s、20bit/s、24bit/s等。

采样频率、采样精度和声道数对声音的音质和占用的存储空间起着决定性作用。

我们希望音质越高越好,磁盘存储空间越少越好,这本身就是一个矛盾。必须在音质和磁盘存储空间之间取得平衡。数据量与上述三要素之间的关系可用下述公式表示:

编码

采样和量化后的信号还不是数字信号,需要把它转换成数字编码脉冲,这一过程称为编码。最简单的编码方式是二进制编码,即将已经量化的信号幅值用二进制数表示,计算机内采用的就是这种编码方式。

模拟音频经过采样、量化和编码后所形成的二进制序列就是数字音频信号,我们可以将其以文件的形式保存在计算机的存储设备中,这样的文件通常称之为数字音频文件。

PCM编码

PCM(Pulse Code Modulation),即脉冲编码调制,指模拟音频信号只经过采样、模数转换直接形成的二进制序列,未经过任何编码和压缩处理。PCM编码的最大的优点就是音质好,最大的缺点就是体积大。在计算机应用中,能够达到最高保真水平的就是PCM编码,常见的WAV文件中就有应用。

音频压缩

音频压缩属于数据压缩的一种,是减小数字音频信号文件大小(数据比率)的过程。

一般数据的压缩方法对于音频数据不利,很少能将源文件压缩到87%以下。

音频压缩算法:无损压缩算法和有损压缩算法

无损压缩是对未压缩音频进行没有任何信息/ 质量损失的压缩机制。

有损压缩是尽可能多得从原文件删除没有多大影响的数据,有目的地制成比原文件小多的但音质却基本一样。

一般来说,无损压缩比率在源文件的50–60% 左右,而有损压缩可以达到原文件的5–20% 。

常见的数字音频文件格式

常见的数字音频文件格式有很多,每种格式都有自己的优点、缺点及适用范围。

CD格式——天籁之音

CD音轨文件的后缀名为:cda

标准CD格式是的采样频率,速率88K/秒,16位量化位数,近似无损的。

CD光盘可以在CD唱机中播放,也能用电脑里的各种播放软件来重放。一个CD音频文件是一个*.cda文件,这只是一个索引信息,并不是真正的包含声音信息,所以不论CD音乐的长短,在电脑上看到的“*.cda文件”都是44字节长。WAV格式——无损的音乐

WAV为微软公司开发的一种声音文件格式。

标准格式化的WAV文件和CD格式一样,也是的取样频率,16位量化位数,声音文件质量和CD相差无几!

特点:音质非常好,被大量软件所支持。

适用于:多媒体开发、保存音乐和原始音效素材。

MP3格式——流行的风尚

全称Moving Picture Experts Group Audio Layer III),是当今较流行的一种数字音频编码和有损压缩格式。

是ISO标准MPEG1和MPEG2第三层(Layer 3),采样率16-48kHz,编码速率。

特点:音质好,压缩比比较高,被大量软件和硬件支持,应用广泛。

适用于:适合用于一般的以及比较高要求的音乐欣赏。

MIDI——作曲家的最爱

MIDI(Musical Instrument Digital Interface)乐器数字接口。

MIDI数据不是数字的音频波形,而是音乐代码或称电子乐谱。

MIDI文件每存1分钟的音乐只用大约5~10KB。

MID文件主要用于原始乐器作品,流行歌曲的业余表演,游戏音轨以及电子贺卡等。*.mid文件重放的效果完全依赖声卡的档次。

普通的声音文件,如wav文件,是计算机直接把声音信号的模拟信号经过取样——量化处理,不经压缩处理,变成与声音波形对应的数字信号。

而MIDI文件则不是直接记录乐器的发音,而是记录了演奏乐器的各种信息或指令,如用哪一种乐器,什么时候按某个键,力度怎么样等等,至于播放时发出的声音,那是通过播放软件或者音源的转换而成的。因此MIDI文件通常比声音文件小得多,一首乐曲,只有十几K或几十K,只有声音文件的千分之一左右,便于储存和携带。

WMA格式——最具实力的敌人

WMA (Windows Media Audio) 由微软开发。

音质要强于MP3格式,更远胜于RA格式,它以减少数据流量但保持音质的方法来达到比MP3压缩率更高的目的,WMA的压缩率一般都可以达到1:18左右。

内置了版权保护技术,可以限制播放时间和播放次数甚至于播放的机器等等。

WMA格式在录制时可以对音质进行调节。同一格式,音质好的可与CD媲美,压缩率较高的可用于网络广播。

Ra格式——流动的旋律

RealAudio主要适用于在网络上的在线音乐欣赏,现在大多数的用户仍然在使用56Kbps或更低速率的Modem,所以典型的回放并非最好的音质。有的下载站点会提示你根据你的Modem速率选择最佳的Real文件。

APE格式

一种新兴的无损音频编码,可以提供50-70%的压缩比,APE的文件大小大概为CD的一半,APE可以节约大量的资源。APE可以做到真正的无损,而不是听起来无损,压缩比也要比类似的无损格式要好。

特点:音质非常好。

适用于:最高品质的音乐欣赏及收藏

音频格式的转换

声音的来源十分广泛,我们收集到的各种声音文件的格式也常常多种多样。由于播放环境等因素的影响,并不是所有音频格式都能被很好支持的,这就需要对音频文件格式进行转换。

能够实现音频格式转换的工具很多,如Audio Converter、千千静听、Gold Wave等,每种软件都有自己的特点,操作方法也略有不同。

数字音频基础知识

第一章数字音频基础知识 主要内容 ?声音基础知识 ?认识数字音频 ?数字音频专业知识 第1节声音基础知识 1.1 声音的产生 ?声音是由振动产生的。物体振动停止,发声也停止。当振动波传到人耳时,人便听到了声音。 ?人能听到的声音,包括语音、音乐和其它声音(环境声、音效声、自然声等),可以分为乐音和噪音。 ?乐音是由规则的振动产生的,只包含有限的某些特定频率,具有确定的波形。 ?噪音是由不规则的振动产生的,它包含有一定范围内的各种音频的声振动,没有确定的波形。 1.2 声音的传播 ?声音靠介质传播,真空不能传声。 ?介质:能够传播声音的物质。 ?声音在所有介质中都以声波形式传播。 ?音速 ?声音在每秒内传播的距离叫音速。 ?声音在固体、液体中比在气体中传播得快。 ?15oC 时空气中的声速为340m/s 。 1.3 声音的感知 ?外界传来的声音引起鼓膜振动经听小骨及其他组织传给听觉神经,听觉神经再把信号传给大脑,这样人就听到了声音。 ?双耳效应的应用:立体声 ?人耳能感受到(听觉)的频率范围约为20Hz~ 20kHz,称此频率范围内的声音为可听声(audible sound)或音频(audio),频率<20Hz声音为次声,频率>20kHz声音为超声。 ?人的发音器官发出的声音(人声)的频率大约是80Hz~3400Hz。人说话的声音(话音voice / 语音speech)的频率通常为300Hz~3000 Hz(带宽约3kHz)。 ?传统乐器的发声范围为16Hz (C2)~7kHz(a5),如钢琴的为27.5Hz (A2)~4186Hz(c5)。 1.4 声音的三要素 ?声音具有三个要素: 音调、响度(音量/音强)和音色 ?人们就是根据声音的三要素来区分声音。 音调(pitch ) ?音调:声音的高低(高音、低音),由―频率‖(frequency)决定,频率越高音调越高。 ?声音的频率是指每秒中声音信号变化的次数,用Hz 表示。例如,20Hz 表示声音信号在1 秒钟内周期性地变化20 次。?高音:音色强劲有力,富于英雄气概。擅于表现强烈的感情。 ?低音:音色深沉浑厚,擅于表现庄严雄伟和苍劲沉着的感情。 响度(loudness ) ?响度:又称音量、音强,指人主观上感觉声音的大小,由―振幅‖(amplitude)和人离声源的距离决定,振幅越大响度越大,人和声源的距离越小,响度越大。(单位:分贝dB) 音色(music quality) ?音色:又称音品,由发声物体本身材料、结构决定。 ?每个人讲话的声音以及钢琴、提琴、笛子等各种乐器所发出的不同声音,都是由音色不同造成的。 1.5 声道

数字音频课程教学大纲

集美大学数字音频技术课程教学大纲 一、课程基本情况 1.课程编号:5030710 2.课程中文名称:数字音频技术课程英文名称:Digital Audio Technology 3.课程总学时:32 ,其中:讲课:16 ,实验:16 ,上机:,实习:,课外:。 4.课程学分:1.5 5.课程类型:专业选修 6.开课单位:教师教育学院教育技术学教研室 7.适用专业:教育技术学专业 8.先修课程:音乐欣赏、计算机组成原理 9.课程负责人:蔡伟 (注:课程编号、学时、学分、类型等均必须与2012版培养方案一致) 二、教学目的和要求 1.课程说明:数字音频技术及应用是教育技术学专业的专业选修课,本课程是考查课程。主要介绍如何合理地组织音乐、有效地存储和处理音频,正确地运用编辑软件进行音频编辑。 2.教学目的:本课程的教学目的是希望学生掌握一些音乐基础知识,能在实践中使用Adobe Soundbooth软件处理波形文件,用Midi音乐制作软件制作Midi音乐,通过这些技能的培养和训练,学生在制作影视片子时可以较好地配合内容,选用恰当的音乐作为背景音乐,增强感染力。 本课程是理论性和应用性均较强的课程,教学环节包括课堂讲授、学生自学、上机实验、作业、答疑、期末考试。教师在课堂上应对数字音频的基本概念、数字音频处理进行必要的讲授,并详细讲授每章的重点、难点内容;讲授中应注意理论联系实际,加深学生对数字音频处理内容的理解。 3.教学要求:通过本课程的学习,使学生达到以下基本要求: 本课程上机实验学时不少于16学时;上机前教师预先布置实验题目;学生在上机做实验前,应事先将待编辑的音频文件准备好,并提前使用这些音频数据提前执行过。目的是提高上机的效率和成功率,严禁抄袭或拷贝他人的成果;在每次课堂教学结束后,教师应布置一定量的作业,加深学生对所学知识的理解、运用。 三、教学内容及要求 第一章数字音频概述 教学要求: (1)掌握数字音频名词、术语的含义和有关的基本概念。 (2)了解数字音频发展与现状。 重点: (1)数字音频的一些基本概念; (2)数字音频的现状分析。 难点: 数字音频的一些基本概念。

音频基础知识

音频,英文是AUDIO,也许你会在录像机或VCD的背板上看到过AUDIO输出或输入口。这样我们可以很通俗地解释音频,只要是我们听得见的声音,就可以作为音频信号进行传输。有关音频的物理属性由于过于专业,请大家参考其他资料。自然界中的声音非常复杂,波形极其复杂,通常我们采用的是脉冲代码调制编码,即PCM编码。PCM通过采样、量化、编码三个步骤将连续变化的模拟信号转换为数字编码。 一、音频基本概念 1、什么是采样率和采样大小(位/bit)。 声音其实是一种能量波,因此也有频率和振幅的特征,频率对应于时间轴线,振幅对应于电平轴线。波是无限光滑的,弦线可以看成由无数点组成,由于存储空间是相对有限的,数字编码过程中,必须对弦线的点进行采样。采样的过程就是抽取某点的频率值,很显然,在一秒中内抽取的点越多,获取得频率信息更丰富,为了复原波形,一次振动中,必须有2个点的采样,人耳能够感觉到的最高频率为20kHz,因此要满足人耳的听觉要求,则需要至少每秒进行40k次采样,用40kHz表达,这个40kHz就是采样率。我们常见的CD,采样率为44.1kHz。光有频率信息是不够的,我们还必须获得该频率的能量值并量化,用于表示信号强度。量化电平数为2的整数次幂,我们常见的CD位16bit的采样大小,即2的16次方。采样大小相对采样率更难理解,因为要显得抽象点,举个简单例子:假设对一个波进行8次采样,采样点分别对应的能量值分别为A1-A8,但我们只使用2bit的采样大小,结果我们只能保留A1-A8中4个点的值而舍弃另外4个。如果我们进行3bit的采样大小,则刚好记录下8个点的所有信息。采样率和采样大小的值越大,记录的波形更接近原始信号。 2、有损和无损 根据采样率和采样大小可以得知,相对自然界的信号,音频编码最多只能做到无限接近,至少目前的技术只能这样了,相对自然界的信号,任何数字音频编码方案都是有损的,因为无法完全还原。在计算机应用中,能够达到最高保真水平的就是PCM编码,被广泛用于素材保存及音乐欣赏,CD、DVD以及我们常见的WAV文件中均有应用。因此,PCM约定俗成了无损编码,因为PCM代表了数字音频中最佳的保真水准,并不意味着PCM就能够确保信号绝对保真,PCM也只能做到最大程度的无限接近。我们而习惯性的把MP3列入有损音频编码范畴,是相对PCM编码的。强调编码的相对性的有损和无损,是为了告诉大家,要做到真正的无损是困难的,就像用数字去表达圆周率,不管精度多高,也只是无限接近,而不是真正等于圆周率的值。 3、为什么要使用音频压缩技术 要算一个PCM音频流的码率是一件很轻松的事情,采样率值×采样大小值×声道数bps。一个采样率为44.1KHz,采样大小为16bit,双声道的PCM编码的WAV文件,它的数据速率则为44.1K×16×2 =1411.2 Kbps。我们常说128K的MP3,对应的WAV的参数,就是这个1411.2 Kbps,这个参数也被称为数据带宽,它和ADSL中的带宽是一个概念。将码率除以8,就可以得到这个WAV的数据速率,即176.4KB/s。这表示存储一秒钟采样率为44.1KHz,采样大小为16bit,双声道的PCM编码的音频信号,需要176.4KB的空间,1分钟则约为10.34M,这对大部分用户是不可接受的,尤其是喜欢在电脑上听音乐的朋友,要降低磁盘占用,只有

数字音频作业及其答案精品资料

数字音频作业及其答 案

第一次作业: 1:、声音可分为两种:纯音和复合音,平常人们说话的声音属于哪一种?语音的频率范围是多少?音频通常包括哪几种声音信号?其频率范围是多少? 2、请说明音频信号数字化的三个步骤? 3、如何理解“量化是信号数字化过程中重要的一步,而这一过程又是引入噪声的主要根源”这句话的含义?通过哪些途径可以减小量化误差? 4对双极性信号若采用均匀量化,则量化信噪比SNR与量化比特数之间的关系为:SNR=6.02xN+1.76dB,试分析此式对实际量化与编码的指导意义? 5:、A/D、D/A转换器的技术指标有哪些? 答:1:人们说话的声音为复合音,语言的频率范围为300HZ-3000HZ。音频暴多语音、音乐、效果声等声音信号,频率范围为20HZ-20KHZ。 2:1取样:对连续信号按一定的时间间隔取样。奈奎斯特取样定理认为,只要取样频率大于等于信号中所包含的最高频率的两倍,则可以根据其取样完全恢复出原始信号,这相当于当信号是最高频率时,每一周期至少要采取两个点。但这只是理论上的定理,在实际操作中,人们用混叠波形,从而使取得的信号更接近原始信号。2量化:取样的离散音频要转化为计算机能够表示的数据范围,这个过程称为量化。量化的等级取决于量化精度,也就是用多少位二进制数来表示一个音频数据。一般有8位,12位或16位。量化精度越高,声音的保真度越高。以8位的举例稍微说明一下其中的原理。若一台计算机能够接收八位二进制数据,则相当于能够接受256个十进制的数,即有256个电平数,用这些数来代表模拟信号的电平,可以有256种,但是实际上采样后的某一时刻信号的电平不一定和256个电平某一个相等,此时只能用最接近的数字代码表

音频基本知识

音频基本知识 第一部分 模拟声音-数字声音原理 第二部分 音频压缩编码 第三部分 和弦铃声格式 第四部分 单声道、立体声和环绕声 第五部分 3D环绕声技术 第六部分数字音频格式和数字音频接口 第一部分 模拟声音-数字声音原理 一、模拟声音数字化原理 声音是通过空气传播的一种连续的波,叫声波。声音的强弱体现在声波压力的大小上,音调的高低体现在声音的频率上。声音用电表示时,声音信号在时间和幅度上都是连续的模拟信号。 图1 模拟声音数字化的过程 声音进入计算机的第一步就是数字化,数字化实际上就是采样和量化。连续时间的离散

化通过采样来实现。 声音数字化需要回答两个问题:①每秒钟需要采集多少个声音样本,也就是采样频率(f s)是多少,②每个声音样本的位数(bit per sample,bps)应该是多少,也就是量化精度。 ?采样频率 采样频率的高低是根据奈奎斯特理论(Nyquist theory)和声音信号本身的最高频率决定的。奈奎斯特理论指出,采样频率不应低于声音信号最高频率的两倍,这样才能把以数字表达的声音还原成原来的声音。采样的过程就是抽取某点的频率值,很显然,在一秒中内抽取的点越多,获取得频率信息更丰富,为了复原波形,一次振动中,必须有2个点的采样,人耳能够感觉到的最高频率为20kHz,因此要满足人耳的听觉要求,则需要至少每秒进行40k 次采样,用40kHz表达,这个40kHz就是采样率。我们常见的CD,采样率为44.1kHz。电话话音的信号频率约为3.4 kHz,采样频率就选为8 kHz。 ?量化精度 光有频率信息是不够的,我们还必须纪录声音的幅度。量化位数越高,能表示的幅度的等级数越多。例如,每个声音样本用3bit表示,测得的声音样本值是在0~8的范围里。我们常见的CD位16bit的采样精度,即音量等级有2的16次方个。样本位数的大小影响到声音的质量,位数越多,声音的质量越高,而需要的存储空间也越多。 ?压缩编码 经过采样、量化得到的PCM数据就是数字音频信号了,可直接在计算机中传输和存储。但是这些数据的体积太庞大了!为了便于存储和传输,就需要进一步压缩,就出现了各种压缩算法,将PCM转换为MP3,AAC,WMA等格式。 常见的用于语音(Voice)的编码有:EVRC (Enhanced Variable Rate Coder) 增强型可变速率编码,AMR、ADPCM、G.723.1、G.729等。常见的用于音频(Audio)的编码有:MP3、AAC、AAC+、WMA等 二、问题 1、为什么要使用音频压缩技术? 我们可以拿一个未压缩的CD文件(PCM音频流)和一个MP3文件作一下对比: PCM音频:一个采样率为44.1KHz,采样大小为16bit,双声道的PCM编码CD文件,它的数据速率则为 44.1K×16×2 =1411.2 Kbps,这个参数也被称为数据带宽。将码率除以8 bit,就可以得到这个CD的数据速率,即176.4KB/s。这表示存储一秒钟PCM编码的音频信号,需要176.4KB的空间。 MP3音频:将这个WAV文件压缩成普通的MP3,44.1KHz,128Kbps的码率,它的数据速率为128Kbps/8=16KB/s。如下表所示: 比特率 存1秒音频数据所占空间 CD(线性PCM) 1411.2 Kbps 176.4KB MP3 128Kbps 16KB AAC 96Kbps 12KB mp3PRO 64Kbps 8KB 表1 相同音质下各种音乐大小对比 2、频率与采样率的关系 采样率表示了每秒对原始信号采样的次数,我们常见到的音频文件采样率多为44.1KHz,这意味着什么呢?假设我们有2段正弦波信号,分别为20Hz和20KHz,长度均为一秒钟,以对应我们能听到的最低频和最高频,分别对这两段信号进行40KHz的采样,我们可以得到一个什么样的结果呢?结果是:20Hz的信号每次振动被采样了40K/20=2000次,而20K的信号每次振动只有2次采样。显然,在相同的采样率下,记录低频的信息远比高频

教你怎样使用数字音频处理器

怎样使用数字音频处理器现在数字音频处理器越来越多地运用到工程当中了,对于有基础有经验的人来说,处理器是一个很好用的工具,但是,对于一些经验比较欠缺的朋友来说,看着一台处理器,又是一大堆英文,不免有点无从下手。其实不用慌,我来介绍一下处理器使用步骤,以一个2进4出的处理器控制全频音箱+超低音音箱的系统为例 1、首先是用处理器连接系统,先确定好哪个输出通道用来控制全频音箱,哪个输出通道用来控制超低音音箱,比如你用输出1、2通道控制超低音,用输出3、4通道控制全频。接好线了,就首先进入处理器的编辑(EDIT)界面来进行设置,进入编辑界面不同的产品的方法不同,具体怎么进入,去看说明书。 2、利用处理器的路由(ROUNT)功能来确定输出通道的信号来自哪个输入通道,比如你用立体声方式扩声形式,你可以选择输出通道1、3的信号来自输入A,输出通道的2、4的信号来自输入B。信号分配功能不同的产品所处的位置不同,有些是在分频模块里,有些是在增益控制模块里,这个根据说明书的指示去找。 3、根据音箱的技术特性或实际要求来对音箱的工作频段进行设置,也就是设置分频点。处理器上的分频模块一般用CROSSOVER或X-OVER表示,进入后有下限频率选择(HPF)和上限频率选择(LPF),还要滤波器模式和斜率的选择。首先先确定工作频段,比如超低音的频段是40-120赫兹,你就把超低音通道的HPF设置为40,LPF设置为120。全频音箱如果你要控制下限,就根据它的低音单元口径,设置它的HPF大约在50-100Hz,。处理器滤波器形式选择一般有三种,bessel,butterworth和linky-raily,我以前有帖子专门说明过三种滤波器的不同之处,这里不赘述。常用的是butterworth和linky-raily两种,然后是分频斜率的选择,一般你选24dB/oct就可以满足大部分的用途了。 4、这个时候你需要检查一下每个通道的初始电平是不是都在0dB位置,如果有不是0的,先把它们都调到0位置上,这个电平控制一般在GAIN功能里,DBX的处理器电平是在分频器里面的,用G表示。 5、现在就可以接通信号让系统先发出声音了,然后用极性相位仪检查一下音箱的极性是否统一,有不统一的,先检查一下线路有没有接反。如果线路没接反,而全频音箱和超低音的极性相反了,可以利用处理器输出通道的极性翻转功能(polarity或pol)把信号的极性反转,一般用Nomal或“+”表示正极性,用INV或“-”表示负极性。 6、接下来就要借助SIA这类工具测量一下全频音箱和超低音的传输时间,一般来说是会有差异的,比如测到全频的传输时间是10ms,超低音是18ms,这个时候就要利用处理器的延时功能对全频进行延时,让全频和低音的传输时间相同。处理器的延时用DELAY或DLY表示,有些用m(米)有些用MS(毫秒)来显示延时量,SIA软件也同时提供了时间和距离的量,你可以选择你需要的数据值来进行延时 7、接下来就该进行均衡的调节了,可以配合测试工具也可以用耳朵来调,处理器的均衡用EQ来表示,一般都是参量均衡(PEQ),参量均衡有3个调节量,频率(F),带宽(Q 或OCT),增益(GAIN或G)。具体怎么调,就根据产品特性、房间特性和主观听觉来调了,这个就自己去想了。 8、均衡调好后,就要进行限幅器的设置了,处理器的限幅器用LIMIT来表示,进去以后一般有限幅电平(THRESHOLD),压缩比(RA TIO)的选项,你要做限幅就要先把压缩比RA TIO设置为无穷大(INF),然后配合功放来设置限幅电平,变成限幅器后,启动时间A TTACK和恢复时间RELEASE就不用去理了。DBX处理器的限幅器用PEAKSTOP来表示,启动后,直接设置限幅电平就可以了,至于怎么调限幅器,我有专门的帖子,自己去看。 9、都调好了就要保存数据,处理器的保存一般用STORE或SA VE表示,怎么存,就看产品说明书了。

音频基础知识

Audio知识简介 干一行专一行VS学一行丢一行 第一部分:HTS基本概念: HTS(Home Theater System)通俗的讲就是将电影院搬到家里,然后就成了家庭影院,就公司的产品而言可以简单的理解为:DVD/BD player + 功放+ Speaker 组成:节目源(碟片+碟机等)+ 放声系统(AV功放+音箱组等)+显示部分(电视机/投影仪) 配置家庭影院的好处:高清晰的如水晶般的画面,环绕的立体声,清晰的人声,震撼的低音效果,可以提供几乎身临其境的感觉。在强烈的视听冲击下,能感受到现实和虚拟的完美交汇,触发更深的人生感悟。 第二部分:Audio 百度定义: 1.Audio指人说话的声音频率,通常指300Hz---3400Hz的频带 2.指存储声音内容的文件 3.在某些方面能指作为波滤的振动。 音频这个专业术语,人类能够听到的所有声音都称之为音频,它可能包括噪音,声音被录制下来以后,无论是说话声,歌声乐器都可以通过数字音乐软件处理。把它制作成CD,这时候所有的声音没有改变,因为CD本来就是音频文件的一种类型。而音频只是储存在计算机里的声音,演讲和音乐,如果有计算机加上相应的音频卡,可以把所有的声音录制下来,声音的声学特性,音的高低都可以用计算机硬盘文件的方式储存下来,反过来,也可以把眄来的音频文件通过一定的音频程序播放,还原以前录下的声音。 Audio的分类: 按编码格式分类: mp3,wav, aac, ogg, flac, aiff, ac3(亦称之Dolby digital), dts, pcm, Dolby true hd(HD), Dolby digital plus(HD), dts hd master audio(HD), dts hd high resolution audio(HD), dts hd low bit rate(HD) 多声道音频的分类: C:center L: left front R: Right front LS: Left surround RS: right surround S: surround(单个环绕声道) LB:left back surround RB: right back surround Cs: Center surround 1.带LFE声道的分法:根据码流中实际的通道数分 X的值为0/1,0表示不带LFE通道,1表示含LFE通道

音频基础知识

一. 音频基础知识 1. 音频编解码原理 数字音频的出现,是为了满足复制、存储、传输的需求,音频信号的数据量对于进行传输或存储形成巨大的压力,音频信号的压缩是在保证一定声音质量的条件下,尽可能以最小的数据率来表达和传送声音信息。信号压缩过程是对采样、量化后的原始数字音频信号流运用适,当的数字信号处理技术进行信号数据的处理,将音频信号中去除对人们感受信息影响可以忽略的成分,仅仅对有用的那部分音频信号,进行编排,从而降低了参与编码的数据量。 数字音频信号中包含的对人们感受信息影响可以忽略的成分称为冗余,包括时域冗余、频域冗余和听觉冗余。 1.1时域冗余 A.幅度分布的非均匀性:信号的量化比特分布是针对信号的整个动态范围而设定的,对于小幅度信号而言,大量的比特数据位被闲置。 B.样值间的相关性:声音信号是一个连续表达过程,通过采样之后,相邻的信号具有极强的相似性,信号差值与信号本身相比,数据量要小的多。 C.信号周期的相关性:声音信息在整个可闻域的范围内,每个瞬间只有部分频率成分在起作用,即特征频率,这些特征频率会以一定的周期反复出现,周 期之间具有相关关系。 D.长时自我相关性:声音信息序列的样值、周期相关性,在一个相对较长的时间间隔也会是相对稳定的,这种稳定关系具有很高的相关系数。 E.静音:声音信息中的停顿间歇,无论是采样还是量化都会形成冗余,找出停顿间歇并将其样值数据去除,可以减少数据量。 1.2 频域冗余 A.长时功率谱密度的非均匀性:任何一种声音信息,在相当长的时间间隔内,功率分布在低频部分大于高频部分,功率谱具有明显的非平坦性,对于给定 的频段而言,存在相应的冗余。 B.语言特有的短时功率谱密度:语音信号在某些频率上会出现峰值,而在另一些频率上出现谷值,这些共振峰频率具有较大的能量,由它们决定了不同的语 音特征,整个语言的功率谱以基音频率为基础,形成了向高次谐波递减的结 构。 1.3 听觉冗余 根据分析人耳对信号频率、时间等方面具有有限分辨能力而设计的心理声学模型,将通过听觉领悟信息的复杂过程,包括接受信息,识别判断和理解信号内容等 几个层次的心理活动,形成相应的连觉和意境,由此构成声音信息集合中的所以数 据,并非对人耳辨别声音的强度、音调、方位都产生作用,形成听觉冗余,由听觉 冗余引出了降低数据率,实现更高效率的数字音频传输的可能。 2. 常见音频编解码标准 2.1 AAC(Advanced Audio Codin) AAC于1997年形成国际标准ISO 13818-7。先进音频编码AAC开发成功, 成为继MPEG-2音频标准(ISO/IEC13818-3)之后的新一代音频压缩标准。 在MPEG-2制订的早期,本来是想将其音频编码部分保持与MPEG-1兼容的。但后来为了适应演播电视的要求而将其定义成为一个可以获得更高质量的多 声道音频标准。理所当然地,这个标准是不兼容MPEG-1的,因此被称为MPEG-2 AAC。换句话说,从表面上看,要制作和播放AAC,都需要使用与MP3完全不

《数字音频技术》教学大纲

《数字音频技术》教学大纲 一、课程性质与任务 1.课程性质:本课程是数字媒体技术专业的专业课。 2.课程任务: 通过本课程的学习,使学生了解数字音频在数字媒体技术中的重要作用,熟悉掌握数字音频的采集方法和不同文件格式的具体应用。会对采集的数字音频进行除噪、调整和特效处理,会利用音频编辑软件进行单轨、多轨的编辑输出。熟悉掌握影视动画、广告片头、游戏音效等方面的配音制作方法,掌握Audition 和Nuendo软件的使用和操作,会刻录CD音乐光盘。 二、课程教学内容及要求 第一章数字音频概述 1. 数字音频的优势 2. 数字音频应用领域 3. 数字音频系统的构成 4. 知识拓展 教学要求:了解数字音频的特点及应用。 掌握数字音频的软硬件系统的组成和相关知识。 第二章数字音频基础 1. 声音的构成 2. 声音的特性 3. 音频数字化原理 4. 常见数字音频压缩格式 5. 知识拓展 教学要求:了解声音的三要素及声学特征。 掌握影像数字音频的相关参数及压缩编码格式。 第三章数字音频处理方法

1. 混音基础 2. 混音流程和方法 3. 声音调整及输出 4. 知识拓展 教学要求:了解数字音频处理方法中混音的概念和原理。 掌握混音流程和方法,会对声音进行相应的调整和处理。 第四章配音基础 1. 视听语言 2. 配音的艺术 3. 配音流程 4. 知识拓展 教学要求:了解声音的配音基础和艺术基础。 掌握配音、配乐的方法和流程,会进行同期配音和后期配音。第五章数字音频处理软件 1. 数字音频处理软件概述 2. Adobe Audition软件应用 3. 采集和除噪 4. 单轨剪辑和音效处理 5. 多轨编配 教学要求:了解数字音频软件的功能及作用。 掌握安装使用声音编辑软件Adobe Audition的方法。 第六章数字制作实例 1. 贴唱 2. 广告音乐制作实例 3. 动画片音乐制作实例 4. 游戏音效设计实例 5. 音乐CD刻录 教学要求:了解数字音频制作的应用。 掌握数字音频制作中的应用技巧。 第七章Nuendo电脑音乐基础 1. Nuendo简介

音视频基础知识

音视频资料 电子视频信号 电子视频信号有两种类型:模拟或数字。视频信号传输开始模拟;然而,数字信号传输正在迅速取代模拟随着新技术的出现。 现在我们将阐明两者之间的差异。 . 模拟视频信号 模拟视频信号由一个低电压信号为每一行包含强度信息,结合定时信息,确保信号显示设备保持同步。 模拟视频信号通常表示为正弦波,纵轴代表了信号幅度,或视频图像的亮度属性,横轴表示频率的变化会影响图像的清晰度和细节。改变波的振幅代表不同的颜色在屏幕上。 模拟信号振幅随时间不同,可以代表一个无限数量的值或水平最高和最低分之间。一个典型的模拟视频信号的电压范围是0到0.7伏峰。 模拟视频信号(继续) 这幅图表明,常见的模拟视频信号信息传播的一系列横线隔开同步脉冲数字脉冲的出现,或方形波。 感兴趣的有四个区域:门廊,同步脉冲、活动视频区域,和后面的门廊上。门廊之间的时间是最后的活动视频信息和同步信号的开始。结束后廊之间的时间同步脉冲和活动视频的开始。 因为每个同步脉冲,视频接收器或监视器“看起来”同步脉冲的前沿。前缘行为同步显示视频源。

模拟视频扫描 一幅画在电视或者电脑显示器的电子信号水平在一次显示一行。水平同步脉冲结束时确保同步显示的每一行的开始下一行的信息。 从顶部开始,所有的线条显示扫描以这种方式。一个完整的一组行形式,或框架。完成一帧,垂直扫描过程返回到屏幕的左上角,重复这个过程。扫描线条的数量决定了图像的垂直分辨率和整个画面形成的速度称为刷新率。 模拟视频扫描(继续) 有两种不同类型的扫描系统,交错和进步,技术用于不同格式的图片在屏幕上。从本质上讲,电视信号和兼容显示器交错而计算机信号和兼容显示器是进步(逐行)。 隔行扫描是每一帧分成两个独立的领域,与一个字段组成的水平扫描奇数行,另一个由偶数水平扫描线。这张图片是显示在屏幕上通过扫描在交流的基础上。 所有视频逐行扫描方法提出了扫描线在屏幕上在一个而不是两个。它通常用字母“p”,如“480 p”,这表明一个信号与480活跃行60帧每秒。 数字视频信号 数字视频信号是明显不同的模拟信号相比,与特定的性能和时间要求,必须维护在整个信号通路。数字视频信号表示为方形波瞬时组成的两个状态之间的转换:打开或关闭,没有中间状态的数字信号与模拟信号。

常见的数字音频格式

处理音频与视频 教学目标: 1.基本知识 (1)认识理解常见视频音频格式及特点,认识并熟悉会声会影的操作界面、常用功 能及特点。 2.熟练掌握编辑处理视频的基本操作: 3.操作技能目标 (1)通过参与活动,具有视频的基本编辑操作能力。 (2)通过实例任务的完成,会添加视频效果。 会使用会声会影对编辑处理好的作品进行整合和发布。 一、常见的数字音频格式: WAV格式 1. WAV格式,是微软公司开发的一种声音文件格式,也叫波形声音文件,是最早的数字音频格式,被Windows平台及其应用程序广泛支持。WAV格式支持许多压缩算法,支持多种音频位数、采样频率和声道,采用的采样频率,16位量化位数,跟CD一样,对存储空间需求太大不便于交流和传播。 MIDI格式 2. MIDI是Musical Instrument Digital Interface的缩写,又称作乐器数字接口,是数字音乐/电子合成乐器的统一国际标准。它定义了计算机音乐程序、数字合成器及其它电子设备交换音乐信号的方式,规定了不同厂家的电子乐器与计算机连接的电缆和硬件及设备间数据传输的协议,可以模拟多种乐器的声音。MIDI文件就是MIDI格式的文件,在MIDI 文件中存储的是一些指令。把这些指令发送给声卡,由声卡按照指令将声音合成出来。 midi是乐器数字接口的意思,向合成器发送音乐指令,便可以生成音乐信号。我们知道,声音有四大特性,音高,音长,音强,音色。向midi合成器发送用何种乐器演奏(音色),音高,持续时间(音长),音量大小等指令,电子乐器便可以发出所要求的... CDA格式

3. 大家都很熟悉CD这种音乐格式了,扩展名CDA,其取样频率为,16位量化位数,跟WAV一样,但CD存储采用了音轨的形式,又叫“红皮书”格式,记录的是波形流,是一种近似无损的格式。 MP3格式 4. MP3全称是MPEG-1 Audio Layer 3,它在1992年合并至MPEG规范中。MP3能够以高音质、低采样率对数字音频文件进行压缩。换句话说,音频文件(主要是大型文件,比如WAV文件)能够在音质丢失很小的情况下(人耳根本无法察觉这种音质损失)把文件压缩到更小的程度。 MP3Pro格式 5. MP3Pro是由瑞典Coding科技公司开发的,其中包含了两大技术:一是来自于Coding 科技公司所特有的解码技术,二是由MP3的专利持有者法国汤姆森多媒体公司和德国Fraunhofer集成电路协会共同研究的一项译码技术。MP3Pro可以在基本不改变文件大小的情况下改善原先的MP3音乐音质。它能够在用较低的比特率压缩音频文件的情况下,最大程度地保持压缩前的音质。 WMA格式 6. WMA (Windows Media Audio)是微软在互联网音频、视频领域的力作。WMA格式是以减少数据流量但保持音质的方法来达到更高的压缩率目的,其压缩率一般可以达到1:18。此外,WMA还可以通过DRM(Digital Rights Management)方案加入防止拷贝,或者加入限制播放时间和播放次数,甚至是播放机器的限制,可有力地防止盗版。 MP4格式 7. MP4采用的是美国电话电报公司(AT&T)所研发的以“知觉编码”为关键技术的a2b 音乐压缩技术,由美国网络技术公司(GMO)及RIAA联合公布的一种新的音乐格式。MP4在文件中采用了保护版权的编码技术,只有特定的用户才可以播放,有效地保证了音乐版权的合法性。另外MP4的压缩比达到了1:15,体积较MP3更小,但音质却没有下降。不过因为只有特定的用户才能播放这种文件,因此其流传与MP3相比差距甚远。 采样频率即取样频率,指每秒钟取得声音样本的次数。采样频率越高,声音的质量也就越好。人耳的分辨率很有限,所以太高的频率就分辨不出来了;采样频率一般共分为、、48khz三个等级,只能达到fm广播的声音品质,是cd音质,48khz则是dvd audio或专业领域才会采用。

数字音频作业及其答案

第一次作业: 1:、声音可分为两种:纯音和复合音,平常人们说话的声音属于哪一种语音的频率范围是多少音频通常包括哪几种声音信号其频率范围是多少 2、请说明音频信号数字化的三个步骤 3、如何理解“量化是信号数字化过程中重要的一步,而这一过程又是引入噪声的主要根源”这句话的含义通过哪些途径可以减小量化误差 4对双极性信号若采用均匀量化,则量化信噪比SNR与量化比特数之间的关系为:SNR=+,试分析此式对实际量化与编码的指导意义 5:、A/D、D/A转换器的技术指标有哪些 答:1:人们说话的声音为复合音,语言的频率范围为300HZ-3000HZ。音频暴多语音、音乐、效果声等声音信号,频率范围为20HZ-20KHZ。 2:1取样:对连续信号按一定的时间间隔取样。奈奎斯特取样定理认为,只要取样频率大于等于信号中所包含的最高频率的两倍,则可以根据其取样完全恢复出原始信号,这相当于当信号是最高频率时,每一周期至少要采取两个点。但这只是理论上的定理,在实际操作中,人们用混叠波形,从而使取得的信号更接近原始信号。2量化:取样的离散音频要转化为计算机能够表示的数据范围,这个过程称为量化。量化的等级取决于量化精度,也就是用多少位二进制数来表示一个音频数据。一般有8位,12位或16位。量化精度越高,声音的保真度越高。以8位的举例稍微说明一下其中的原理。若一台计算机能够接收八位二进制数据,则相当于能够接受256个十进制的数,即有256个电平数,用这些数来代表模拟信号的电平,可以有256种,但是实际上采样后的某一时刻信号的电平不一定和256个电平某一个相等,此时只能用最接近的数字代码表示取样信号电平。3编码:对音频信号取样并量化成二进制,但实际上就是对音频信号进行编码,但用不同的取样频率和不同的量化位数记录声音,在单位时间中,所需存贮空间是不一样的。波形声音的主要参数包括:取样频率.量化位数.声道数.压缩编码方案和数码率等,未压缩前,波形声音的码率计算公式为:波形声音的码率=取样频率*量化位数*声道数/8。波形声音的码率一般比较大,所以必需对转换后的数据进行压缩。 3:量化是按四舍五入对采样的样本值进行计量的,这个过程会产生误差可对噪声进行整形,提高采样频率等方法减小量化误差 4:量化比特数增加一位,则信噪比提高6dB,信噪比提高意味着声音动态范围的加宽,若采用量化比特N=16的A/D变换器的数字声记录在磁带上可以扩展到98dB,接近于交响乐动态范围,若将量化比特提高到N=20,可扩至人儿的122dB动态范围。 5:A/D的技术指标有:分辨率、转换速率、量化误差、偏移误差、满刻度误差和线性度误差等。D/A转换器的技术指标有:分辨率和建立时间。 第二次作业: 1.什么叫最小可闻阈什么叫掩蔽阈什么叫频域掩蔽什么叫时域掩蔽掩蔽效应的一般规律是什么 2.何谓临界频带简述它在音频编码中的应用。 3.音频编码通常分为哪几类它们各有什么优缺点 4.声音压缩的依据是什么MPEG-1音频编码利用了听觉系统的什么特性 5.子带编码的基本思想是什么进行子带编码的好处是什么 6 .在MUSICAM的MPEG Layer I编码器的比特分配中,请读/写出32位“标题”:1111 1111 1111 0010 1101 0001 0101 1101 所表示的信息。 7.什么叫做声道环绕立体声 8.MUSICAM音频比特流数据帧中的比例因子起什么作用

数字音频作业及其答案

第一次作业: 1:、声音可分为两种: 纯音和复合音,平常人们说话的声音属于哪一种?语音的频率范围是多少?音频通常包括哪几种声音信号?其频率范围是多少? 2、请说明音频信号数字化的三个步骤? 3、如何理解“量化是信号数字化过程中重要的一步,而这一过程又是引入噪声的主要根源”这句话的含义?通过哪些途径可以减小量化误差? 4对双极性信号若采用均匀量化,则量化信噪比SNR与量化比特数之间的关系为: SNR=6.02xN+1.76dB,试分析此式对实际量化与编码的指导意义? 5:、A/ D、D/A转换器的技术指标有哪些? 答:1:人们说话的声音为复合音,语言的频率范围为300HZ-3000HZ。音频暴多语音、音乐、效果声等声音信号,频率范围为20HZ-20KHZ。 2:1取样: 对连续信号按一定的时间间隔取样。奈奎斯特取样定理认为,只要取样频率大于等于信号中所包含的最高频率的两倍,则可以根据其取样完全恢复出原始信号,这相当于当信号是最高频率时,每一周期至少要采取两个点。但这只是理论上的定理,在实际操作中,人们用混叠波形,从而使取得的信号更接近原始信号。2量化: 取样的离散音频要转化为计算机能够表示的数据范围,这个过程称为量化。量化的等级取决于量化精度,也就是用多少位二进制数来表示一个音频数据。一般有8位,12位或16位。量化精度越高,声音的保真度越高。以8位的举例稍微说明一下其中的原理。若一台计算机能够接收八位二进制数据,则相当于能够接受256个十进制的数,即有256个电平数,用这些数来代表模拟信

号的电平,可以有256种,但是实际上采样后的某一时刻信号的电平不一定和256个电平某一个相等,此时只能用最接近的数字代码表示取样信号电平。3编码: 对音频信号取样并量化成二进制,但实际上就是对音频信号进行编码,但用不同的取样频率和不同的量化位数记录声音,在单位时间中,所需存贮空间是不一样的。波形声音的主要参数包括: 取样频率.量化位数.声道数.压缩编码方案和数码率等,未压缩前,波形声音的码率计算公式为: 波形声音的码率=取样频率*量化位数*声道数/8。波形声音的码率一般比较大,所以必需对转换后的数据进行压缩。 3:量化是按四舍五入对采样的样本值进行计量的,这个过程会产生误差可对噪声进行整形,提高采样频率等方法减小量化误差 4:量化比特数增加一位,则信噪比提高6dB,信噪比提高意味着声音动态范围的加宽,若采用量化比特N=16的A/D变换器的数字声记录在磁带上可以扩展到98dB,接近于交响乐动态范围,若将量化比特提高到N=20,可扩至人儿的122dB动态范围。 5:A/D的技术指标有: 分辨率、转换速率、量化误差、偏移误差、满刻度误差和线性度误差等。D/A转换器的技术指标有: 分辨率和建立时间。 第二次作业: 1.什么叫最小可闻阈?什么叫掩蔽阈?什么叫频域掩蔽?什么叫时域掩蔽?掩蔽效应的一般规律是什么? 2.何谓临界频带?简述它在音频编码中的应用。 3.音频编码通常分为哪几类?它们各有什么优缺点?

相关文档
最新文档