声音信号的获取与处理

声音信号的获取与处理
声音信号的获取与处理

实验一声音信号的获取与处理

声音媒体是较早引入计算机系统的多媒体信息之一,从早期的利用PC机内置喇叭发声,发展到利用声卡在网上实现可视电话,声音一直是多媒体计算机中重要的媒体信息。在软件或多媒体作品中使用数字化声音是多媒体应用最基本、最常用的手段。通常所讲的数字化声音是数字化语音、声响和音乐的总称。在多媒体作品中可以通过声音直接表达信息、制造某种效果和气氛、演奏音乐等。逼真的数字声音和悦耳的音乐,拉近了计算机与人的距离,使计算机不仅能播放声音,而且能“听懂”人的声音是实现人机自然交流的重要方面之一。

采集(录音)、编辑、播放声音文件是声卡的基本功能,利用声卡及控制软件可实现对多种音源的采集工作。在本实验中,我们将利用声卡及几种声音处理软件,实现对声音信号的采集、编辑和处理。

实验所需软件:

Windows录音机(Windows98内含)

Creative WaveStudio(Creative Sound Blaster系列声卡自带)

Syntrillium Cool Edit 2000(下载网址:https://www.360docs.net/doc/0e9397884.html,)

进行实验的基本配置:

Intel Pentium 120 CPU或同级100%的兼容处理器

大于16MB的内存

8位以上的DirectX兼容声卡

1.1 实验目的和要求

本实验通过麦克风录制一段语音信号作为解说词并保存,通过线性输入录制一段音乐信号作为背景音乐并保存。为录制的解说词配背景音乐并作相应处理,制作出一段完整的带背景音乐的解说词。

1.2 预备知识

1.数字音频和模拟音频

模拟音频和数字音频在声音的录制和播放方面有很大不同。模拟声音的录制是将代表声音波形的电信号转换到适当的媒体上,如磁带或唱片。播放时将纪录在媒体上的信号还原为波形。模拟音频技术应用广泛,使用方便。但模拟的声音信号在多次重复转录后,会使模拟信号衰弱,造成失真。

数字音频就是将模拟的(连续的)声音波形数字化(离散化),以便利用数字计算机进行处理,主要包括采样和量化两个方面。

2.数字音频的质量

数字音频的质量取决于采样频率和量化位数这两个重要参数。采样频率是对声音波形每秒钟进行采样的次数。人耳听觉的频率上限在2OkHz左右,根据采样理论,为了保证声音

不失真,采样频率应在4OkHz左右。经常使用的采样频率有11.025kHz、22.05kHz和44.lkHz 等。采样频率越高,声音失真越小、音频数据量越大。量化数据位数(也称量化级)是每个采样点能够表示的数据范围,经常采用的有8位、12位和16位。例如,8位量化级表示每个采样点可以表示256个(0-255)不同量化值,而16位量化级则可表示65536个不同量化值。量化位数越高音质越好,数据量也越大。反映数字音频质量的另一个因素是通道(或声道)个数。单声道是比较原始的声音复制形式, 每次只能生成一个声波数据。立体声(双声道)技术是每次生成二个声波数据,并在录制过程中分别分配到两个独立的声道出输出,从而达到了很好的声音定位效果。四声道环绕(4.1声道)是为了适应三维音效技术而产生的,四声道环绕规定了4个发音点:前左、前右,后左、后右,并建议增加一个低音音箱,以加强对低频信号的回放处理。Dolby AC-3音效(5.1声道)是由5个全频声道和一个超重低音声道组成的环绕立体声。

在多媒体音频技术中,存储声音信息的文件有多种格式,如Wav、Midi、Mp3、Rm、VQF等等。

1)Wav格式

Wav格式的文件又称波形文件,是用不同的采样率对声音的模拟波形进行采样得到的一系列离散的采样点,以不同的量化位数(16位、32位或64位)把这些采样点的值转换成二进制数得到的。Wav是数字音频技术中最常用的格式,它还原的音质较好,但所需存储空间较大。

2)Midi格式

Midi是Musical Instrument Digital Interface(乐器数字接口)的缩写。它是由世界上主要电子乐器制造厂商建立起来的一个通信标准,并于 1988年正式提交给MIDI制造商协会,便成为数字音乐的一个国际标准。MIDI标准规定了电子乐器与计算机连接的电缆硬件以及电子乐器之间、乐器与计算机之间传送数据的通信协议等规范。 MIDI标准使不同厂家生产的电子合成乐器可以互相发送和接收音乐数据。Midi文件纪录的是一系列指令而不是数字化后的波形数据,所以它占用存储空间比Wav文件要小很多。

3)MP3格式

MP3是对MPEG Layer 3的简称,是目前最热门的音乐文件。其技术采用MPEG Layer 3标准对WA VE音频文件进行压缩而成,特点是能以较小的比特率、较大的压缩率达到近乎CD音质。其压缩率可达1:12,每分钟CD音乐大约需要1兆的磁盘空间。

4)Rm格式

Rm是RealMedia文件的简称。 Real Networks公司所制定的音频视频压缩规范称为RealMedia,是目前在Internet上相当流行的跨平台的客户/服务器结构多媒体应用标准,它采用音频/视频流和同步回放技术来实现在Intranet上全带宽地提供最优质的多媒体,同时也能够在Internet上以28.8Kbps的传输速率提供立体声和连续视频。

1.3 实验内容与步骤

一.实验内容:

1.硬件与软件的准备

目前,多媒体计算机中的音频处理工作主要借助声卡,从对声音信息的采集、编辑加工,直到声音媒体文件的回放这一整个过程都离不开声卡。声卡在计算机系统中的主要作用是声音文件的处理、音调的控制、语音处理和提供MIDI接口功能等。

进行录制音频信号所需的硬件除了声卡,还有麦克风、音箱以及外界的音源信号设

备(如CD唱机、录音机等),把麦克风、音箱、外界音源信号设备与声卡正确连接完成硬件准备工作。在Windows的【控制面板】/【多媒体】中选择正确的录音和回放设备,并对其进行调试。

2.3.4.5.用Windows录音机录制解说词

使用Windows录音机录制任意一段语音信号作为解说词,录制完毕后把文件存为Wav 格式,文件名为【示例1_1】。

使用Cool Edit录制背景音乐

使用Cool Edit 2000录制任意一段语音信号作为背景音乐,要求录制的声音文件

采样频率为44100Hz,立体声,量化位数为16位,保存文件的为Wav格式,文件名【示例1_2】。

使用WaveStuido编辑和处理背景音乐

使用WaveStuido对【示例1_2】先进行回声处理,【幅度】值为100%,【回声延迟】为300毫秒。然后进行【淡入】和【淡出】处理,【幅度】值各为50%。

使用Cool Edit进行混音处理

使用Cool Edit的【Mix paste】功能对【示例1_1】和【示例1_2】进行混音处理。把【示例1_2】加入【示例1_1】中去,编辑成为一个完整的带背景音乐的解说词,保存为【示例1_3】

二.示例

1.硬件与软件的准备

要录取声音文件需要的硬件主要有:声卡、麦克风,为了回放所录取的声音还需要配备音箱,如图1.1所示。

图1.1麦克风、声卡、CD音源、音箱

声卡后有几个接口,标有Midi/Game的梯形接口是接Midi键盘和游戏手柄的,标有Audio Out的圆口是接音箱的,标有Mic的圆口是接麦克风的,标有Line In的圆口是外接音频输入设备的。声卡、音箱和麦克风的连接,如图1.2所示。

图1.2电脑连线图

在完成了硬件设备的连接后为了使声卡能正常工作还要进行软件的调试。进入Windows98,选择【开始】/【设置】/【控制面板】,选【多媒体】。在【多媒体属性】对话框中选择的【音频】,在【回放】和【录音】的首选设备中选择声卡所对应的输入和输出选项,如图1.3所示。

图1.3【多媒体属性】的对话框

为确保麦克风和线性输入能正常使用,双击位于桌面右下任务栏的喇叭,打开【播放控制】对话框,确认话筒和线性输入的【静音】前没有打“√”,如图1.4所示。

图1.4【播放控制】的对话框

2.用Windows录音机录制解说词

步骤1:首先准备一份所需录制的材料作为解说词。

步骤2:执行【开始】/【程序】/【附件】/【娱乐】/【录音机】。打开【录音机】,单击【录音】按钮开始录音。Windows录音机录制音频文件时一次能录制的时间

为60秒,当录制时间大于60秒后,按【录音】继续录制。当朗读文章结束后,单

击【停止】结束录音,如图1.5所示。

图1.5 windows录音机

步骤3:执行菜单【文件】/【另存为】命令,在出现的【另存为】对话框中的【格式】项,选【更改】。在【选择声音】对话框中修改【属性】项为【22.05Hz16位86KB/s】,

单击【确定】返回【另存为】对话框,选好保存的路径,文件名存为【示例1_1】,保存类型选Wav,如图1.6所示。

图1.6 windows 录音机的保存及属性修改

这样一个完整语音音频文件便保存好了。

3.使用Cool Edit录制背景音乐

背景音乐可由录音机、CD唱机等输出的模拟音频获取。首先保证外界音源设备与声卡的Line In接口正确相连。

步骤1:选择【开始】/【程序】/【Cool Edit 2000】/【Cool Edit 2000】,打开Cool Edit 2000,如图1.7所示。

图1.7Cool Edit 2000主界面

步骤2:单击工具栏的【Record】按钮,如图1.8所示。

图1.8Cool Edit 2000的工具栏

出现【New Waveform】对话框,分别选择【Sample Rate】为44100,【Channels】为【Stereo】,【Resolution】为【16-bits】,单击【OK】按钮开始录音,如图 1.9所示。

图1.9 【New Waveform】对话框

步骤3:录音结束,单击工具栏的【Stop】按钮完成录音,如图1.8所示。

步骤4:执行【File】/【Save As…】,打开保存对话框,如图1.10所示。选择好路径,文件名存为【示例1_2】,保存类型选【Windows PCM(*.Wav)】,单击【保存】完成对音乐文件的录制。

图1.10 保存【Music.wav】音乐文件

4.使用WaveStudio编辑和处理背景音乐

步骤1:打开【示例1_2】文件,执行【特殊】/【回声】,设置【加入回声】对话框。在【幅度】中添入100%,在【回声延迟】中添入300毫秒,在【将回声加入】中选【两个通道】。单击【确定】进行处理,如图1.11所示。

图1.11【加入回声】对话框

步骤2:拖动鼠标选取声音波形开头的一部分,执行【特殊】/【淡入…】,设置【淡入】对话框。在【幅度】中添入50%,【淡入】为【两个通道】,单击【确定】进行处理,如图1.12所示。

图1.12【淡入】对话框

步骤3:拖动鼠标选取声音波形结尾的一部分,执行【特殊】/【淡出…】,设置【淡出】对话框。在【幅度】中添入50%,【淡出】为【两个通道】,单击【确定】进行处理,如图1.13所示。

图1.13 【淡出】对话框

步骤4:保存文件,完成编辑。

5.使用Cool Edit进行混音处理

步骤1:打开【示例1_1】,执行【Edit】/【Mix paste…】命令,打开【Mix paste】对话框如图1.14所示。

图1.14 【Mix paste】对话框

1)。在Volume框中,【Volume L,R】代表左右声道音量,若为单声道文件,则只有一个声

道音量调节,若选中【Invert】,则文件在被粘贴前声音数据将会颠倒。当【Lock left/Right】被选中时,左右声道调节钮将被锁定,调节时将一齐变化。

2)。在合成方式框中,选定【Insert】,则被粘贴的文件插入当前文件之中。选定【Overlap】时,则被粘贴的文件不会取代当前文件中的选定部分,而是以选定的部分与当前文件叠加。若被粘贴的文件比当前文件的选定部分长,则超出范围的部分将继续被粘贴。选定【Replace】,则被粘贴的声音文件将覆盖源文件。选定【Modulate】,则被粘贴的声音文件与当前文件一起调制,即将每采样点的幅值相乘混合后输出。激活【Crossfade】,输入时间(ms),则在粘贴前后粘贴的文件有一定的淡入淡出。

3)。在选择被粘贴的文件来源框中,选中【From Clipboard】表示被粘贴的文件来源于剪贴板。【From windows Clipboard】表示被粘贴的文件来源于Windows剪贴板。【From File】表示被粘贴的文件来源于新文件,单击【Select File…】按钮可选择文件。

4)。【Looppast】指粘贴文件的次数。

在本实验中设置【Volume L,R】为90,选中【Overlap】,设置【Crossfade】值为50,选中【From File】,单击【Select File…】选择作为背景音乐的文件【示例1_2】,【Looppast】为1,单击【OK】完成设置。

步骤2:处理结束后,打开【File】/【Save As…】,选择好路径,文件名存为【示例1_3】单击【保存】,完成混音处理,如图1.15所示。

图1.15混音处理后的音频文件

1.4 思考题

1.数字音频通常使用的采样率为多少?

2.请举出三种多媒体音频技术中常用的存储声音信息的文件格式?

3.怎样使用WaveStudio进行混音处理?

4.使用WaveStudio混音处理后的声音文件如果出现背景音乐过大或过小的问题,如何解决此问题?

常用视频信号接口与处理方法总结

常用视频信号接口与处理方法总结 刘学满2010-4-13 视频接口概述 视频接口,从颜色空间、数字/模拟、分离/复合(适用于模拟信号)、并行/串行(适用于数字信号) 单端/ 差分等类别可以分为如下几种,见下表:

二、模拟视频信号接口 1.接口设计 模拟信号由于其电压范围很小,如果接口电路设计不当,很可能造成最终的信号质量下降。因此 需要 注意以下几个事项: 1)阻抗匹配:通常为75Ω ,包括发送端,接收端以及传输路径上的阻抗。

2)隔直电容:为了防止不同设备间地电压差对信号造成的影响,此电容不宜过大或者过小。 3)滤波网络:尽可能地消除低频和高频纹波。 4)地平面:根据理论,地平面分隔可以防止数字信号对模拟地干扰,但从实际经验来 看,分隔成小的地平面后,实际上会造成环流( AD9883资料中有叙述) 。因此大部分 情况下,还是用同一个地。多层地平面,以及多打过孔,保持地电平的稳定是非常必 要的。 5)PCB走线:等长是需要的,而且要确保三个器件经过不同的选择器/ 缓冲器之后的延时也相差不 多,否则很难保证采样相位。 6)ESD保护:如果视频接口经常插拔,就需要加ESD保护二极管。 2.视频ADC 完成模拟信号到数字信号的转换,在使用过程中需要注意的主要问题有: 1)A/D 是否支持交流耦合方式输入 2)A/D 内部是否有信号增益调整功能 3)是否支持差分输入 4)A/D 内部是否有PLL等器件,采样相位是否可调整 5)A/D输出的信号格式( 24bit RGB ,YCbCr)

6)是否支持SOG或者SOY等同步信号输入 模拟信号在A/D 转换时,通常需要进行一些调整,以达到最佳显示效果: 1)调整黑电平位置和最大辐值,通常可以配置A/D 芯片有关offset 和gain 的寄存器,经过此番调 整之后,实际上是校准了RGB三色,同时提高了灰度等级。 2)调整PLL锁相环,以达到合适的采样频率,并保证PLL 在各种温度条件下均能稳定工作。 3)调整采样起始点和终止点,确保有效信号不丢失。 4)调整采样相位,使最终显示画质更清晰。 3.视频DAC 完成模拟信号到数字信号的转换,在使用过程中需要注意的主要问题有: 1)D/A 输出时,驱动方式是电压型的,还是电流型的?带负载与不带负载的电压是多少?是否合乎规范要求。如果不合适,必要时加缓冲器或者放大器输出。 2)D/A的输入接口是多少位的?如果是8bit/10bit 兼容,要注意最高2 位和最低2 位的接法。 3)输出同步信号是什么格式?是否需要输出CS或者SOG? 4.解码器 这里说的解码器是指针对CVBS(PAL、NTSC)或者Y/C 信号的亮度色度解调和分离用的解码器,解码器输出的通常为BT656 或者BT601 格式的数字信号,此信号仍为隔行信号。 解码器使用中,接口部分设计与ADC相类似,对输入信号格式,输出信号格式的寄存器配置有一些差异,如果输入格式设置不当,虽然能输出信号,但显示不正确。 5.编码器 视频编码器特指从BT656/BT601 格式转到CVBS/YC信号的转换器,一方面完成数字到模拟信号的转换,另一方面是完成亮度信号与色度信号的调制、复合。 解码器使用中,接口部分设计与DAC相类似,主要的不同也在于I 2C寄存器配置不同。6.缓冲器/放大器/ 选择器/分配器 模拟视频信号在传输和处理的过程中,通常需要一些缓冲/ 放大/ 选择/ 分配等处理。 在这些电路设计时,着重需要考虑的问题: 1)输入信号的电压辐值,芯片供电范围是否能满足要求,是否需要加75Ω电阻。 2)期望信号放大多少倍输出。

数字信号处理知识点总结

《数字信号处理》辅导 一、离散时间信号和系统的时域分析 (一) 离散时间信号 (1)基本概念 信号:信号传递信息的函数也是独立变量的函数,这个变量可以是时间、空间位置等。 连续信号:在某个时间区间,除有限间断点外所有瞬时均有确定值。 模拟信号:是连续信号的特例。时间和幅度均连续。 离散信号:时间上不连续,幅度连续。常见离散信号——序列。 数字信号:幅度量化,时间和幅度均不连续。 (2)基本序列(课本第7——10页) 1)单位脉冲序列 1,0()0,0n n n δ=?=?≠? 2)单位阶跃序列 1,0 ()0,0n u n n ≥?=?≤? 3)矩形序列 1,01 ()0,0,N n N R n n n N ≤≤-?=?<≥? 4)实指数序列 ()n a u n 5)正弦序列 0()sin()x n A n ωθ=+ 6)复指数序列 ()j n n x n e e ωσ= (3)周期序列 1)定义:对于序列()x n ,若存在正整数N 使()(),x n x n N n =+-∞<<∞ 则称()x n 为周期序列,记为()x n ,N 为其周期。 注意正弦周期序列周期性的判定(课本第10页) 2)周期序列的表示方法: a.主值区间表示法 b.模N 表示法 3)周期延拓 设()x n 为N 点非周期序列,以周期序列L 对作()x n 无限次移位相加,即可得到周期序列()x n ,即 ()()i x n x n iL ∞ =-∞ = -∑ 当L N ≥时,()()()N x n x n R n = 当L N <时,()()()N x n x n R n ≠ (4)序列的分解 序列共轭对称分解定理:对于任意给定的整数M ,任何序列()x n 都可以分解成关于/2c M =共轭对称的序列()e x n 和共轭反对称的序列()o x n 之和,即

声音信号的获取与处理

实验一声音信号的获取与处理 声音媒体是较早引入计算机系统的多媒体信息之一,从早期的利用PC机内置喇叭发声,发展到利用声卡在网上实现可视电话,声音一直是多媒体计算机中重要的媒体信息。在软件或多媒体作品中使用数字化声音是多媒体应用最基本、最常用的手段。通常所讲的数字化声音是数字化语音、声响和音乐的总称。在多媒体作品中可以通过声音直接表达信息、制造某种效果和气氛、演奏音乐等。逼真的数字声音和悦耳的音乐,拉近了计算机与人的距离,使计算机不仅能播放声音,而且能“听懂”人的声音是实现人机自然交流的重要方面之一。 采集(录音)、编辑、播放声音文件是声卡的基本功能,利用声卡及控制软件可实现对多种音源的采集工作。在本实验中,我们将利用声卡及几种声音处理软件,实现对声音信号的采集、编辑和处理。 实验所需软件: Windows录音机(Windows98内含) Creative WaveStudio(Creative Sound Blaster系列声卡自带) Syntrillium Cool Edit 2000(下载网址:https://www.360docs.net/doc/0e9397884.html,) 进行实验的基本配置: Intel Pentium 120 CPU或同级100%的兼容处理器 大于16MB的内存 8位以上的DirectX兼容声卡 1.1 实验目的和要求 本实验通过麦克风录制一段语音信号作为解说词并保存,通过线性输入录制一段音乐信号作为背景音乐并保存。为录制的解说词配背景音乐并作相应处理,制作出一段完整的带背景音乐的解说词。 1.2 预备知识 1.数字音频和模拟音频 模拟音频和数字音频在声音的录制和播放方面有很大不同。模拟声音的录制是将代表声音波形的电信号转换到适当的媒体上,如磁带或唱片。播放时将纪录在媒体上的信号还原为波形。模拟音频技术应用广泛,使用方便。但模拟的声音信号在多次重复转录后,会使模拟信号衰弱,造成失真。 数字音频就是将模拟的(连续的)声音波形数字化(离散化),以便利用数字计算机进行处理,主要包括采样和量化两个方面。 2.数字音频的质量 数字音频的质量取决于采样频率和量化位数这两个重要参数。采样频率是对声音波形每秒钟进行采样的次数。人耳听觉的频率上限在2OkHz左右,根据采样理论,为了保证声音

视频信号处理实验报告

中南大学 实验报告(实验一) 实验名称 JM代码编译与编解码参数配置 课程名称视频信号处理 姓名:杨慧成绩:__________________ 班级:电子信息工程1301班学号: 0903130117 日期: 2016.6.10 地点:综合实验楼 备注:

1.实验目的 1)掌握常用的编解码器参数及其用法,实现测试序列的编解码 2)初步了解H.264视频编解码的基本原理、熟开发工具的使用 3)学会使用相关的开发工具修改、调试参考软件,掌握使用相应软件实现视频编解码的经验与技巧,锻炼提高分析问题和解决问题的能力 4)调试、编译好相应的实验程序,正确配置测试参数,能预计可能出现的结果2.实验环境(软件、硬件及条件) Windows 7 3.实验方法 1)JM工作目录与文件设置 ①下载并解压JM源代码。 ②在源代码根目录下的bin文件夹中新建backup文件夹,将bin文件夹中所有文件移入该文件夹做备份。 ③在源代码根目录下新建encodtest文件夹,作为编码使用。将编码过程所需要的文件,例如:编码配置文件(encoder_baseline.cfg)、待编码视频序列文件(foreman_part_qcif.yuv,对应为编码配置文件中InputFile参数的值)复制到该文件夹中。 ④在源代码根目录下新建decodtest文件夹,作为解码使用。将解码过程所需要的文件,例如:解码配置文件(decoder.cfg)复制到该文件夹中。 ⑤检查实验用机安装的MS Visual C++版本,根据表3,本实验打开jm_vc10.sln 解决方案。

2)配置、编译、测试编码项目——lencod ①选中lencod项目,打开主菜单“项目——属性”,将所有配置(Debug、Release)和所有平台(Win32、x64)“常规”选项中的“输出目录”设置为 “.\bin\$(Configuration)_$(Platform)\”;将“调试”选项中“工作目录”设置为“.\encodtest”,在“命令参数”中设置要使用的解码配置文件,例如:“-d encoder_baseline.cfg”,然后确定修改。 ②选中lencod工程,选择鼠标右键菜单“设为启动项目”。 ③打开主菜单“生成--批生成”,勾选所有的lencod项目,点击生成后,将会在主目录bin文件夹的Debug_Win32/x64文件夹及Release_Win32/x64文件夹下生成Win32/x64平台的调试版(运行速度慢)和发行版(运行速度快)编码器程序lencod.exe。打开主菜单“生成--配置管理器”,将活动解决方案配置和平台分别设置为Release何Win32,执行调试完成编码。此时会在源代码根目录下的encodtest文件夹中生成几个新文件,其中test.264(对应编码配置文件中OutputFile参数的值)即为压缩码流文件。 3)配置、编译、测试解码项目--ldecod ①选中ldecod项目,打开主菜单“项目——属性”,将所有配置(Debug、Release)和所有平台(Win32、x64)“常规”选项中的“输出目录”设置为 “.\bin\$(Configuration)_$(Platform)\”;将“调试”选项中“工作目录”设置为“.\decodtest”,在“命令参数”中设置要使用的解码配置文件,例如:“ decoder.cfg”,然后确定修改。 ②将编码生成的压缩码流文件test.24复制到decodtest文件夹中。 ③选中lencod工程,选择鼠标右键菜单“设为启动项目”。 ④打开主菜单“生成--批生成”,勾选所有的ldecod项目,点击生成后,将会在主目录bin文件夹的Debug_Win32/x64文件夹及Release_Win32/x64文件夹下生成Win32/x64平台的调试版(运行速度慢)和发行版(运行速度快)编码器程序ldecod.exe。打开主菜单“生成--配置管理器”,将活动解决方案配置和平台分别设置为Release何Win32,执行调试完成编码。此时会在源代码根目录下的decodtest文件夹中生成几个新文件,其中test_dec.yuv(对应解码配置文

声音的采集与加工教学设计

《声音的采集与加工》教学设计 一、基本信息 二、设计思想 广东版选修教材《多媒体技术应用》中的“声音的采集与加工”教学模块主要包括四部分内容:“声音文件的存储格式”、“声音的采集”、“声音文件格式的转换”、“声音的加工”。仔细分析教材内容,基本上是音频理论知识和音频处理的相关操作介绍,如果按教材的先后顺序进行学习,学生很难从需求出发理解学习内容的实际意义,学习的兴趣就很难调动起来。“超级女声”在全国的异常火爆和网络翻唱的盛行,让我迅速创设了激发学生学习兴趣的情景,在此基础上对教材进行了二次开发,重新编排学习内容,将学习内容的了解和掌握适时穿插于整个作品的制作过程中,让学生经历“挫折”后,带着释疑的心情去探索新知,对所学内容记忆深刻,而且还能自我建构出许多书本上没有的新知识。 课前对学生学习情况的分析也是非常重要的一环,这个阶段学生已经完成了信息技术基础模块的学习,基本具备了网上搜索能力,掌握了简单的多媒体制作的方法,具有一定的设计、规划完成任务的能力。我还在学生中进行了“暗访”,了解到大部分学生对数字音频的加工、处理了解甚少,但却对此充满了神秘感,对数字音频在生活中的广泛应用展现出着浓厚的兴趣,对学习声音的采集和加工的学习充满期待。学生的喜好也是我暗访的重点,这为我最终确定创作主题起到决定性作用。虽然《超级女声》在学生中掀起一股唱卡拉OK的热潮,可是并非所有的学生都喜欢唱歌,单一的创作主题,很难满足全体同学的需求。于是我又构思出另一个主题,让学生根据自己的理解和编排创造性地给电影、动画、广告片断重新配语音和音效,有能力的同学还可以自己编制音乐故事,甚至还可以自

编、自导、自演电视音乐故事。基础薄弱学生的反映,引起我的关注,他们并没有表现极大的热情,并不是因为对主题不敢兴趣,而是担心自己无法胜任这个“高难度”的任务,于是我专门为能力薄弱的学生设计了一个简单而又有趣的声音编辑任务,使他们也能获得成就感。 教师事先的暗访是教学中活动安排的重要依据,对学生情况的了解使得活动主题及难度的设置贴近学生实际,而不是形式的“关怀”。 三、教学目标 1.知识与技能 认识多种声音文件存储格式、差异及适用情况; 掌握采集声音素材的技能,包括录制、声音素材的多途径获取; 掌握声音加工的具体技能:声音的剪辑、添加特殊效果、声音的合成; 掌握声音的存储和格式转换的基本方法。 2.过程与方法 让学生在对声音进行处理的过程中,关注运用了哪些知识和基本原理; 培养学生通过有计划、合理的数字音频加工进行创造性探索和解决实际问题的能力。 3.情感态度与价值观 让学生体会数字音频对人的生活带来的影响; 养成积极主动探究音频处理技术的习惯,帮助有困难的同学完成任务; 学会正确引用网络、光盘上的音乐,避免侵犯版权; 增强音乐的鉴赏能力,合理选用背景音乐。 四、教学重点和难点 重点:掌握声音采集、编辑和合成的一般方法。 难点:高质量地采集声音;润色声音(降噪、混响、高音激励等);多音轨合成声音。

语音信号处理实验一采集和预处理

实验一语音信号的采集及预处理 一、实验目的 在理论学习的基础上,进一步地理解和掌握语音信号预处理及短时加窗的意义及基于matlab的实现方法。 二、实验原理 1.语音信号的录音、读入、放音等:练习matlab中几个音频处理函数,利用函数wavread 对语音信号进行采样,记住采样频率和采样点数,给出以下语音的波形图(2.wav)。利用wavplay或soundview放音。也可以利用wavrecord自己录制一段语音,并进行以上操作(需要话筒)。 2.语音信号的分帧:对语音信号进行分帧,可以利用voicebox工具箱中的函数enframe。 voicebox工具箱是基于GNU协议的自由软件,其中包含了很多语音信号相关的函数。3.语音信号的加窗:本步要求利用window函数设计窗口长度为256(N=256)的矩形窗(rectwin)、汉明窗(hamming)及汉宁窗(hann)),利用wvtool函数观察其时域波形图及频谱特性,比较得出结论。观察整个信号加矩形窗及汉明窗后的波形,利用subplot与reshape函数将分帧后波形、加矩形窗波形及加汉明窗波形画在一张图上比较。取出其中一帧,利用subplot与reshape函数将一帧语音的波形、加矩形窗波形及加汉明窗波形画在一张图上比较将得出结论。 4.预加重:即语音信号通过一个一阶高通滤波器1 9375 1- -z。 .0 三、实验步骤、实验程序、图形及结论 1.语音信号的录音、读入、放音等 程序: [x,fs,nbit]=wavread('D:\2.wav'); %fs=10000,nbit=16 y=soundview('D:\2.wav') 2.语音信号的分帧 程序: [x,fs,nbit]=wavread('D:\2.wav'); len=256; inc=128; y=enframe(x,len,inc); figure; subplot(2,1,1),plot(x) subplot(2,1,2),plot(y)

学习“声音素材的获取与处理”心得体会

学习“声音素材的获取与处理”心得体会 东风中学祁聪2014年11月6、13、20、27日,我学习了“声音素材的获取与处理”的课程,通过学习我的到了一些心得体会。 首先,学习了声音素材的的获取: 一、声音素材主要包括背景音乐、解说词、郎诵、效果声及评语分析等等。 二、多媒体课件中的声音主要包括人声、音乐和音响效果三大类。 三、恰当的使用音乐和音响效果的作用 四、设计声音素材时的注意事项 五、数字声音、声音文件的采集和制作可以有以下7种方式、音频素材的获取方法、利用属性查找音频素材资源地址方法、利用属性查找音频素材资源地址方法、利用话筒录制声音的步骤、录音音量列表名词解释 通过这些学习我知道了声音的获取、录制、格式、编辑等方法。 其次、学习了MP3、WAV格式的区别。 1——MP3(MPEG AUDIO LAYER 3)是一种具有高压缩率的音响信号文件。虽然它音乐信号的压缩比例较高,但依然可以与CD/MD 的音质媲美。MP3高达10比1的压缩比例。使一张CD-R/RW上可以容纳10张普通CD的音乐。达到可以长时间播放音乐。您可以从互联网或其它渠道获取MP3格式的音乐。 2——WMA(WINDOW MEDIA AUDIO)是微软公司所开发的。引

导示来音乐的声音压缩技术。其音质可以与MP3媲美,有较高的压缩。有部分歌曲制成WMA格式音乐的大小可以达到MP3的三分之一!只要通过WINDOW MEDIA PLAYER 7.0以上的版本,就能将您喜爱的音乐编辑成WMA档案。 3——WAV(Waveform)格式是微软公司开发的一种声音文件格式,也叫波形声音文件,是最早的数字音频格式,被Windows平台及其应用程序广泛支持。WAV格式支持许多压缩算法,支持多种音频位数、采样频率和声道,采用44.1kHz的采样频率,16位量化位数,因此WAV的音质与CD相差无几,但WAV格式对存储空间需求太大不便于交流和传播。 总之,学习了这个课程,我学会了很多的东西,特别是在计算机信息处理得到了很大的提升。对声音的处理也学到了很多的东西。

第三讲 声音的采集与处理

第三讲声音的采集与处理 教学目标: 1.了解常见声音文件的格式。 2.掌握制作声音文件的一般流程。 3.会用Sound Forge等录音软件录制声音。 4.掌握用Sound Forge编辑声音的基本方法,能熟练地对声音文件进行剪辑与合成。 5.掌握熔炼五音,用Sound Forge对声音进行特殊效果处理的方法。 重点: 录音及对声音进行基本编辑的方法。 难点:声音的剪辑、合成及特殊效果处理方法。 一、常用声音文件格式 常用的声音文件格式有:WAV格式、MIDI格式、MP3格式、CDA格式。 WAV格式:WAV格式是多媒体教学软件中常用的声音文件格式,它的兼容性非常好,但文件较大。WAV格式的声音属性,如采样频率、采样位数、声道数直接影响到WAV格式文件的大小。 MIDI格式:是电子乐器声音文件格式, MIDI文件本身只是一些数字信号,占用磁盘空间较小,常作为多媒体教学软件的背景音乐文件。 MP3格式:是一种经过压缩的文件格式,播放时需要专门的MP3播放器。占用磁盘空间较小。 CDA格式:CD唱片中的音乐文件常用CDA格式保存,一般为44kHz,16bits立体声音频质量。 二、声音文件的制作流程 我们在制作多媒体教学软件时,需要各种各样的声音文件,对声音的制作一般分为两个基本阶段:声音的获取阶段,声音的加工处理阶段。声音的获 取有三种方法来源:剥离视频中的声音,录音,使用已有的声音文件。 声音的处理流程是:首先打开声音文件,然后对声音进行基本剪辑,进一

第一节走进Sound Forge 三、走进Sound Forge 我们可以把Sound Forge视为熔炼声音的熔炉,它能够对音频文件(.wav 文件)、视频文件(.avi文件)中的声音进行各种处理,打造出我们需要 的声音效果。在制作多媒体教学软件时,你想对获得的原始声音素材进行灵 活的处理吗?那么走进Sound Forge,让我们来领略它神气强大的功能吧! 好了,下面就让大家轻松亲身体验一下,为一多媒体教学软件制作声音。 首选来欣赏:我为一年级小学语文课文《一次比一次有进步》教学软件制作的声音文件。 下面就让我们用Sound Forge7.0一步步试着为课文录音、配音吧!要完成上面教学软件中的声音,要经过如下步骤: (一)录制声音 1.建立新的声音文件 选择“File”菜单下的“New”命令,新建一声音文件。在弹出的对话框中,设置新建声音文件的格式,即采样位数,声道数(立体声/单声道),采样频率,然后单击“OK”。 2.开始录音 2.1启动录音功能: 你可以用三种方法启动录音功能:按快捷键Ctrl+R; 单击工具栏上的录音按钮——红色圆点键; 选择菜单“Special”\“Transport”\下的“Record(录音)”命令; 2.2设置录音模式: 当你按下录音键后,会弹出一个录音设置对话框。你可以设置:录音模式(Mode),录音起始(start)、停止(End)时间位置。录音时的采 样率(samplerate)、采样位数(sample size)、立体声/单声道(stereo/mono) 的选择。 2.3开始录音:设置完毕后,单击录音设置对话框中的红色录音按钮,即 可用麦克风开始录音。 4.停止录音:按“End”停止按钮即可结束录音。 5.保存声音文件:选择菜单“File”下的“Save as”命令,保存文件。 这样一个自己录制的声音文件已经录制好了。(听听我录制的声音吧) 你想知道吗?(补充材料) (一).声音文件的三个基本属性

声音的获取与处理

声音的获取与处理(初中信息技术八年级)【教学设计学科名称】 声音的获取与处理是甘肃教育、甘肃声像出版社出版的初中信息技术八年级教材全一册模块一《多媒体素材的获取与处理》第三节教学内容。0 【学情分析】 授课对象是八年级学生。八年级学生经过前两节内容的学习,已基本具备多渠道获取信息的能力,对电脑的操作使用,文字信息、数据信息、多媒体信息均具备了一定的处理能力。而本节课的内容《声音的获取与处理》对学生来说应该是新奇、好玩的,且“学会了是有用的”。从内容上比较容易使学生主动注意,激发他们的求学欲。 【教材内容分析】 本节内容是甘肃教育、甘肃声像出版社出版的初中信息技术八年级教材全一册模块一《多媒体素材的获取与处理》第三节教学内容。本节主要让学生学会使用“录音机”录音,学会使用“豪杰超级解霸”抓取cd唱片中的声音,掌握使用“录音机”处理声音效果的方法。要求学生通过本节课的学习能了解声音文件的获取途径与方法,能正确选择适合的声音文件格式,并初步掌握声音文件的播放、转换和编辑。 【教学目标】

知识与技能:学会使用“录音机”录音,学会使用“豪杰超级解霸”抓取cd唱片中的声音,掌握使用“录音机”处理声音效果的方法。 过程与方法:采用创设情景、任务驱动的教学法,将知识技能融合于生活任务中,创设能激发学生兴趣的任务情境。采用简单合适的分组方法,在任务操作过程中融入合作交流的因子,倡导合作探究学习。 情感态度与价值观:培养学生根据实际需要主动运用多媒体处理工具加工和表达信息的能力关,并关注声音文件的版权问题,尊重知识产权。 【教学重难点分析】 教学重点:“录音机”录音方法,“豪杰超级解霸”抓取cd唱片中的声音 教学难点:使用“录音机”处理声音效果方法的掌握 【教学课时】 2课时 【教学过程】

声音的采集与处理(教学设计)

声音的采集与处理 一、指导思想: 信息技术新课标要求初中学生能够使用自己熟悉的多媒体制作软件采集和处理多媒体素材,并把各种素材有机的集成在一起形成多媒体作品,用多媒体作品来更好的表达自己的意愿和观点。声音的采集与处理是多媒体技术的重要组成部分,也是多媒体作品制作的必要前提和知识准备,初二学生第一次接触声音的采集与加工处理的内容,而且,这个年龄阶段的学生比较喜欢听音乐,也想对自己收集的音乐进行加工处理,所以这部分内容对他们有很强的吸引力。 二、教材内容分析: 本课是广东版初中信息技术第二册上第二章第二节的内容——《声音的采集与处理》。教材对本节的定位是,《声音的采集与处理》是对上一节图像的处理的延续,要求学生能够利用常用的软件来采集声音,并对声音进行加工处理,从而能够为上一节获取处理的图像配音,让学生初步感受多媒体表达的效果,也是为以后制作多媒体作品做好准备,激发学生逐步养成用多媒体的方式表达自己的思想的兴趣。 三、教学对象分析: 本节的教学对象是初二年级的学生。他们初步掌握了计算机中文件管理的方法。基本了解多媒体计算机的常见配置,能够安装一些应用软件,并在初一时已经试着用录音机软件进行录制声音和用Word进行文字编辑,初步掌握文字和图像的处理知识。学生思维比较活跃,模仿能力强,合作意识及操作能力较好。能够在教师的引导下自主探索、获取知识。 四、教学重点、难点分析: 重点:利用WaveCN软件采集声音信息,声音信息的剪辑和混音。 难点:在短时间内熟悉并掌握新软件WaveCN的使用操作。 五、教学目标设计: 1.知识与技能: 了解多种声音的采集录制以及加工处理的方式。 2.过程与方法: (1)研究把已掌握的相似功能软件的使用经验迁移到新的软件使用 上来。 (2)学习掌握声音的简单剪辑和混音方法。 3.情感态度与价值观: 引导学生联系物理课上所学的声波的知识,分析声音文件,

2声音的采集与处理

第二讲声音的采集与处理 教学目标: 1.了解常见声音文件的格式。 2.掌握制作声音文件的一般流程。 3.会用Sound Forge等录音软件录制声音。 4.掌握用Sound Forge编辑声音的基本方法,能熟练地对声音文件进行剪辑与合成。 5.掌握熔炼五音,用Sound Forge对声音进行特殊效果处理的方法。 重点: 录音及对声音进行基本编辑的方法。 难点:声音的剪辑、合成及特殊效果处理方法。 一、常用声音文件格式 常用的声音文件格式有:WAV格式、MIDI格式、MP3格式、CDA格式。 WAV格式:WAV格式是多媒体教学软件中常用的声音文件格式,它的兼容性非常好,但文件较大。WAV格式的声音属性,如采样频率、采样位数、声道数直接影响到WAV格式文件的大小。 MIDI格式:是电子乐器声音文件格式, MIDI文件本身只是一些数字信号,占用磁盘空间较小,常作为多媒体教学软件的背景音乐文件。 MP3格式:是一种经过压缩的文件格式,播放时需要专门的MP3播放器。占用磁盘空间较小。 CDA格式:CD唱片中的音乐文件常用CDA格式保存,一般为44kHz,16bits立体声音频质量。 二、声音文件的制作流程我们在制作多媒体教学软件时,需要各种各样的声音文件,对 声音的制作一般分为两个基本阶段:声音的获取阶段,声音的加工处理阶段。 声音的获取有三种方法来源:剥离视频中的声音,录音,使用已有的声音文 件。 声音的处理流程是:首先打开声音文件,然后对声音进行基本剪辑,进一步美化声音,对声音进行特殊效果处理。 成上面教学软件中的声音,要经过如下步骤: (一)录制声音 1.建立新的声音文件 选择“File”菜单下的“New”命令,新建一声音文件。在弹出的对话框中,设置新建声

第二章 语音信号处理基础知识

第二章语音信号处理基础知识 1、语音信号处理? 语音信号处理是研究用数字信号处理技术对语音信号进行处理的一门学科。 2、语音信号处理的目的? 1)如何有效地,精确地表示、存储、传递语音信号及其特征信息;2)如何用机器来模仿人类,通过处理某种运算以达到某种用途的要求,例如人工合成出语音,辨识出说话人、识别出说话内容等。 因此,在研究各种语音信号处理技术之前,需要了解语音信号的基本特性,同时,要根据语音的产生过程建立实用及便于分析的语音信号模型。 本章主要包括三方面内容:语音的产生过程、语音信号的特性分析以及语音信号生成的数学模型。 第一部分内容语音的产生过程,我们要弄清两个问题:1)什么是语音?2)语音的产生过程? 3、什么是语音? 语音是带有语言的声音。人们讲话时发出的话语叫语音,它是一种声音,由人的发音器官发出且具有一定的语法和意义。语音是声音和语言的组合体,所以对于语音的研究包括:1)语音中各个音的排列由一些规则控制,对这些规则及其含义的研究成为语言学;2)对语音中各个音的物理特征和分类的研究称为语音学。 4、语音的产生 语音的产生依赖于人类的发声器官。人的发音器官包括:肺、气管、喉、咽、鼻、口等。 ◆喉以上的部分称为声道,其形状随发出声音的不同而变化; ◆喉的部分称为声门。 ◆喉部的声带是对发音影响很大的器官。声带振动产生声音。 ◆声带开启和闭合使气流形成一系列脉冲。

每开启和闭合一次的时间即振动周期称为基音周期,其倒数为基音频率,简称基频。基频决定了声音频率的高低,频率快则音调高,频率慢则音调低。 基音的范围约为70 -- 350Hz,与说话人的性别、年龄等情况有关。 人的说话过程可以分为五个阶段:(1)想说阶段(2)说出阶段(3)传送阶段(4)理解阶段(5)接收阶段。 人的说话的过程: 1)想说阶段:人的说话首先是客观事实在大脑中的反映,经大脑的决策产生了说话的动机; 接着说话神经中枢选择适当的单词、短语以及按照语法规则的组合,以表达想说的内容和情感。 2)说出阶段:由想说阶段大脑中枢的决策,以脉冲形式向发音器官发出指令,使得舌、唇、鄂、声带、肺等部分的肌肉协调地动作,发出声音。与此同时,大脑也发出一些指令给其他有关器官,使之产生各种动作来配合言语的效果,如表情、手势、身体姿态等。经常有些人说话时会手舞足蹈。另外,还会开动“反馈”系统来帮助修正语音。 3)传送阶段:说出的话语是一连串声波,凭借空气为媒介传送到听者的耳朵。有时遇到某种阻碍或其他声响的干扰,使声音产生损耗或失真。 4)接收阶段:从外耳收集的声波信息,经过中耳的放大作用,达到内耳。经过内耳基底膜的振动,激发器官内的神经元使之产生脉冲,将信息以脉冲形式传送给大脑。 5)理解阶段:听觉神经中枢收到脉冲信息后,经过一种至今尚未完全了解的方式,辨认说话人及听到的信息,从而听懂说话人的话。 再开始介绍语音信号的特性之前,我们先了解一下语音和语言的定义。 5、语言 是从人们的话语中概括总结出来的规律性的符号系统。包括构成语言的语素、词、短语和句子等不同层次的单位,以及词法、句法、文脉等语法和语义内容。语言学是语音信号处理的基础。例如,可以利用句法和语义信息减少语音识别中搜索匹配范围,提高正确识别率。 6、语音学 Phonetics是研究言语过程的一门科学。它考虑的是语音产生、语音感知等的过程以及语音中各个音的特征和分类问题。现代语音学发展成为三个分支:发音语音学、声学语音学以

常用视频信号接口与处理方法总结材料

常用视频信号接口与处理方法总结 学满2010-4-13 一、视频接口概述 视频接口,从颜色空间、数字/模拟、分离/复合(适用于模拟信号)、并行/串行(适用于数字信号)、单端/差分等类别可以分为如下几种,见下表:

二、模拟视频信号接口 1.接口设计 模拟信号由于其电压围很小,如果接口电路设计不当,很可能造成最终的信号质量下降。因此需要注意以下几个事项: 1)阻抗匹配:通常为75Ω,包括发送端,接收端以及传输路径上的阻抗。 2)隔直电容:为了防止不同设备间地电压差对信号造成的影响,此电容不宜过大或者过小。 3)滤波网络:尽可能地消除低频和高频纹波。 4)地平面:根据理论,地平面分隔可以防止数字信号对模拟地干扰,但从实际经验来看,分隔成小的地平面后,实际上会造成环流(AD9883资料中有叙述)。因此大部分情况下,还是用同一 个地。多层地平面,以及多打过孔,保持地电平的稳定是非常必要的。 5)PCB走线:等长是需要的,而且要确保三个器件经过不同的选择器/缓冲器之后的延时也相差不多,否则很难保证采样相位。 6)ESD保护:如果视频接口经常插拔,就需要加ESD保护二极管。 2.视频ADC 完成模拟信号到数字信号的转换,在使用过程中需要注意的主要问题有: 1)A/D是否支持交流耦合方式输入

2)A/D部是否有信号增益调整功能 3)是否支持差分输入 4)A/D部是否有PLL等器件,采样相位是否可调整 5)A/D输出的信号格式(24bit RGB,YCbCr) 6)是否支持SOG或者SOY等同步信号输入 模拟信号在A/D转换时,通常需要进行一些调整,以达到最佳显示效果: 1)调整黑电平位置和最大辐值,通常可以配置A/D芯片有关offset和gain的寄存器,经过此番调整之后,实际上是校准了RGB三色,同时提高了灰度等级。 2)调整PLL锁相环,以达到合适的采样频率,并保证PLL在各种温度条件下均能稳定工作。 3)调整采样起始点和终止点,确保有效信号不丢失。 4)调整采样相位,使最终显示画质更清晰。 3.视频DAC 完成模拟信号到数字信号的转换,在使用过程中需要注意的主要问题有: 1)D/A输出时,驱动方式是电压型的,还是电流型的?带负载与不带负载的电压是多少?是否合乎规要求。如果不合适,必要时加缓冲器或者放大器输出。 2)D/A的输入接口是多少位的?如果是8bit/10bit兼容,要注意最高2位和最低2位的接法。 3)输出同步信号是什么格式?是否需要输出CS或者SOG? 4.解码器 这里说的解码器是指针对CVBS(PAL、NTSC)或者Y/C信号的亮度色度解调和分离用的解码器,解码器输出的通常为BT656或者BT601格式的数字信号,此信号仍为隔行信号。 解码器使用中,接口部分设计与ADC相类似,对输入信号格式,输出信号格式的寄存器配置有一些差异,如果输入格式设置不当,虽然能输出信号,但显示不正确。 5.编码器 视频编码器特指从BT656/BT601格式转到CVBS/YC信号的转换器,一方面完成数字到模拟信号的转换,另一方面是完成亮度信号与色度信号的调制、复合。 解码器使用中,接口部分设计与DAC相类似,主要的不同也在于I2C寄存器配置不同。 6.缓冲器/放大器/选择器/分配器 模拟视频信号在传输和处理的过程中,通常需要一些缓冲/放大/选择/分配等处理。 在这些电路设计时,着重需要考虑的问题:

经典matlab信号处理基础知识

常用函数 1 图形化信号处理工具,fdatool(滤波器设计),fvtool(图形化滤波器参数查看)sptool (信号处理),fvtool(b,a),wintool窗函数设计.或者使用工具箱filter design设计。 当使用离散的福利叶变换方法分析频域中的信号时,傅里叶变换时可能引起漏谱,因此需要采用平滑窗, 2数字滤波器和采样频率的关系。 如果一个数字滤波器的采样率为FS,那么这个滤波器的分析带宽为Fs/2。也就是说这个滤波器只可以分析[0,Fs/2]的信号.举个例字: 有两个信号,S1频率为20KHz,S2频率为40KHz,要通过数字方法滤除S2。 你的滤波器的采样率至少要为Fs=80HKz,否则就分析不到S2了,更不可能将它滤掉了!(当然根据采样定理,你的采样率F0也必须大于80HK,,Fs和F0之间没关系不大,可以任取,只要满足上述关系就行。) 3两组数据的相关性分析r=corrcoef(x,y) 4 expm 求矩阵的整体的exp 4离散快速傅里叶fft信号处理中,傅里叶变换的典型用途是将信号分解成幅值分量和频率分量)。Ft为连续傅里叶变换。反傅里叶ifft 5 ztrans(),Z变换是把离散的数字信号从时域转为频率 6 laplace()拉普拉斯变换是把连续的的信号从时域转为频域 7 sound(x)会在音响里产生x所对应的声音 8 norm求范数,det行列式,rank求秩 9 模拟频率,数字频率,模拟角频率关系 模拟频率f:每秒经历多少个周期,单位Hz,即1/s; 模拟角频率Ω是指每秒经历多少弧度,单位rad/s; 数字频率w:每个采样点间隔之间的弧度,单位rad。 Ω=2pi*f; w = Ω*T 10 RMS求法 Rms = sqrt(sum(P.^2))或者norm(x)/sqrt(length(x)var方差的开方是std标准差,RMS应该是norm(x)/sqrt(length(x))吧. 求矩阵的RMS:std(A(:)) 11ftshift 作用:将零频点移到频谱的中间 12 filtfilt零相位滤波, 采用两次滤波消除系统的非线性相位, y = filtfilt(b,a,x);注意x的长度必须是滤波器阶数的3倍以上,滤波器的阶数由max(length(b)-1,length(a)-1)确定。

声音信号的获取与处理

声音信号的获取与处理 一、实验目的和要求 本实验通过麦克风录制一段语音信号作为解说词并保存,通过线性输入录制一段音乐信号作为背景音乐并保存。为录制的解说词配背景音乐并作相应处理,制作出一段完整的带背景音乐的解说词。 二、实验内容和步骤 1、软件与硬件的准备 目前,多媒体计算机中的音频处理工作主要借助声卡,从对声音信息的采集、编辑加工,直到声音媒体文件的回放这一整个过程都离不开声卡。声卡在计算机系统中的主要作用是声音文件的处理、音调的控制、语音处理和提供MIDI接口功能等。 进行录制音频信号所需的硬件除了声卡,还有麦克风、音箱以及外界的音源信号设备(如CD唱机、录音机等),把麦克风、音箱、外界音源信号设备与声卡正确连接完成硬件准备工作。在Windows的【控制面板】/【多媒体】中选择正确的录音和回放设备,并对其进行调试。 2、用Windows录音机录制解说词 使用Windows录音机录制任意一段语音信号作为解说词,录制完毕后把文件存为Wav 格式,文件名为【示例1_1】。 3、使用Cool Edit录制背景音乐 使用Cool Edit 2000录制任意一段语音信号作为背景音乐,要求录制的声音文件 采样频率为44100Hz,立体声,量化位数为16位,保存文件的为Wav格式,文件名【示例1_2】。

4、使用WaveStuido编辑和处理背景音乐 使用WaveStuido对【示例1_2】先进行回声处理,【幅度】值为100%,【回声延迟】为300毫秒。然后进行【淡入】和【淡出】处理,【幅度】值各为50%。 5、使用Cool Edit进行混音处理 使用Cool Edit的【Mix paste】功能对【示例1_1】和【示例1_2】进行混音处理。把【示例1_2】加入【示例1_1】中去,编辑成为一个完整的带背景音乐的解说词,保存为【示 例1_3】

多媒体实验报告:声音的采集与处理

深圳大学实验报告 课程名称:多媒体技术及应用 实验项目名称:声音采集与处理 学院:传播学院 专业: 指导教师:王志强 报告人:刘立娜学号: 2012080286 班 级:4 实验报告提交时间: 2013.03.30 教务处制

一、实验目的与要求 1.通过实验加深对声音数字化的理解。 2.学会正确连接耳麦以及设置录音和放音的方法。 3.掌握声音录制方法并从网上下载音频文件。 4.掌握一种数字音频编辑软件的使用方法。 二、实验方法及步骤 1.实验方法:运用以前了解到的知识内容,在通过阅读书上的实验步骤进行操作。 2.实验步骤 ①Audition的启动与退出 ②录制音频、播放音频、导入音频 ③音频的剪辑 ④音频的特效 三、实验过程及内容 1.Audition的启动与退出 Audition是集声音录制、音频混合和编辑于一身的音频处理软件,它的主要功能包括录音、混音、音频编辑、效果处理、降噪、音频压缩与刻录音乐CD等,还可以与其它音频软件或视频软件协同合作。 Audition提供广泛的、灵活的工具箱,完全能够满足专业录音和专业视频用户的需求。利用Audition,可以录制多轨文件、编辑音频文件、创建原始音乐文件、混缩无限的音频轨道。 启动计算机进入Windows后,可以用鼠标单击任务栏中的“开始”在弹出的开始菜单中,将鼠标指针移到“所有程序—Adobe Audition3.0”菜单命令上,单击即可启动。或把 Audition快捷方式一到桌面上来,单击即可。

图2.1Audition应用程序窗口 如果要退出Audition,可以选择“文件—退出”菜单命令,或按Ctrl+Q组合键,也可以直接单击Audition应用程序窗口右上角的“关闭”在退出之前,如果有已修改的但未存盘的文件,系统会提示保存它。或者点击左上角的“文件—保存”。 图2.2保存提示图2.3 “另存为“对话框 2.录音、播放音频、导入音频 1)录音的操作过程:(单轨录音) 1.选择“文件—新建”菜单命令,这时会出现“新建波形”会话框,如图 2.4所示。选择适当的采样频率、采样分辨率和声道数,如选取44100Hz,16-bit和立体声就可以到达CD 音频效果。 图2.4“新建波形”对话框 2.单击“传送器”控制面板中的红色“录音”按钮,开始录音。对准话筒进行录音,完成后单击“传送器”控制面板的“停止”按钮即可。我们还可以通过控制时间长短来录音,在编辑视图中,选择“选项”菜单中的“时间录音模式”命令。在“传送器”控制面板中单击“录音”这时会出现“定时录音模式”对话框,如图2.5所示。在该对话框中,可以设置录制的时间长短和开始录音。设置完毕,单击“确定”开始按设置进行录音。 图2.5“定时录音模式”对话框

振动信号的采集与预处理

振动信号的采集与预处理 几乎所有的物理现象都可看作是信号,但这里我们特指动态振动信号。 振动信号采集与一般性模拟信号采集虽有共同之处,但存在的差异更多,因此,在采集振动信号时应注意以下几点: 1. 振动信号采集模式取决于机组当时的工作状态,如稳态、瞬态等; 2. 变转速运行设备的振动信号采集在有条件时应采取同步整周期采集; 3. 所有工作状态下振动信号采集均应符合采样定理。 对信号预处理具有特定要求是振动信号本身的特性所致。信号预处理的功能在一定程度上说是影响后续信号分析的重要因素。预处理方法的选择也要注意以下条件: 1. 在涉及相位计算或显示时尽量不采用抗混滤波; 2. 在计算频谱时采用低通抗混滤波; 3. 在处理瞬态过程中1X矢量、2X矢量的快速处理时采用矢量滤波。 上述第3条是保障瞬态过程符合采样定理的基本条件。在瞬态振动信号采集时,机组转速变化率较高,若依靠采集动态信号(一般需要若干周期)通过后处理获得1X和2X矢量数据,除了效率低下以外,计算机(服务器)资源利用率也不高,且无法做到高分辨分析数据。机组瞬态特征(以波德图、极坐标图和三维频谱图等型式表示)是固有的,当组成这些图谱的数据间隔过大(分辨率过低)时,除许多微小的变化无法表达出来,也会得出误差很大的分析结论,影响故障诊断的准确度。一般来说,三维频谱图要求数据的组数(△rpm分辨率)较少,太多了反而影响对图形的正确识别;但对前面两种分析图谱,则要求较高的分辨率。目前公认的方式是每采集10组静态数据采集1组动态数据,可很好地解决不同图谱对数据分辨率的要求差异。 影响振动信号采集精度的因素包括采集方式、采样频率、量化精度三个因素,采样方式不同,采集信号的精度不同,其中以同步整周期采集为最佳方式;采样频率受制于信号最高频率;量化精度取决于A/D转换的位数,一般采用12位,部分系统采用16位甚至24位。 振动信号的采样过程,严格来说应包含几个方面: 1. 信号适调 由于目前采用的数据采集系统是一种数字化系统,所采用的A/D芯片对信号输入量程有严格限制,为了保证信号转换具有较高的信噪比,信号进入A/D以前,均需进行信号适调。适调包括大信号的衰减处理和弱信号的放大处理,或者对一些直流信号进行偏置处理,使其满足A/D输入量程要求。 2. A/D转换

相关文档
最新文档