开题报告6基于子空间方法的语音增强处理

开题报告6基于子空间方法的语音增强处理
开题报告6基于子空间方法的语音增强处理

湖南工学院毕业设计(论文)开题报告

题目基于子空间方法的语音增强处理

学生姓名唐莉佳班级学号10401340214 专业通信工程

一、选题目的和意义:

人们在语音通信的过程中将会不可避免的受到周围噪声环境的干扰,由于这些干扰噪声的存在,接收者收到的语音已不是纯净的语音信号。为了尽可能的避免噪声的干扰,基于语音信号增强处理的研究非常重要。然而,由于干扰通常都是随机的,从带噪语音中提取完全纯净的语音几乎不可能。在这种情况下,语音增强的目的主要有两个:一是改进语音质量,消除背景噪声,使听者乐于接受,不感觉疲劳;二是提高语音可懂度,方便听者理解。这两个目的往往不能兼得,到目前为止还没有哪种语音增强系统可以同时很好地改善语音质量和可懂度这两个指标。目前有一些对低信噪比带噪语音进行语音增强的方法,可以显著的降低背景噪声,改进语音质量,但并不能提高语音的可懂度,甚至略有下降。这是因为在实际环境中,语音总会受到外界环境噪声的干扰,这些噪声包括从周围环境,传输媒介中引入的噪声,电器设备的噪声以及其他说话人的干扰等等。环境噪声会影响语音质量,严重的情况下语音将完全淹没到噪声中,无法分辨。语音质量的下降会使语音处理系统的性能急剧恶化。比如,语音识别系统在实验室环境中可取得相当好的效果,但在噪声环境中,尤其是在强噪声环境中使用时,系统的识别率将受到严重影响。低速语音编码同样会受到噪声的影响。由于语音生成模型是低速率语音编码的基础,当语音受到噪声干扰时,提取的模型参数将很不准确,重建的语音质量急剧恶化。此时,采用语音增强技术进行预处理,将有效的改善系统性能。

语音增强的主要目标是从带噪语音信号中提取原始纯净语言信号,衡量语音增强效果的方法分主观测试和客观测试两种。主观测试方法包括平均意见得分(MOS)判断韵字测试(DRT)和判断满意度测量(DAM)等。客观测试方法主要根据增强语音的时域波形或频域语谱,给出客观的数值度量。例如一种常用的方法是采用信噪比来度量,此时信噪比的定义是原始语音信号功率与归一化后的增强语音和原始语音之差的功率比。同时采用板仓距离来测试。

语音增强不但与语音信号数字处理理论有关,而且涉及到人的听觉感知和语音学。再者,噪声来源众多,随应用场合而异,它们的特性也各不相同。即使在实验室仿真条件下,也难以找到一种通用的语音增强算法能适用各种噪声环境。必须针对不同噪声环境,采用不同的语音增强对策。

二、国内外研究动态:

语音增强是在噪声环境下用以提高语音通信系统质量的一个重要技术。随着语音技术研究的深入和实际应用的增多,各种语音处理系统都面临着进一步提高性能的问题,语音增强是其中的关键技术之一,已有几十年的研究发展历史。其研究起与20世纪60年代,随着数字信号理论的成熟,在70年代曾形成一个理论高潮,取得了一些基础性成果,并使语音增强发展成为语音信号处理的一个重要分支。

1978年,Lim和Oppenheim提出了基于维纳滤波的语音增强方法。

1979年,Boll提出了谱相减方法来抑制噪声。

1980年,Maulay和Malpss提出了软判决噪声抑制方法。

1984年,Ephraim和Malah提出了基于MMSE短时幅度谱估计的语音增强方法。

1987年,Paliwal把卡尔曼滤波引入语音增强领域。

1995年.Ephraim提出了基于信号子空间分解的语音增强方法。

近年来,基于子空间的语音增强技术受到许多研究者的重视,该方法可减少信号的失真和人为噪声的引入。子空间技术将带噪语音信号看成向量空间的一部分,并将此向量空间划分成两个相互正交

的子空间:信号子空间和噪声子空间。去除噪声子空间的信号分量可以提高带噪信号的语音质量,进一步从信号子空间中估计出高质量的语音信号。

Ephraim and Van-Trees提出了一套有效的子空间语音增强系统,利用特征值分解(EVD)和卡维南-洛维(KLT)变换分解来进行信号空间的划分,并针对白噪声背景下的带噪语音,提出了有效的时域和频域的线性估计算法。

三、主要研究内容:

语音信号处理的大量实验表明,语音矢量的协方差矩阵有很多零特征值,这说明干净语音信号矢量的能量分布在它对应空间的某个子集中。而语音信号处理中,噪声方差通常都假设已知,且严格正定。噪声矢量存在于整个带噪信号张成的空间中。因此带噪语音信号的矢量空间可以认为由一个信号加噪声的子空间和一个纯噪声的子空间构成。可以利用信号子空间处理技术,消除纯噪声子空间,并对语音信号进行估计,实现语音增强。

具体方法如下:

(1)对带噪语音信号的协方差矩阵做特征值分解,将其投影到两个正交子空间,即信号子空间和噪声子空间。

(2)利用噪声和语音的不相关性,对分解的子空间进行处理,尽可能恢复出原始语音信号,以实现语音增强。

本文采用时域约束估计器(TDC)和频域约束估计器(SDC)两种方法来对噪声能量进行约束,可以使语音失真最小化。

四、实验设计方案:

通过在网上查阅基于子空间语音增强处理的相关资料,使用MATLAB软件编写程序,对时域约束估计器(TDC)和频域约束估计器(SDC)两种方法进行仿真实验。

子空间语音增强原理图如图1所示:

带噪语音KL

估计

噪声

特征

带噪语

音特征

值减去

噪声特

征值

时域(频

域)约束

估计器

KL

纯净语音图1 子空间语音增强原理图

时域约束估计器(TDC)和频域约束估计器(SDC)增强方法具体步骤如下:

(1)将语音进行KL变换,得到子空间域中的带噪语音的特征向量U和特征值

Y

Λ。

(2)估计噪声特征值

N

Λ,一般取带噪语音前3000点求其方差的平均值作为噪声的特征值估计值N

Λ。

(3)带噪语音特征值Y Λ减去噪声特征值N Λ,得纯净语音特征值s Λ,由

(

)

1

2

-+ΛΛ=I

G N S S μσ (1)

得到时域约束估计器(TDC )增益G ,由

2min S H

ε (2)

可以得到频域约束估计器 (SDC)增益G 。

(4)由KL 逆变换可得最优估计器opt H 。由Y H S opt

?=?可得纯净语音的估计S ?。 (5)对不同信噪比(SNR )的带噪语音,分别用以上两种语音增强算法对其进行处理,然后将得

到的仿真波形图进行对比。

(6)分析时域约束估计器(TDC)的子空间语音增强处理和频域约束估计器(SDC)的子空间语音增强处理这两种方法的优缺点。

五、论文进度安排:

1. 课题选择及调研。(第2~3周)

2. 写开题报告。(第4周)

3. 查阅有关子空间语音增强的资料(第5周)

4. 学习研究MATLAB 语音信号处理工具箱,包括子空间基本原理、语音增强处理基本原理。(第6周)

5. 加强对子空间语音增强算法的基本原理的理解,理解特征值分解法实现子空间分解的步骤。(第7周)

6. 熟练掌握MATLAB 软件编程方法及技巧。(第8周)

7. 用MATLAB 语言编程并调试基于子空间语音增强处理程序,实现语音增强处理预期功能。(9~11周)

8. 对仿真后子空间语音增强算法波形图进行分析比较。(第12周) 9. 整理毕业论文,准备答辩(第13~14周) 10. 毕业答辩。(第15周)

六、参考文献:

[1] J. S. Lim, A. V Oppenheim. Enhancement and Bandwidth Compression of Noisy Speech[J]. Proc. of the

IEEE, V ol. 67, no. 12, pp. 1586-1604, Dec.1978.

[2] S. F. Boll. Suppression of acoustic noise in speech using spectral subtraction[J]. IEEE Trans. Acoust,

Speech and Signal Processing, V ol. ASSP-27, pp. 113-120, Dec.1979.

[3] R. J. Mcaulay, M. L. Malpass. Speech enhancement using a soft-decision noise suppression filter[J].

IEEE Trans. Acoust, Speech, Signal Processing, Vol. ASSP-28, no. 2, pp. 137-145, Dec.1980.

[4] Y. Ephraim, D. Malah. Speech enhancement using a minimum mean-square error short-time spectral

amplitude estimator[J]. IEEE Trans. Acoust, Speech, Signal Process, V ol. ASSP-32, no. 6, pp. 1109-1121, Dec. 1984.

[5] K. K. Paliwal, A. Basu. A speech enhancement based on Kalman filtering[J]. Proc. ICASSP, pp. 177-180,

Dec. 1987.

[6] Y . Ephraim, H. L. Van Trees. A signal subspace approach for speech enhancement[J].IEEE Trans Speech

and Audio Processing ,V ol. 3,no. 4,pp. 251-266,Dec.1995.

[7] 张雪英, 贾海蓉, 靳晨升.子空间与维纳滤波相结合的方法[J]. 计算机工程与应用, 2011, 47(14):

146-148.

[8] 曹玉萍. 基于信号子空间的语音增强方法[J]. 电子测试, 2012, (6): 54-57.

[9] 金茜. 基于信号子空间的语音增强算法研究[D]. 吉林:吉林大学硕士学位论文, 2011.

[10] 张雪英. 数字语音处理及MATLAB仿真[M]. 北京:电子工业出版社, 2010.

[11] 吴周桥, 谈新权. 基于子空间方法的语音增强算法研究[J]. 声学与电子工程, 2005.

指导

教师

批阅

意见

指导教师(签名):年月日注:可另附A4纸

基于dsp的语音信号采集与回放系统的设计--开题报告

HEFEI UNIVERSITY 课程设计开题报告 题目:《基于DSP系统的语音采集与回放系统》 专业:11 级电子信息工程 姓名:章健吴广岭何志刚 学号:1105011029 1105011030 1105011044 指导老师:汪济洲老师 完成时间:2014年12月1日

一、开题报告题目 基于DSP系统的语音采集与回放系统。 二、研究背景与意义 语音处理是数字信号处理最活跃的研究方向之一,它是信息高速公路、多媒体技术、办公自动化、现代通信及职能系统等新兴领域应用的核心技术之一。用数字化的方法进行语音的传送、存储、分析、识别、合成、增强等是整个数字化通信网中的最重要、最基本的组成部分之一。一个完备的语音信号处理系统不但要具有语音信号的采集和回放功能, 还要能够进行复杂的语音信号分析和处理。通常这些信号处理算法的运算量很大, 而且又要满足实时的快速高效处理要求, 随着DSP 技术的发展, 以DSP 为内核的 设备越来越多。为语音信号的处理提供了优质可靠的平台. 软件编程的灵活性给很多设备增加不同的功能提供了方便, 利用软件在已有的硬件平台上实现不同的功能已成为 一种趋势。近年来,随着DSP的功能日益增强,性能价格比不断上升,开发手段不断改进,DSP在数据采集系统的应用也在不断完善。 三、主要内容与目标 随着计算机多媒体技术,网络通信技术和DSP(Digital Signal Processor)技术的飞速发展,语音的数字通信得到越来越多的应用,语音信号的数字化一直是通信发展的主要方向之一,语音的数字通信和模拟通信相比,无疑有着更大的优越性,这主要体现在以下几个方面:数字语音比模拟语音具有更好的话音质量;具有更强的干扰性,并易于加密;可节省带宽,能更有效的利用网络资源;更加易于存储和处理。最简单的数字化就是直接对原始语音信号进行A/D 转换,但这样得到的语音的数据量非常大。为了减少语音信号所占用的带宽或存储空间,就必须对数字语音信号进行压缩编码。语音编码的目的就在于在保证语音音质和可懂度的条件下,采用尽可能少的比特数来表示语音,即尽可能的降低编码比特率,以便在有限的传输带宽内让出更多的信道来传输图像和其他数据流,从而达到传输资源的有效利用和网络容量的提高。在通信越来越发达的当今世界,尤其最近几十年,语音压缩编码技术在移动通信、IP 电话通信、保密通信、卫星通信以及语音存储等很多方面得到了广泛的应用。 语音信号处理在手持设备、移动设备和无线个人设备中的应用正在不断增加。今天的个人手持设备语音大多时候仅仅局限于语音拨号,但是已经出现了适用于更广泛开发语音识别和文本到语音应用的技术。语音功能为用户提供自然的输入和输出方式,它比其他形式的I/O更安全,尤其是当用户在开车期间。在大多数应用中,语音都是键盘和显示器的理想补充。其他潜在的语音应用包括如下几个方面。 (1)语音电子邮件。包括浏览邮箱、利用语音输入写电子邮件以及收听电子邮件的读出。 (2)信息检索。股票价格、标题新闻、航班信息、天气预报等都可以通过语音从互联网收听。例如,用户不用先进入某个网址并输入股票名字或者浏览预定义列表,可以通过语音命令实现。 (3)个人信息管理。允许用户通过语音指定预约、查看日历、添加联络信息等等。 (4)语音浏览。利用语音程序菜单,用户可以在网上冲浪、添加语音收藏夹并收听网页内容的读出。 (5)语音导航。在自动和人眼不够用的条件下获取导航的完全语音输入/输出驾驶

语音信号处理实验报告

语音信号处理实验 班级: 学号: 姓名:

实验一 基于MATLAB 的语音信号时域特征分析(2学时) 1) 短时能量 (1)加矩形窗 a=wavread('mike.wav'); a=a(:,1); subplot(6,1,1),plot(a); N=32; for i=2:6 h=linspace(1,1,2.^(i-2)*N);%形成一个矩形窗,长度为2.^(i-2)*N En=conv(h,a.*a);% 求短时能量函数En subplot(6,1,i),plot(En); if (i==2) ,legend('N=32'); elseif (i==3), legend('N=64'); elseif (i==4) ,legend('N=128'); elseif (i==5) ,legend('N=256'); elseif (i==6) ,legend('N=512'); end end 00.51 1.52 2.5 3 x 10 4 -1 100.5 1 1.5 2 2.5 3x 10 4 024 N=3200.5 1 1.5 2 2.5 3x 10 4 05 N=6400.5 1 1.5 2 2.5 3x 10 4 0510 N=12800.5 1 1.5 2 2.5 3x 10 4 01020 N=2560 0.5 1 1.5 2 2.5 3x 10 4 02040 N=512 (2)加汉明窗 a=wavread('mike.wav'); a=a(:,1); subplot(6,1,1),plot(a); N=32;

for i=2:6 h=hanning(2.^(i-2)*N);%形成一个汉明窗,长度为2.^(i-2)*N En=conv(h,a.*a);% 求短时能量函数En subplot(6,1,i),plot(En); if (i==2), legend('N=32'); elseif (i==3), legend('N=64'); elseif (i==4) ,legend('N=128'); elseif (i==5) ,legend('N=256'); elseif (i==6) ,legend('N=512'); end end 00.51 1.52 2.5 3 x 10 4 -1 100.5 1 1.5 2 2.5 3x 10 4 012 N=3200.5 1 1.5 2 2.5 3x 10 4 024 N=6400.5 1 1.5 2 2.5 3x 10 4 024 N=12800.5 1 1.5 2 2.5 3x 10 4 0510 N=2560 0.5 1 1.5 2 2.5 3x 10 4 01020 N=512 2) 短时平均过零率 a=wavread('mike.wav'); a=a(:,1); n=length(a); N=320; subplot(3,1,1),plot(a); h=linspace(1,1,N); En=conv(h,a.*a); %求卷积得其短时能量函数En subplot(3,1,2),plot(En); for i=1:n-1 if a(i)>=0 b(i)= 1;

(完整版)基于单片机的语音控制开关设计毕业设计

题目基于单片机的语音控制开关设计所在学院物理与电信工程学院专业班级通信工程专业 1102 班指导教师郑争兵 完成地点物理与电信工程学院实验室 2015年 6月03日

毕业论文﹙设计﹚任务书 院(系) 物理与电信工程学院专业班级通信1102 学生姓名朱楠 一、毕业论文﹙设计﹚题目基于单片机的语音控制开关设计 二、毕业论文﹙设计﹚工作自_2015 _年_ 1__月_10_日起至_2015__年 6 月_ 10 日止 三、毕业论文﹙设计﹚进行地点: 物理与电信工程学院实验室 四、毕业论文﹙设计﹚的内容要求: 智能家居作为一个新生产业,目前处于一个导入期与成长期的临界点,随着智能家居市场推广普及的进一步落实,培育起消费者的使用习惯,智能家居市场的消费潜力必然是巨大的,产业前景光明。本课题设计语音智能控制开关,具体要求如下: 1. 掌握语音识别的工作原理,使用语音识别芯片完成硬件设计; 2.能实现语音控制开关的开启和关闭; 3. 系统集成,焊接电路板,调试。 成果形式:实验样机一套。 毕业设计进度安排: 1.10─3.20:查阅资料(参考文献不少于10篇),进行方案论证,完成开题报告。完成不少于3000字的外文翻译; 3.20─ 4.30:设计硬件电路,编写相关软件、完成电路仿真及样机调试; 5.1─5.20:完善系统调试,撰写论文,准备毕业设计验收等工作; 5.21- 6.10:整理资料,修改论文,准备毕业答辩。

指导教师系(教研室)通信教研室 系(教研室)主任签名批准日期 接受论文(设计)任务开始执行日期学生签名

基于单片机的语音智能开关设计 朱楠 (陕西理工学院物理与电信工程学院通信1102班,陕西汉中 723003) 指导教师:郑争兵 [摘要]语音识别是解决机器“听懂”人类语言的一项技术。随着语音识别理论研究的深入和数字信号处理软、硬件技术的发展,语音识别技术应用的研究越来越受到人们的关注。智能语音家电控制系统实质上就是一个替代传统手动开关的受声控制的电子开关。此系统以STC11L08XE和LD3320语音芯片为硬件核心,对语音芯片LD3320的信息进行处理,并对开关进行控制,通过LD3320外界的麦克风采集声音信号,再通过LD3320语音芯片进行频谱分析,在提取语音特征,之后和关键词语列表中的关键词进行对比匹配,最后找出得分最高的关键词作为识别结果输出给单片机,单片机进行处理后,再输出信号来控制继电器,再通过继电器来控制开关工作,开关又可实现对电器的控制。语音芯片的功能都是通过单片机控制实现的。最终实现对智能语音开关的控制 [关键词] STC11L08XE单片机语音芯片LD3320 语音识别 Design of intelligent voice switch based on MCU Zhu nan (Grade11,Class2,Major of Communication Engineering,School of Physics and Tutor:Zheng Zheng bing Abstract: Speech recognition is a technology to solve the machine to understand human language. Along with the research of speech recognition theory and the development of digital signal processing software and hardware technology, The research on the application of speech recognition technology is getting more and more attention.The intelligent speech appliance control system is essentially an electronic switch which replaces the traditional acoustic control with the manual switch. This system LD3320 voice chip and the stc11l08xe as hardware core and the voice chip ld3320 information for processing, and control the switch, through ld3320 external microphone audio signal acquisition, and then through the ld3320 voice chip spectrum analysis, key words in speech feature extraction, and the list of key words contrast matching, finally to find the highest score of the words as recognition results output to the MCU, MCU processing, then the output signal to control the relay, then through the relay to control of the switch, the switch can be to achieve control of the electric appliances. The function of the speech chip is realized by the MCU control. Control of the intelligent speech switch is realized finally. Key words : STC11L08XEMCU LD3320 voice chip Speech recognition

基于单片机的语音控制小车的开题报告_共4页

一、选题的依据、意义和理论或实际应用方面的价值 随着现代生活水平的不断提高,人们对智能化产品有着巨大的需求,语音智能控制作为简单快捷方便的操作方式得到越来越广泛人们的认可,例如手机智能语音拨号功能,就是很好的例子。随着电子业的发展, 自动化已不再是一 个新鲜的话题, 无人驾驶的小汽车也必将进入实用阶段, 未来驾驶汽车, 不再是只能依靠手动,语音等方式也有可能成为未来汽车的辅助驾驶途径之一。当前电子设计系统已进人了片上系统时代, 语音识别与处理技术在信息技术的人机 接口中得到了普遍关注。语音识别的音控小车作为典型应用之一,简单地诠释了人机一体化的设计思想。其设计理念缩短了人机界面的距离,增强了互动性和智能性,同时使得将信息技术和控制技术引入到车辆的操纵控制中,形成机器智能,使驾驶员的感知、决策和执行能力扩展成为可能。 二、本课题在国内外的研究现状 Bill Gates 在世界计算机博览会(COMDEX)主题演讲会上描绘IT事业的发展宏图时,率先指出:下一代操作系统和应用程序的用户界面将是语音识别。工业界应对语音识别领域的重大突破做好充分准备,因为那将是一场席卷全球的另一次热潮。 据统计部门的数据,至2006年中国汽车保有量已达3500万辆(其中轿车占80%,约2500万辆),每年仍以30%的速度递增。我国成为了继美国之后的第二大汽车生产和消费大国。汽车行业的迅猛发展也带动了相关配套、服务业的发展。而将功能强大的智能车载信息系统——车载电脑加载到汽车上已经成为欧美、日本等地汽车市场的首选新装备。我国语音智能控汽车产业有着巨大的发展前景。车载电脑给汽车带来了一场信息化的革命,让每辆汽车构建成一个完美的车载信息与娱乐系统终端,包括车载通讯系统、导航系统、数字娱乐系统以及辅助驾驶系统。车载通讯与导航系统主要指GPRS和GPS,让你“轻 车熟路”,而且轻松打电话。 三、课题研究的内容及拟采取的方法 我研究的课题题目是实现语音对小车的智能控制,按照其功能的实现可以划分如下模块:语音输入模块、主控模块(SPCE061A)、电机驱动模块、语 音输出模块、电源模块。语音输入模块实现语音的输入,讲录入的语音作为数据源。主控模块实现对语音的分辨、识别、与存储单元中的指令匹配,发出控制命令。电机模块通过主控模块的控制,对电机发出控制命令。语音输出模块控制发出控制命令相对应的语音。电源模块控制电源的连通。首先对存储器初始化,之后进行录音初始化,进入录音循环中,定时器中断程序控制采样频率,并按时间间隔将采样值送入语音样本队列,录音循环从语音样本队列中获取数据并进行编码,将编码后的数据送入存储器,成为语音资源。在训练过程中,系统调用了语音播放子程序,需要进行播放初始化,进入播放循环中,从语音资源中获取数据,解码,填入播放队列中,定时器中断程序从播放队列中取出数据送到D /A 转换器中,将语音信号送到扬声器中,使得整个训练过程在语音提示下从容进行。 四、课题研究中的主要难点以及解决的方法 1)如何实现对SPCE061A的无线语音接入? SPCE061A 内置MIC 放大电路和AGC 电路, 可很方便地接上MIC 使用。但考虑到小车在运动到距离用户较远的地方时, 无法接收到用户的语音命令, 而

公交车智能语音播报系统毕业设计

摘要 本文介绍了一种利用红外遥控技术,模拟公交车红外控制报站系统。采用单片机SCT89C52作为控制核心,语音芯片ISD1700实现语音的存储和回放,LCD12864进行汉字显示,设计了公交车控制报站系统,实现了公交车站台语音播报、液晶显示和站台语音播报与液晶显示双重功能。 系统主要通过STC89C52单片机做为主芯片,通过红外遥控器把信号传给STC89C52单片机,启动LCD12864显示站名,同时应用语音模块播报站名。整个系统硬件设计包括键盘控制模块、语音播报模块、液晶显示模块、红外控制模块。红外控制模块又分为红外接发送和红外接收模块。 关键词单片机;公交车报站;语音播站;液晶显示;红外遥控 Abstract This paper introduces a kind of using infrared remote control technology, the simulation bus stops infrared control system. Adopts singlechip SCT89C52 as control core and pronunciation chip ISD1700 realize voice of storage and playback, LCD12864 on Chinese character display, design the bus stops control system, realized the bus station speech broadcast, LCD display and platform speech broadcast and LCD double function. System mainly through STC89C52 microcontroller do give priority to, updatedand infrared signal to STC89C52 microcontroller, start LCD12864 display of the station, and pronunciation module broadcasts stops. The whole system hardware design including keyboard control module, speech broadcast module, LCD module, infrared control module. Infrared control module is divided again after sending and receiving infrared infrared module. Keywords Microcontroller Bus stops system Speech broadcast station LCD display Infrared remote control I

基于MATLAB的语音信号分析及处理开题报告

基于MATLAB的语音信号分析及处理开题报告毕业设计开题报告 设计题目基于MATLAB的语音信号分析及处理 学生姓名系、专业指导教师选题目的和意义: 语音处理是最早采用数字信号处理技术的领域之一,本世纪50年代提出的语音形成数字模型,被广泛应用于语音编码、语音合成、语音识别、语音增强、说话人确认、语音邮件和语音存储等。因此研究语音信号的数字处理技术,有很大的工程意义,而实现的工程软件是MATLAB。利用MATLAB设计滤波器,可以随时对比设计要求和滤波器特性调整参数,直观简便,极大的减轻了工作量,有利于滤波器设计的最优化。利用MATLAB作为编程工具进行计算机实现,从而加深对所学知识的理解,建立概念。 本课题在国内外的研究状况及发展趋势: 数字处理技术已经成熟,正在获得广泛应用。目前在数字领域和通信领域正在发生一场数字化革命。DSP在其中扮演很重要的角色,它为新体制新算法和新原理提供了最佳的实现条件。 主要研究内容: MATLAB是主要适用于矩阵运算和信息处理领域的分析设计,它使用方便,输入简捷,运算高效,内容丰富,并且很容易由用户自行扩展.MATLAB当前已成为美国和其他发达国家在大学教学和教学研究中最常用而必不可少的工具.传统的数字滤波器的设计过程复杂,计算工作量大,滤波特性调整困难,影响了它的应用。本文介绍了利用MATLAB快速有效的设计由软件组成的常规数字滤波器的设计方法,综合运用数字信号处理的理论知识进行频谱分析和滤波器设计,通过理论推导得到相应结论,给出了使用MATLAB语言进行程序设计并进行界面设计的详细步骤。

实验设计: 录制一段自己的语音信号,并对录制的信号进行采样;画出采样后语音信号的时域波形和频谱图;给定滤波器的性能指标,采用窗函数法或双线性变换设计滤波器,并画出滤波器的频率响应;然后用自己设计的滤波器对采集的语音信号进行滤波,画出滤波后信号的时域波形和频谱,并对滤波前后的信号进行对比,分析信号的变化;回放语音信号;最后,用 MATLAB 设计一个信号处理系统界面。 完成设计的条件、方法及措施: 声音的导入、采样和频谱分析 采集语音信号利用计算机Windows下的录音机设备,可以采集语音信号并采样,得出数据文件'12.wav'保存在MATLAB的work路径下,在M文件中键入: “x1=wavread('I:\work\12.wav ');”读取语音信号的数据,赋给变量x1。并且播出声音,键入“sound(x1,22050);”。对声音型号进行采样和频谱分析:对信号做1024点FFT变换;然后在对型号做出时域波形图、FFT频谱图。 滤波器的选择和分析 数字滤波器是一种用来过滤时间离散信号的数字系统,通过对抽样数据进行数学处理来达到频域滤波的目的。根据其单位冲激响应函数的时域特性可分为两类:无限冲激响应(IIR)滤波器和有限冲激响应(FIR)滤波器。与FIR滤波器相比,IIR 的实现是非递归的。所以这次设计在MATLAB中设计的就是IIR数字滤波器。因此这次设计采用一个BUTTERWORTH的低通滤波器,并且我们采取双线性变换法来实现。 估算巴特沃思滤波器的阶数N和3dB截止频率Wn。输入参数是通带截止频率Wp,阻带截止频率Ws,通带波纹Rp,阻带波纹Rs。 回放语音信号

基本语音增强方法

基本语音增强方法概述 摘要:语音增强是当今语音处理的一个非常重要的领域,本文主要介绍当今比较普遍的几种基于人耳掩蔽阈值的语音增强方法:谱减法,维纳滤波法,子空间方法等,并对它们的优缺点作简要论述。 关键词:语音增强、人耳掩蔽、谱减法、维纳滤波、子空间 现今时代的主流步伐将我们带向自动化方向,语音识别在这一背景下显得尤为重要。目前已经开发出好几款语音识别软件,但是如何较为精确地实现人耳的掩蔽效应下的语音增强,仍是大家着重解决的问题。它的首要目标就是在接收端尽可能从带噪语音信号中提取纯净的语音信号,改善其质量。目前已经出现了谱减法等一系列较为普遍的方法。本文将对这几种方法进行简要介绍。 一、语音的特性 语音信号是一种非平稳、时变的随机过程,其产生过程与发声器官的运动紧密相关。而发声器官的状态变化速度比声音振动的速度要缓慢得多,因此语音信号可以认为是短时平稳的。在一段短时间内其特性基本保持不变即相对稳定,从而可以应用平稳随机过程的分析方法来处理语音信号,并可以在语音增强中利用短时频谱的平稳特性。 人耳在嘈杂的环境中,仍然能够清晰地听到自己想听的内容,一个较弱的声音(被掩蔽音)的听觉感受被另一个较强的声音(掩蔽音)影响的现象称为人耳的“掩蔽效应”。被掩蔽音单独存在时的听阈分贝值,或者说在安静环境中能被人耳听到的纯音的最小值称为绝对闻阈。在进行机器语音识别的时候,由于干扰信号和目标信号的强度差别不大,导致机器无法识别。这时语音增强就显得特别重要了。 二、时域方法 此类方法主要依赖于语音生成模型(例如AR模型)的使用,需要提取模型参数(如基音周期、LPC系数等),经常使用迭代方法。这种方法的最大缺点就是如果实际噪声或语音与模型有较大的差别,或者由于某些原因使得提取语音参数较困难,则这方法较容易失败。这类方法常用到一些滤波器,如梳状滤波器、维纳滤波器、卡尔曼滤波器等。 (1)经典的维纳滤波法是根据Winer-Hopf 积分方程求出纯语音和混合音

语音信号处理实验报告

通信与信息工程学院 信息处理综合实验报告 班级:电子信息工程1502班 指导教师: 设计时间:2018/10/22-2018/11/23 评语: 通信与信息工程学院 二〇一八年 实验题目:语音信号分析与处理 一、实验内容 1. 设计内容 利用MATLAB对采集的原始语音信号及加入人为干扰后的信号进行频谱分析,使用窗函数法设计滤波器滤除噪声、并恢复信号。 2.设计任务与要求 1. 基本部分

(1)录制语音信号并对其进行采样;画出采样后语音信号的时域波形和频谱图。 (2)对所录制的语音信号加入干扰噪声,并对加入噪声的信号进行频谱分析;画出加噪后信号的时域波形和频谱图。 (3)分别利用矩形窗、三角形窗、Hanning窗、Hamming窗及Blackman 窗几种函数设计数字滤波器滤除噪声,并画出各种函数所设计的滤波器的频率响应。 (4)画出使用几种滤波器滤波后信号时域波形和频谱,对滤波前后的信号、几种滤波器滤波后的信号进行对比,分析信号处理前后及使用不同滤波器的变化;回放语音信号。 2. 提高部分 (5)录制一段音乐信号并对其进行采样;画出采样后语音信号的时域波形和频谱图。 (6)利用MATLAB产生一个不同于以上频段的信号;画出信号频谱图。 (7)将上述两段信号叠加,并加入干扰噪声,尝试多次逐渐加大噪声功率,对加入噪声的信号进行频谱分析;画出加噪后信号的时域波形和频谱图。 (8)选用一种合适的窗函数设计数字滤波器,画出滤波后音乐信号时域波形和频谱,对滤波前后的信号进行对比,回放音乐信号。 二、实验原理 1.设计原理分析 本设计主要是对语音信号的时频进行分析,并对语音信号加噪后设计滤波器对其进行滤波处理,对语音信号加噪声前后的频谱进行比较分析,对合成语音信号滤波前后进行频谱的分析比较。 首先用PC机WINDOWS下的录音机录制一段语音信号,并保存入MATLAB软件的根目录下,再运行MATLAB仿真软件把录制好的语音信号用audioread函数加载入MATLAB仿真软件的工作环境中,输入命令对语音信号进行时域,频谱变换。 对该段合成的语音信号,分别用矩形窗、三角形窗、Hanning窗、Hamming窗及Blackman窗几种函数在MATLAB中设计滤波器对其进行滤波处理,滤波后用命令可以绘制出其频谱图,回放语音信号。对原始语音信号、合成的语音信号和经过滤波器处理的语音信号进行频谱的比较分析。 2.语音信号的时域频域分析 在Matlab软件平台下可以利用函数audioread对语音信号进行采样,得到了声音数据变量y,同时把y的采样频率Fs=44100Hz放进了MATALB的工作空间。

基于51单片机公交车自动报站系统的设计,开题报告,贾彦坤

毕业设计(论文)开题报告 设计(论文)题目: 基于51单片机的电子 报站系统设计 院系名称: 电气与信息工程学院 专业班级: 自动化08-1班 学生姓名: 贾彦坤 导师姓名: 谢忠玉 开题时间: 2012年3月28日

1. 课题研究的目的和意义 目的:现今社会,公交事业关乎到大多数城市居民的出行,但公交车上的传统的人工按键报站依然无法满足大家对其的要求。主要表现为:(1)报站不准确,由于司机在操作报站系统时经常会按错键或忘记按键,而且在调整系统时会连续报出几个站点,让不熟悉路线站点的乘客不知所措;(2)安全隐患,每次报站时都需要由驾驶员对报站器进行操作,而在车辆起动与进站时,往往是路面情况最复杂的时候,驾驶员既要对行驶中的汽车进行起动或制动等操作,同时还要兼顾报站系统的操作,给行驶中的车辆带来一定的安全隐患。 公交车自动报站器的设计主要是为了弥补传统人工语音报站的落后方式,使进站、出站及服务用语的信息实现自动播报,为市民提供更人性化,更完善的服务,以减少各种可能产生不必要的交通流量,提高公交的运作效率[1]。 意义:我国相当数量的中小城市的机动车保有量已经达到几乎饱和的程度,大力发展城市公共交通已经成为城市管理者解决城市拥堵的主要措施。给乘坐公交车出行的人们提供舒适便捷已经成为公交系统的主要任务,作为一个城市的公交企业,它既要代表政府体现当地城市的形象,又要尽一切力量减少政府投资,创造良好的社会效益和经济效益。而传统的公交运营系统的装备和管理模式较难达到这两者的完美结合。随着科学技术的发展,公交应用系统带给公交企业的将不仅是形象的提升,也是效益的增长。虽然现在已经有些车上已经采用GPS定位系统自动报站,但其昂贵的成本,难以实现普及。为了实现城市公交车的自动报站,设计了一套低廉、高性能的城市公交车自动报站系统系统具有一定的现实意义。而对我么应届毕业生而言,通过设计可以使我们初步掌握单片机的工作原理和使用方法。 2. 文献综述 早在2004年3月国家建设部就发布《关于优先发展城市公共交通的意见》,要求把公交交通专用道路系统建设作为近期建设重点,通过设置并划定公共交通专用道路、优先单向、逆向专用线路等措施,保证公共交通车辆对道路的专用或优先使用权。2008年政府出台大规模的扩建和完善国内基础交通设施政策。势必给城市公交优先项目的发展带来一定机遇。 随着城市化进程的加快,公共交通作为城市的基础设施之一,仍然是绝大多数出行者的首选交通方式。为使得人们特别是为外来旅游、出差、就医、求职等急需了解本地的公交路线的人提供高效、方便、快捷的公交系统,让他们得到自己所需要的各种相关信息,在计算机还未普及之前,公交车报站管理都是由工作

一种改进的子空间语音增强算法精品

【关键字】设计、英语、情况、方法、空间、传统、问题、系统、有效、整体、发展、提出、研究、关键、准则、思想、工程、项目、重点、作用、设置、增强、分析、严格、改善、方向、适应、实现、提高、改进、新方法、有效性 一种改进的子空间语音增强算法-电气论文 一种改进的子空间语音增强算法 任永梅1,2 (1.湖南工学院电气与信息工程学院,湖南衡阳421002; 2.湖南工学院信号与信息处理重点实验室,湖南衡阳421002) 【摘要】为了进一步减少传统子空间语音增强方法增强的语音中的残留噪声,提出一种改进的子空间语音增强算法。新算法首先对带噪语音进行KL(Karhunen-Loeve Transform)变换,得到带噪语音的特征值;接着用递归最小二乘算法(RLS)估计出噪声特征值,对传统子空间算法容易引起的特征值估计偏差问题进行修正;最后用带噪语音特征值减去RLS方法估计出的噪声特征值并由KL逆变换还原出纯净语音。仿真结果表明,在高斯白噪声背景下,与传统子空间语音增强算法相比,新算法提高了增强语音的信噪比,减少了语音失真。 关键词语音增强;子空间;递归最小二乘算法;SNR New Improved Subspace Method of Speech Enhancement REN Yong-mei1,2 (1.School of Electrical and Information Engineering, Hunan Institute of Technology, Hengyang Hunan 421002, China; 2.Key Laboratory of Signal Information Processing, Hunan Institute of Technology, Hengyang Hunan 421002, China) 【Abstract】In order to reduce the residual noise in enhanced speech that by using the traditional subspace speech enhancement method,this

《语音信号处理》实验报告材料

实用 中南大学 信息科学与工程学院 语音信号处理 实验报告 指导老师:覃爱娜 学生班级:信息0704 学生名称:阮光武 学生学好:0903070430 提交日期:2010年6月18日

实验一 语音波形文件的分析和读取 一、实验的任务、性质与目的 本实验是选修《语音信号处理》课的电子信息类专业学生的基础实验。通过实验: (1)掌握语音信号的基本特性理论:随机性,时变特性,短时平稳性,相关性等; (2)掌握语音信号的录入方式和*.WAV音波文件的存储结构; (3)使学生初步掌握语音信号处理的一般实验方法。 二、实验原理和步骤: WAV文件格式简介 WAV文件是多媒体中使用了声波文件的格式之一,它是以RIFF格式为标准。每个WAV文件的头四个字节就是“RIFF”。WAV文件由文件头和数据体两大部分组成,其中文件头又分为RIFF/WAV文件标识段和声音数据格式说明段两部分。常见的WAV声音文件有两种,分别对应于单声道(11.025KHz采样率、8Bit的采样值)和双声道(44.1KHz采样率、16Bit的采样值)。采样率是指声音信号在“模拟→数字”转换过程中,单位时间内采样的次数;采样值是指每一次采样周期内声音模拟信号的积分值。对于单声道声音文件,采样数据为8位的短整数(short int 00H-FFH);而对于双声道立体声声音文件,每次采样数据为一个16位的整数(int),高八位和低八位分别代表左右两个声道。WAV文件数据块包含以脉冲编码调制(PCM)格式表示的样本。在单声道WAV文件中,道0代表左声道,声道1代表右声道;在多声道WAV文件中,样本是交替出现的。WAV文件的格式见表1。

语音报站系统开题报告

基于单片机的公交车语音报站系统设计 (开题报告) 课题研究的目的,意义 公交车为出门的朋友们提供了快捷方便的服务,而公交车的报站问题直接关系到公交公司对乘客们的服务质量。乘务员在传统公交系统中一直负责报站的重要任务,但是这种方法事倍功半而且工作强度很大,在很多发达城市已经摒弃不用了。近几年来,世界乃至我国的科学技术飞速发展,在许多领域微机技术已经变成主导。在现今声学的领域里,公交语音报站器已经成为可能,可以使用微机与语音芯片相结合来完成语音合成的技术来实现这个目标,从而使市民有了更加人性化完善的服务。介于以上问题及原因综合实际使用情况,设计了一种由单片机控制的公交车自动报站系统. 我国相当数量的中小城市的机动车保有量已经达到几乎饱和的程度,大力发展城市公共交通已经成为城市管理者解决城市拥堵的主要措施。给乘坐公交车出行的人们提供舒适便捷已经成为公交系统的主要任务,作为一个城市的公交企业,它既要代表政府体现当地城市的形象,又要尽一切力量减少政府投资,创造良好的社会效益和经济效益。而传统的公交运营系统的装备和管理模式较难达到这两者的完美结合。随着科学技术的发展,公交应用系统带给公交企业的将不仅是形象的提升,也是效益的增长。虽然现在已经有些车上已经采用GPS 定位系统自动报站,但其昂贵的成本,难以实现普及。为了实现城市公交车的自动报站,设计了一套低廉、高性能的城市公交车自动报站系统系统具有一定的现实意义。 国内外研究现状 近些年来,随着经济的增长,城市人口的逐渐增多,城市的车辆也是逐年递增,使得 原本就拥挤的道路变得更加地拥挤,严重影响了车辆通行的速度。在现代化城市里,公交 车已经成为都市人生活不可替代的交通工具,它的运行状况直接影响到人们的生活。目前 在国内的大多数城市中,公交车普遍采用无人售票的方式。存在了几十年的公交车售票员 在国内各城市的公交车上已经不见了,代之而来的是无人售票及手动报站。目前在国外发 达国家公交系统中,电子信息技术在公交车上已经得到了广泛的应用,如自动报站器、电 子显示屏、IC 卡刷卡机、GPS 卫星定位系统等,有效地促进了公交车的服务水平和经营效 益的提高。而我国的情况变化不大,仍然采用的是人工按键报站,甚至一些地区还存在售 票员报站。只有北京、上海、深圳、广州、青岛等城市实现自动报站. 公交车报站器在公交事业中占有举足轻重的地位,它直接影响到公交车的服务质量。现今,有三种公交报站的方式,其中有一种功能强大,系统稳定,就是利用GPS 全球卫星定位系统的公交语音报站系统,这种报站系统已经在美国的一些城市投入使用,国内也有此类产品的研制开发,其但投资昂贵,尤其是一些中小城市无法承受。现在我国大部分城市采用的是手动电子报站和人工报站的方式,而它们都离不开司务人员,这样就加大了司乘人员的工作强度。手动电子报站一般由司机或者乘务员控制,经常出现错报、误报的情况,而人工报站容易给外地乘车人员带来不便,这种报站方式应用的越来越少了 公交车为出门的朋友们提供了快捷方便的服务,而公交车的报站问题直接关系到公随着公交优先战略的确定,公交在缓解城市交通拥堵方面的作用将越来越重要,也这种要求相比,我国大城市公共交通还有很大差距。我国智能运输的基础较差,因此理论研究虽在进行,但相应技术却得不到推广,在实际生活中得不到应用,达不到广泛服务社会的目的。目前在国际上已经实现了DPS定位车载智能系统,在国内的几个大城市也都有使用,实现了公交

语音信号虚拟分析仪开题报告

燕山大学 本科毕业设计(论文)开题报告 课题名称:语音信号虚拟分析 仪 学院(系):里仁学院电子工程 系 年级专业:08 电子信息工程 学生姓名:徐柳坡 指导教师:孟玲玲 完成日期:2012.03.16

一、综述本课题国内外研究动态,说明选题的依据和意义 语音信号处理分析的发展可以说是从1940年前后Dudley的声码器和Potter等人的可见语音开始的;20世纪60年代中期形成的一系列数字信号处理方法和技术,如数字滤波器、快速傅立叶变换等成为语音信号数字处理的理论和技术基础;到了80年代,由于矢量量化、隐马尔可夫模型和人工神经网络等相继被应用于语音信号处理,并经过不断改进与完善,使得语音信号处理技术产生了突破性的进展。进入90年代以来,语音信号处理在实用化方面取得了许多实质性的进展。一方面,对声学语音学统计模型的研究逐渐深入,鲁棒的语音识别、基于语音段的建模方法及隐马尔可夫模型与人工神经网络的结合成为研究的热点。另一方面,为了语音识别实用化的需要,讲者自适应、听觉模型、快速搜索识别算法以及进一步的语言模型的研究等课题倍受关注。 笔者研究本课题是因为信号处理技术几乎涉及到所有的工程技术领域,而频谱分析正是信号处理中一个非常重要的分析手段。基于LabVIEW的虚拟频谱分析仪由数据采集、信号分析和处理、结果输出显示3大部分组成。利用I/O接口设备完成信号的采集,数据分析和处理则由LabVIEW软件完成。 语音信号分析有非常重要的意义。信号处理几乎涉及到所有的工程技术领域,如,军事,航空航天,生物医学等。而频谱分析正是信号处理中一个非常重要的分析手段。 总之,研究用LabVIEW分析语音信号既具有学术价值也具有实际应用价值。 二、研究的基本内容,拟解决的主要问题 研究的基本内容:利用声卡,在计算机上开发虚拟仪器功能,实现音频信号分析及特性参数测试。 软件设计:波形显示,电压测量,频谱分析及典型参数计算。主要使用LabVIEW图形化编程语言来代替传统仪器对被测信号进行采集、分析处理以及对测量结果的表达与输出。 最后,输入信号调理。对输出结果进行分析判断,改善设计的不足和错

多通道语音增强方法简介

多通道语音增强方法简介 【摘要】由于多麦克风越来越多地部署到同一个设备上,基于双麦克风和麦克风阵列的多通道语音增强研究有了较大的应用价值。介绍了自适应噪声对消法、FDM等双通道语音增强方法和波束形成、独立分量分析等麦克风阵列语音增强方法,对各个方法的原理、发展和优缺点进行了详细分析和总结,对多通道语音增强深入研究有一定帮助。 【关键词】语音增强;双通道;麦克风阵列;波束形成 1.引言 语音是人们通讯交流的主要方式之一。我们生活的环境中不可避免地存在着噪声,混入噪声的语音会使人的听觉感受变得糟糕,甚至影响人对语音的理解。在语音编码、语音识别、说话人识别等系统中,噪声也会严重影响应用的效果。语音增强成为研究的一个问题,其模型如图1所示。 图1 语音增强模型 按照采集信号的麦克风数量分类,语音增强方法可被分为单通道(single channel)、双通道(dual-channel)、麦克风阵列(microphone array)三种类型。一般来说,麦克风越多,去噪的效果越好。早期,大部分通信/录音终端都只配有一个麦克风,因此单通道语音增强吸引了大量研究者的目光,方法较为成熟。但单通道方法的缺点是缺少参考信号,噪声估计难度大,增强效果受到限制。近年来随着麦克风设备的小型化和成本的降低,双麦克风和麦克风阵列越来越多地被部署。研究者的注意力也在从单通道语音增强向双通道和麦克风阵列语音增强转移,这里对已有的多通道语音增强算法作以简单介绍。 2.双通道语音增强方法 在语音增强中,一个关键的问题就是获得噪声。在单通道语音增强中,噪声是通过从带噪语音信号中估计得到的,估计算法较为复杂且估计噪声总是与真实噪声存在差异,这就限制了增强效果的提高。为了获得真实噪声,简单的做法就是增加一个麦克风来采集噪声。从带噪语音信号中减去采集噪声来得到语音信号,这种方法叫做自适应噪声对消法(ANC,adaptive noise canceling),是最原始的最简单的双通道语音增强算法。针对双麦克风开发的算法不多,主要有噪声对消法、一阶差分麦克风(FDM,first-order differential microphone)及基于FDM 改进得到的自适应零陷波束形成法(ANF,adaptive null-forming)。 2.1 自适应噪声对消法 噪声对消法采用两个麦克风,一个麦克风采集带噪语音,另一个采集噪声信号,用带噪信号减去噪声信号,得到语音信号。减操作一般在频域进行,如果采

语音信号处理实验报告实验二

通信工程学院12级1班 罗恒 2012101032 实验二 基于MATLAB 的语音信号频域特征分析 一、 实验要求 要求根据已有语音信号,自己设计程序,给出其倒谱、语谱图的分析结果,并根据频域分析方法检测所分析语音信号的基音周期或共振峰。 二、 实验目的 信号的傅立叶表示在信号的分析与处理中起着重要的作用。因为对于线性系统来说,可以很方便地确定其对正弦或复指数和的响应,所以傅立叶分析方法能完善地解决许多信号分析和处理问题。另外,傅立叶表示使信号的某些特性变得更明显,因此,它能更深入地说明信号的各项红物理现象。 由于语音信号是随着时间变化的,通常认为,语音是一个受准周期脉冲或随机噪声源激励的线性系统的输出。输出频谱是声道系统频率响应与激励源频谱的乘积。声道系统的频率响应及激励源都是随时间变化的,因此一般标准的傅立叶表示虽然适用于周期及平稳随机信号的表示,但不能直接用于语音信号。由于语音信号可以认为在短时间内,近似不变,因而可以采用短时分析法。 三、 实验设备 1.PC 机; 2.MATLAB 软件环境; 四、 实验内容 1.上机前用Matlab 语言完成程序编写工作。 2.程序应具有加窗(分帧)、绘制曲线等功能。 3.上机实验时先调试程序,通过后进行信号处理。 4.对录入的语音数据进行处理,并显示运行结果。 5.依次给出其倒谱、语谱图的分析结果。 6. 根据频域分析方法检测所分析语音信号的基音周期或共振峰。 五、 实验原理及方法 1、短时傅立叶变换 由于语音信号是短时平稳的随机信号,某一语音信号帧的短时傅立叶变换的定义为: 其中w(n -m)是实窗口函数序列,n 表示某一语音信号帧。令n -m=k',则得到 ()()()jw jwm n m X e x m w n m e ∞-=-∞= -∑

相关文档
最新文档