男女声识别系统

男女声识别系统
男女声识别系统

男女声识别系统

摘要:

本文通过对男性和女性声音的语音特征的研究,发现男女声的基音频率存在较大的差异,并设计了基于基音频率分析的男女声识别系统。男女声识别系统由以下三个模块电路构成:话筒放大器,低通滤波器,半波整流电路,单片机测量控制模块。话筒放大器采用NE5532P音前置芯片,对语音信号进行放大;八阶低通滤波器MAX293完成基音信号的提取;单片机STC12C5410AD实现频率测量和控制输出功能。经仿真与电路实测,男女声的识别效果良好。

关键词:男女声识别、基音频率、低通滤波器、单片机。

一、引言

人类基音的范围约为70~350Hz左右,由于生理结

构的不同,男性与女性的声音呈现出不同的听觉特征,

男声的基音频率大都在100—200HZ之间,而女声则在

200—350HZ之间;在会话中,同一发音者的基音频率变

化的统计结果,如图一所示。女声与男声相比,前者的

平均值、标准差都为后者的两倍左右。不同发音者的基

音频率分布如图二所示,在对数频率轴上男声,女声分

别呈现正态分布,男声的基音频率的平均值和标准差分

别为125HZ及其20HZ。女声约为男声的2倍。鉴于男女

声存在基音频率的明显差异,基音频率可作为男女声识别的依据。

二、方案论证与比较

基于男女声基音频率的差异,男女声识别的实现可以通过基音频率的测量来实现。基音频率的实现有多种方法。如FFT分析、自相关分析等。

方案一:基于FFT的短时频谱分析。把语音信号数字化,即经AD采样量化之后,用FFT算法处理,得到信号的频谱,从而获得基音频率。这种方法由于算法较复杂,数据处理量大,如用单片机来实现,编程复杂,运算速度慢,难以满足实时要求。

方案二:滤波器基音提取技术。利用低通滤波器滤除多次谐波及共振峰等高频成分,得到近似的基音信号,此法可以用硬件电路构成滤波器实现基音信号的粗略提取,避免了大量算法分析和数据处理,实现起来相当简单。为了证明这种方法的有效性,我们用计算机声卡录制了近20名男女同学的单音、词组和句子的W A V文件,在MA TLAB上编写程序进行仿真。

1.男女声信号通过400HZ低通滤波后的仿真波形比较。我们将男女声信号经过八阶低通滤波器,其截止频率设定为400HZ。仿真结果如图三所示。从图形上我们可以看到:通过400HZ的低通滤波器后,男声输出为约120HZ左右周期性信号(非单频正弦波);女声输出约250HZ左右周期性信号,其波形接近正弦波。这说明经过400HZ低通滤波器后,女声声音主要由基音信号构成,而男性声音的非正弦性是由于其二次谐波及共振峰的存在的结果。

2.男女声信号通过200HZ低通滤波后的仿真波形比较。我们将男声、女声输入信号经过八阶低通数字滤波器滤波,截止频率设定为200HZ。男声、女声及其通过200HZ低通滤波后的波形如图四所示:

从上边的图形我们看出:经过200HZ的低通滤波器,男声输出为较好的正弦波(基音信号),而女声基本上没有信号通过。

从MA TLAB数据处理软件对采集信号分析的结果表明,用滤波器提取基音频率的方法完全可行。我们在计算机上用这种方法编写了男女声识别软件,对男女声基音特征进行提取,实现了识别的仿真。实验表明,在正常说话条件下,系统具有较高的识别率,仿真效果令人满意。

三、系统实现

1.设计思想与系统构成:

话筒产生的语音信号很微弱,大约50mV左右,必须经过放大才能送往后级电路处理。两个高阶低通滤波器分别工作在400HZ的截止频率和200HZ截止频率。这主要是为了保证始终有一路信号是含谐波分量较少的近似基音信号。整形电路把正弦波转化为矩形脉冲,送往单片机STC12C5010AD测量其周期。单片机完成多次测量后,进行统计,作出男声还是女声的判断,送输出显示。

2.主要电路的设计与说明

A、话筒放大电路

通过用NE5532P芯片来实现语音放大,把微弱的语音信号放大的50倍左右。

如图所示,采用NE5532运算放大器作音频前置放大电路。其优点是体积小、功耗小、一致性较好。电路如下图所示:

B、低通滤波电路

采用MAX293可控截止频率8阶巴特沃夫低通滤波器,如图所示,则电路结构简单,外围元件少,截止频率可由外部时钟控制或由时钟输入端所接电容决定。截止频率控制简单,且滤波效果好。调试时,由外部时钟控制截止频率,调试完成后,可将滤波器的截止频率固定,即在时钟输入端(CLK)接一个一定大小的电容。

比较两个方案,方案二实现滤波简单方便,满足系统要求。

C、全整流电路

如图所示,U5A、U6A各组成一线性半波整流电路,而U5B、U6B各组成一加法电路。U5A和U5B,U6A和U6B构成一线性全波整流电路。

D、单片机电路

把经过整流后的两路频率信号输入STC12C5410AD进行A\D转换并采样。再各求出两组采样好的数据的能量,以便来进行比较。若求出来的两个结果较接近就为男声,那么男声的那个发光二极管就会亮起来。若两个结果相差较大就为女声,那么女声的那个发光二极管就会亮起。

电路如下:

3. 软件设计

A 程序设计流程图:

B 程序:

#include

sfr ADC_LOW2 = 0xBE;//定义STC12C5410AD特殊功能寄存器sfr ADC_CONTR = 0xC5;

sfr ADC_DATA = 0xC6;

sfr p0m0 = 0x93;

sfr p0m1 = 0x94;

sfr p1m0 = 0x91;

sfr p1m1 = 0x92;

sfr p2m0 = 0x95;

sfr p2m1 = 0x96;

sfr p3m0 = 0xb1;

sfr p3m1 = 0xb2;

sbit getv = P2^1;//定义指示灯

sbit male = P2^6;

sbit female = P2^7;

#define divgate 4//定义全局常量和全局变量

#define countgate 185

#define on 1

#define off 0

unsigned char div;

unsigned char ad200,ad400;

unsigned char test;

unsigned char i,count;

unsigned char code display_AD_channel_ID[2] = {0x00,0x01};

void delay100us( char Delay)//延时程序,延时时间=Delay*100us

{

char d;

for(;Delay>0;Delay--)

{

for(d=0;d<12;d++)

{;}

}

}

void delay50ms(unsigned int t)//延时程序,延时时间=t*50ms

{

unsigned int j;

for(;t>0;t--)

for(j=6245;j>0;j--)

;

}

unsigned char Ad_Change(unsigned char channel)//AD转换子程序

{

ADC_CONTR = ADC_CONTR&0xe0; //1110,0000 清ADC_FLAG,ADC_START位和低3位

ADC_CONTR = ADC_CONTR|(display_AD_channel_ID[channel]&0x07); //设置当前通道号//延时使输入电压达到稳定

ADC_DA TA = 0; //清A/D转换结果寄存器delay100us(5);

ADC_CONTR = ADC_CONTR|0x08; //0000,1000ADCS =1,启动转换

do { ; }

while((ADC_CONTR & 0x10)==0); //0001,0000等待A/D转换结束

ADC_CONTR = ADC_CONTR&0xE7; //1110,0111清ADC_FLAG位,停止A/D转换

return ADC_DATA;

}

void get_result()//声音采集和处理子程序

{

count=0;

getv=on;

male=off;

female=off;

for(i=0;i<250;i++)//对400hz和200hz信号各采样250次并统计数据

{

ad400=Ad_Change(0);

ad200=Ad_Change(1);

if(ad200!=0)

{

div=ad400/ad200;

if(div>divgate)

count++;

}

else if(ad200<0x01)

count++;

}

if(count>countgate)//判别男女并指示

{

female=on;male=off;

}

else

{

male=on;female=off;

}

getv=off;

delay50ms(50);

delay50ms(50);

delay50ms(50);

delay50ms(50);

delay50ms(50);

delay50ms(50);

delay50ms(50);

delay50ms(50);

delay50ms(50);

delay50ms(50);

delay50ms(50);//返回等待下次测试

}

void main()

{

SP=0x31;

IE=0x85;//开系统中断

getv=0;

male=1;

female=0;

ADC_CONTR =0xe0; //1110,0000打开A/D转换电源。设定采样速率为210个机器周期p1m0 = 0x03; //0000,0011P1.0--P1.1先设为开漏。断开内部上拉电阻

p1m1 = 0x00;

delay100us(10);

while(1)//循环等待声音信号输入

{

male=~male;

female=~female;

delay50ms(50);

test=Ad_Change(0);//先不跟你聊了,写好程序部分的实验报告好给你们

if(test>0x02)

{

test=Ad_Change(0);

if(test>0x02)//重复先不跟你聊了,写好程序部分的实验报告好给你们

{

test=Ad_Change(0);

if(test>0x02)

{

get_result();//对声音进行判别

}

}

}

}

}

四、系统电路测试与分析

1.带话筒放大器的测试:调整放大增益,使输出幅度较大而不失真。

2.低通滤波器性能的测试:信号发生器产生200-400HZ正弦波作为400Hz截止频率低通滤波器的输入信号,用示波器观察输出信号,可看到输出为正弦波,450HZ以上正弦波输入时基本无输出信号,可见滤波效果很好。信号发生器产生100-300HZ正弦波作为200Hz截止频率低通滤波器的输入信号,用示波器观察输出信号,同样可看到很好的滤波效果。

3.单片机系统调试:用仿真器调试测量与处理程序。

4.整机测试:下面是对若干位学生的测试结果。

由测试结果得到,该系统判断准确率为70%。原因是,就一个说话者来说,基音频率并不是固定不变的,

不同声音、不同声调、说话者的情绪等都会影响基音频率,另外辅音会对测试结果有一定的影响。正因为如此,容易造成误判。(如某位男同学发的某些音,用系统测试误判为女声)。

五总结

这个科技制作,我们从三月份开始着手找方案,并多次找钟老师指导,一开始,我们想尝试用全软件的ARM的开发板实现,可是近半个月的时间,找的资料都没能让我们很好的了解ARM的使用,所以我们最后决定改变方案,使用硬件跟单片机软件相结合的办法,硬件部分,对所需的芯片不熟悉,经过钟老师指导,我们应用了MAX293的滤波器,经网上找资料,学会MAX293的应用及其外围电路的搭建,放大电路并没有太大的问题,只是我们本来打算用一个具有自增益控制的芯片,但是在赛格找不到,所以只能单用运放实现,放大跟滤波的电路完成后,整流部分则参考了《模拟电子线路》里面的一个图。前面硬件部分基本完成,然后就开始制板,因为之前都没有接触过,所以只能从零开始,学着用PROTEI软件,画原理图并画PCB,然后去实验室做板,做伴并没有太大的问题,但是因为芯片是帖片封装,所以焊帖片是很新的尝试,还好有同学的指导才能掌握其中的诀窍。第一次制板,因为没有经验,所以一口气就把整个硬件电路做在一块板上,结果调试的时候有问题,可是却没有办法检查哪里出问题,所以第一块板就宣布废掉,接下来,决定按模块分开做,放大,滤波,整流,和单片机部分。放大部分我们用万能板,其他三个部分都是用腐蚀板,滤波部分电路一次就完成,但是整流部分却出现问题,检查电路并没有问题,可是就是没有整流效果,所以最后只能重新用万能板,最后终于完成整流部分的电路。单片机部分,主要是由另一个组员完成,所以单片机部分的程序设计我并没有参与。

这个科技制作中,我们遇到了很多很多的问题,大问题小问题都有,首先是怎么找资料,开始很茫然的在网上搜索,可是很多并没有很完整,或者是没有很规范,经过钟老师的推荐,我们很多资料都在https://www.360docs.net/doc/e317619227.html,的网页上找。其次是调试,调试过程中常会出现电源还没有接,或者是地线忘记接等等的小错误,所以一开始调试的时候就很多问题,结果都归结于自己的粗心与对示波器使用的不熟悉,甚至最后几天还出现最低级的错误,居然把正负电源给接反了,结果本来好的电路根本就没有波形出来,然后就重新检查电路,可是并没有发现是因为电源接错,所以开始拆电路,因为是腐蚀板做的,一拆就整个都废了,所以只能重新做板,直到当天晚上才突然想起是电源接反造成的,可是板已经被我们给拆了,所以只能重新做板了。

最后科技制作终于基本完成,这个阶段,可是天天实验室,不过这个阶段确实学到很多东西。

男女声识别系统 摘要: 本文通过对男性和女性声音的语音特征的研究,发现男女声的基音频率存在较大的差异,并设计了基于基音频率分析的男女声识别系统。男女声识别系统由以下三个模块电路构成:话筒放大器,低通滤波器,半波整流电路,单片机测量控制模块。话筒放大器采用NE5532P音前置芯片,对语音信号进行放大;八阶低通滤波器MAX293完成基音信号的提取;单片机STC12C5410AD实现频率测量和控制输出功能。经仿真与电路实测,男女声的识别效果良好。 关键词:男女声识别、基音频率、低通滤波器、单片机。 一、引言 人类基音的范围约为70~ 350Hz左右,由于生理结构的不同, 男性与女性的声音呈现出不同的听 觉特征,男声的基音频率大都在 100—200HZ之间,而女声则在200 —350HZ之间;在会话中,同一发 音者的基音频率变化的统计结果, 如图一所示。女声与男声相比,前者的平均值、标准差都为后者的两倍左右。不同发音者的基音频率分布如图二所示,在对数频率轴上男声,女声分别呈现正态分布,男声的基音频率的平均值和标准差分别为125HZ及其20HZ。女声约为男声的2倍。鉴于男女声存在基音频率的明显差异,基音频率可作为男女声识别的依据。 二、方案论证与比较 基于男女声基音频率的差异,男女声识别的实现可以通过基音频率的测量来实现。基音频率的实现有多种方法。如FFT分析、自相关分析等。

方案一:基于FFT的短时频谱分析。把语音信号数字化,即经AD采样量化之后,用FFT算法处理,得到信号的频谱,从而获得基音频率。这种方法由于算法较复杂,数据处理量大,如用单片机来实现,编程复杂,运算速度慢,难以满足实时要求。 方案二:滤波器基音提取技术。利用低通滤波器滤除多次谐波及共振峰等高频成分,得到近似的基音信号,此法可以用硬件电路构成滤波器实现基音信号的粗略提取,避免了大量算法分析和数据处理,实现起来相当简单。为了证明这种方法的有效性,我们用计算机声卡录制了近20名男女同学的单音、词组和句子的WAV文件,在MATLAB上编写程序进行仿真。 1.男女声信号通过400HZ低通滤波后的仿真波形比较。我们将男女声信号经过八阶低通滤波器,其截止频率设定为400HZ。仿真结果如图三所示。从图形上我们可以看到:通过400HZ的低通滤波器后,男声输出为约120HZ左右周期性信号(非单频正弦波);女声输出约250HZ左右周期性信号,其波形接近正弦波。这说明经过400HZ低通滤波器后,女声声音主要由基音信号构成,而男性声音的非正弦性是由于其二次谐波及共振峰的存在的结果。 2.男女声信号通过200HZ低通滤波后的仿真波形比较。我们将男声、女声输入信号经过八阶低通数字滤波器滤波,截止频率设定为200HZ。男声、女声及其通过200HZ低通滤波后的波形如图四所示: 从上边的图形我们看出:经过200HZ的低通滤波器,男声输出为较好的正弦波(基音信号),而女声基本上没有信号通过。 从MATLAB数据处理软件对采集信号分析的结果表明,用滤波器提取基音频率的方法完全可行。我们在计算机上用这种方法编写了男女声识别软件,对男女声基音特征进行提取,实现了识别的仿真。实验表明,在正常说话条件下,系统具有较高的识别率,仿真效果令人满意。 三、系统实现 1.设计思想与系统构成:

声音识别的特点与应用 对于声音识别技术来说,由于不需要过多的接触以及实体间交互模式的认证。因此,它在使用中无疑要比识别技术等更加的便利。而在配置过程中,由于当前大多的IT产品都已经安装了声卡和话筒。因而它的构架上也可以节约更多的成本。此外,对于使用环境来说,由于不需要像监控设备那样对角度有着更高的要求,所以语音识别系统的使用环境无疑也会更加的随意和隐蔽。这些都是语音识别系统与其他安防设施相比更加独特的优势。 所以,对于语音识别系统的应用,无论是普通的民间交流,还是更加专业的法律取证,都是它大显身手的时候。而相比于它在民间的应用,作为安防系统的它在治安管理领域显然要有着更加突出的发挥。 如果说起语音识别最知名的应用,恐怕还要属当年美国在打击本拉登与萨达姆的例子。在那个情报鱼目混杂,真假情报混为一潭的环境下,无论是本拉登还是萨达姆总要频频献声,而美国的情报部门正式根据这种通过声音识别的方式,对所受到的情报进行一一划分,从而汲取了有效的信息,理清了自己的打击思路,甚至还能通过对声音的识别对目标人物的身体状况作出一个大致的判断。可以说将对方的挑衅摇身变成了送上门的情报。 而对于我国国内的治安应用来说,如今的安全部门也在更多的引入这一技术进行犯罪活动的打击。比如在处理一些电话追踪,违法交易的电话截获等等。都有着语音识别的影子。随着语音识别技术的进一步完善,信息准确性的不断提升,如今一些法庭的审判也开始采用了语音识别作为证据。可以说他对于我们的帮助也正在由临时参考逐渐走向了依赖。 除了安防系统应用以外,其实我们日常生活中一些身份的识别也在采用语音识别的模式。现如今,已经有不少的银行采用了语音识别的模式进行保险箱的控制,或者在一些远程的服务中,也采用语音识别的模式,对客户的身份进行定位。此外,作为智能化技术的重要一环,语音识别对于智能家居系统同样有着创造性的作用。尽管这种全新的模式在短时间之内普及的话,无论是在技术上还是理念上都会遇到不小的阻力。但从长远来看,这种技术的出现以及民用化的普及,对于未来实现个人信息的全方位保护绝对是一个重要的标志性作用。

声纹识别系统 摘要 本文首先通过用层次分析法(AHP )构建了影响声纹识别的八大因素,并将其进行量化处理,得到了合理的权重比。同时构建Mel 倒谱系统提取说话人的主要特征倒频谱(MFCC 参数),利用提取的 MFCC 参数训练话者的 GMM (高斯混合模型),得到专属某话者的 GMM 声纹模型。接着通过语音数据对构建的声纹识别模型进行评价。发现得到的模型虽然可以接受,但其准确率不是很高。为了使模型的精确率提高,我们通过利用改进的K-means 算法来将模型进行调整。 问题一: 我们通过层次分析发得出语者的声学特征在语音识别中所占的权重最大,而且限于目前的技术,我们最终将能描绘语者声道结构的Mel 倒频谱系数作为语音的特征向量,该方法能很好的模拟人耳对不同频率的感知特性,具有很好的稳定性和准确度。然后我们利用matlab 编程将提供的语音数据的MFCC 系数提取出来作为声纹识别系统的训练样本。 问题二:基于高斯混合模型(GMM),我们用EM 算法来估计GMM 中的未知参数,由K-means 算法来得到EM 算法的初始值,通过不断地迭代EM 算法更新GMM 模型中的权重(w ),均值(u)和方差矩阵,直到最终使 ()*()P X P X λλε-<,ε取10-5。 问题三: 根据问题一的MFCC 模型和问题二的GMM 模型,利用matlab 编程,用样本语音数据去训练GMM 模型得到样本库,让后用未知的测试语音样本利用模式匹配法去与样本语音库进行匹配,得到一系列的匹配概率,概率最大者对应的语者为测试语音的主人。我们得出的结论是EM 算法的初值对最终的识别率有很大影响,用来确定GMM 初始值的K-means 算法有比较大的误差,需要改进。 问题四: 基于问题三的测试和查阅的相关资料,我们认为传统的K-means 算法忽略特征矢量各维分量对识别的影响,因而无法得到令人满意的识别结果。由数理统计知,方差是用来衡量样本数据的离散程度的。如果特征矢量的分布稀疏,则它的方差就会很大,反之,那些分布较集中的矢量方差比较小。为此,本文提出了基于方差的加权几何距离,在聚类过程中,对特征矢量的各分量按方差大小进行加权,加权因子为矢量方差的倒数。 关键字:声纹识别 层次分析法(AHP ) 美尓倒频谱系数(MFCC ) 高斯混合模型(GMM ) 期望值最大化算法(EM ) K-means 算法

基于声卡的声音识别系统 1.任务内容: 每个人的声音都有各自的特征以及讲话时特殊的语言习惯,这些都反映在声音信号中。利用声卡DSP技术和LabVIEW多线程技术,把声音作为声卡数据采集的对象,搭建一种基于声卡的虚拟数据采集和分析系统,实现声音识别。 整个系统包括声音的采集,A/D转换,音频数字信号的分析和处理,存储、现场采集到的声音同登记过的声音模板进行精确的匹配等等。整个程序可以分为:样本声音采样子系统,样本声音保存子系统,待检声音采样子系统,声音识别子系统等等。样本声音可以定义为系统所有者自己设定的“声音密码”;待检声音可以定义为任意用户输入的声音。 提示: 1.声音输入模块:合法用户向系统输入自己的声音,作为唯一的密钥匙。 2.声音识别模块:任意用户向系统发出申请,输入自己的声音,系统将对其进行识别,并对正确的“密钥”输入进行响应。 3.采样声音时用户不是随便说一句话,而是要说一句特定的话,并且要用特定的语速,才能被系统正确识别。语音录入查看匹配情况时,有80%近似即可表示基本匹配。 2.要求: 在深刻领会任务内容及要求的基础上,通过查阅文献资料、调查研究和方案论证,然后开展设计、研制、开发、编制VI程序以及数据处理、分析总结等与任务内容要求相应的工作,并撰写报告,独立地完成设计的各项任务。 设计思路: 分成四个子vi,样本声音录音和保存子vi,样本声音分析子vi和保存,待测声音录音,保存分析,子vi,和识别子vi。在识别的过程中采样将滤波后的频谱和功率谱波形比较。但是我只做到了样本声音的录音和保存子vi和样本声音分析子vi和保存,两个频谱的分析子vi不会做。 设计的步骤: a)首先是前面板的设计,录音的过程中,前面板上不需要什么输入的东西,我 都是在框图中即时添加的。 b)接着是框图的设计,在录音的过程中需要,需要调用些子vi,分别是si config.vi, si start.vi, si read.vi,si clear.vi.完成的功能是初始化声卡,采样,释放声卡。 c)因为在录音的过程中需要控件,当出现错误和暂停是能够停止,因为我用到 了while结构,在满足要求的条件的过程中能够录音,在满足条件的过程中停止。 d)还因为录音过程中可能需要暂停,在case结构中,true时立即开始录音,false 时暂停录音。

CIS系统之听觉识别系统 听觉识别系统(Audio Identity System)简称AIS,是通过听觉刺激传达企业的理念以及品牌形象的识别系统。 听觉识别系统是后来引入到CIS(Corporate Identity System)系统之中的。现代社会上流行CIS系统的包括MIS理念识别系统、BIS行为识别系统和VIS视觉识别系统,这比CIS系统出现之前有了较为完善的发展。当今有人在此基础上增加了AIS听觉识别系统和EIS环境识别系统,这使CIS系统更加完善、更加科学。 心理学上显示:人所感觉接收到的外界信息中,有83%来自视觉,11%来自听觉,3.5%来自嗅觉,1.5%通过触摸,另有1%来自味觉。可见人通过听觉得到的信息量仅次于视觉,这也是一个比较重要的传播途径。在当今视觉广告纷繁复杂的环境中,随处都可以感受到一些企业的听觉传播手段,也许在我们感到视觉疲劳的时候可以闭上眼睛不看广告,但是却阻止不了广告语传入耳朵中。比如路过麦当劳时总会听到:“麦当劳欢迎您来,欢迎您再 来!”;在听武汉广播时会听到:“群光广场,在您生活的每一天”。这些广告语重复出现在身边,慢慢就会在脑海里留下痕迹,每当我们有相似需求时,它们就会第一个蹦出来,比如过节或朋 友聚会时会考虑是不是去麦当劳搓一顿?逛街时会犹豫要不要去群光看看。可见广告语加强了我们对企业的认知度并潜移默化的

影响着我们的购买行为。 听觉识别系统主要包括产品名称的选择、广告语、企业歌曲(例如广州视唱文化传播XX公司为?%[3专业演出音箱系统做的宣传歌曲等)、广告音乐(例如马自达2的广告音乐、康师傅矿物水的广告音乐等)、企业特殊声音(例如:本田公司生产的摩托车发动机声音)、企业特别发言人的声音(例如李玟的“好迪真好、大家好才是真的好”)等内容。 在定位企业、产品及商标的命名时,要考虑到其商业名称的可读性,一是要注意用字的发音是否清晰易辩,好能悦耳动听、朗朗上口,如“科龙”、“红豆”、“浪奇”、“健力宝”、“娃哈哈”等等,义及发音都不错。二是要注意其谐音所导致的一些联想,该尽量启发正面联想,竭力消除负面影响。例如“柯达”读起来让人仿佛听到照相时按动快门的声响;“金利来”相信大家都比较熟悉,它的原名叫“金狮”,只因在香港“狮”字的发音与“输”字的发音相似构成了负面联想,而更名。三是要考虑到国际语言的通用性。例如美国驰名商标“艾克森”请语言学家参照了多种语言,无负面影响才得以定案。中国的企业在这方面也有不少杰作,如“四通”的英文是Stone(宝石);“联想”是Legend(传奇);“雅戈尔”是Younger(更年轻)。它们的中英文含义及发音照顾得都很周全。 广告语有广义和狭义之分,广义的广告语指通过各种传播媒体和招贴形式向公众介绍商品、文化、娱乐等服务内容的一种宣

声音方位快速识别系统设计 1.目的和意义 在巷战和山区战斗中,迅速判断枪声的来源,是至关重要的,是士兵和战车存亡的关键,在伊拉克战争中,美军已经装备有相关技术的设备。 在一些复杂的工业环境中,对于一些故障方位的识别也是重要的,因此,识别音响方位有着重要的应用意义。 2.基本原理 人的耳朵长在头的两侧,人依靠两耳听到声音的时间差和强度判断声源的大概方向和距离。气温20℃时,空气传导声音的速度是334米/秒,音强=音强1/距离2。以一次击掌为例,人耳听声示意如图1所示。左右耳感声示意图如图2所示。 声源在前方 声源在左前 声源在右前 图1 人耳声学示意图 左耳右耳右耳右耳左耳左耳声源在右前 声源在前方 声源在左前 图2 左右耳时差、声强示意图

正常情况下,人可以比较准确地识别音源。但是实战中,有以下因素干扰了人的听觉: ①人的叫喊声; ②战车的轰鸣声; ③炮弹的呼啸声; ④头戴式通信装备等。 另外,人的反应速度不快,神经的信号传导速度远远低于电信号的传导速度;视觉的反应速度远远高于听觉的反应速度。 3.题目任务 ①设计一套枪声方位快速识别系统硬件装置; ②配合硬件装置,设计一套枪声方位快速识别软件; ③完成系统初调。 4.硬件方案 系统硬件框图如图3所示。 图3 系统硬件框图 5.技术路线 4-8MIC 内置36个LED 图4 单兵型硬件模块图

图5 车载型硬件模块图 6.技术关键 ⑴抗干扰技术 ①人的叫喊声; ②战车的轰鸣声; ③炮弹的呼啸声; ⑵远近识别 ①远地狙击; ②近地自动武器; ③敌我识别(很难)。 ⑶学习功能 ①自身和友邻战车的轰鸣声; ②自身和友邻近地自动武器(困难);

前言:声音识别的迅速发展以及高效可靠的应用软件的开发,使声音识别系统在很多方面得到了应用、这种系统可以用声音指令拟应用特定短句实现“不用手”的数据采集、其最大特点就是不用手和眼睛,这对那些采集数据同时还要完成手脚并用的工作场合尤为适用。由于每个人的声音千差万别,因此声音可以用作安全认证的依据之一。 别人可以模仿你的签字,猜测你的密码,甚至能留下你的指纹,但要模仿你的声音就有点太苛刻了。美国的一座智能化大厦就采用了声音识别的方式。到达公司门口,你必须通过安全检查。电子声控门卫将问候“早上好!”你也该回答“你好!”或“早上好!”之类的礼貌用语。此时电子门卫通过你的声音来辨别你是不是该公司的工作人员,如果确认你是,它将主动为您打开门,但如果不是,电子门卫将客气地将你“拒之门外”。 如果你视力不好或行走不便,声控设备也可助一臂之力。比如,你可以通过说话控制洗衣机、电视机、电脑等设备。让它们执行开启、关闭等简单的任务。装有声控设备的电脑还能为你朗读新收到的电子邮件,告诉你最新的消息。荷兰飞利浦公司最近还研制出了一种新型音响设备,如果你想听音乐,不用走到音响前找按钮,也用不着遥控器,目口使你在厨房,只要喊一声“开始放音乐吧!”远在客厅的音响就能自动开启,再说出歌曲的名字,音响就能在几秒钟之内找到这首歌自动播放。更为神奇的是,如果你想不起来歌曲的名字,只要哼几句歌曲的旋律,音响就能辨别出是哪首歌,然后播放给你听。在2003年9月的CeBIT大展上,SONY亮出了他们QRIO家庭娱乐机器人。为强化对话功能,这款机器人配备了专门用于声音识别与声音合成的CPU。这样,在原机型“SDR-4X”中通过外部PC实现的大词汇量连续声音识别可以由机器人独立完成。机器人可使用的词汇量约2万条。为扩展记忆对话功能,不仅能记住对话者的面部与姓名,还能记住对话者在对话寸使用的单词。因此,当新款机器人与同一个人第二次碰面寸,不仅能认出对方是谁,还能想起过去的对话内容。这样就能对曾经遇到过的人“产生一定的感情”,原型号的机器人只能想起面部与姓名。 美国中央情报局近年来一直在秘密开发“声音自动处理系统”,并用“经典故事”来命名代替。这是一种可以“实寸自动鉴别语言、说话人和武器平台”的系统,这种系统不需要人工的介入,也不管说话人的语言是什么,即可以通过语音识别技术确认该人的身份,并锁定他说话时所在的地理位置。2003年8月?日,卡塔尔半岛电视台再次播放了据称是伊拉克前总统萨达姆的讲话录音。萨达姆在讲话中号召伊拉克人民“利用各种方式”赶走美英占领军。美国中央情报局官员随后发表声明称,中情局专家在对这盘录音带进行对比分析后,认为录音带上的声音“十有八九出自萨达姆本人”。 这次美国中情局就动用了语音识别系统。每个人的声音束、嘴型、喉咙、鼻道以及发音肌肉都各不相同,这些有差异的物理特性,决定了每个人声音的独一无--i性。据一位曾在苏联侵略阿富汗期间为美国工作的巴基斯坦将军透露:“所有的国家领导人由于其口音、停顿、

男女声识别系统

男女声判别 赵浩(15133105) 电子学院 电子与通信工程2015—2 摘要 本文通过对男性和女性声音语言特征的研究,发现男女声的基音频率存在较大的差异,并利用MATLAB设计并运行了基于基音频率分析的男女声识别系统的算法。 关键词:男女声识别基音频率 MATLAB 一.引言 人类基音的范围约为70—350Hz左右,由于生理结构的不同,男性与女性的声音呈现出不同的听觉特征,男声的基音频率大都在 100—200Hz之间,而女声则在200—350Hz 之间;在会话中,同一发声者的基音频率变化的统计结果,如图一所示。

女声与男声相比,前者的平均值、标准差都为后者的两倍左右。不同发音者的基音频率分布如图二所示,在对数轴上男声,女声f分别呈现正态分布,男声的基音频率的平均值和标准差分别为125Hz及20Hz。女声约为男声的2倍。鉴于男女声音在基音频率的明显差异,基音频率可作为男女声识别的依据。

二.设计任务和要求 1.要求:通过音频分析,识别出男声与女声。 2.任务:(1)录若干个男声、女声信号。 (2)分析信号的频谱,观察不同性别声音信号的频谱特点。 (3)设计识别算法,判断出男声、女声。 三.方案论证 利用低通滤波器滤除多次谐波及共振峰等高频成分得到近似的基音信号,此法可以用硬件电路构成滤波器实现基音信号的粗略提取,避免了大量算法分析和数据处理,实现起来相当简单。为了证明这种方法的有效性,用计算机声卡录制了近10名男女同学的单 音、词组和句子的WAV文件。在MATALB上编写程序进行仿真。

四.方案实现 1.将男女声信号通过400Hz低通滤波后的仿真 波形进行比较,我们将男女声信号通过八阶低通滤波器,其截至止频率设定为400Hz,仿真结果如图三所示。从图形上我们可以看到,通过400Hz的低通滤波器后,男女声输出为约120Hz左右周期性信号(非单频正弦波); 女声输出约250Hz左右周期性信号,其波形接近正弦波。这说明经过400Hz低通滤波器后,女声声音主要由基音信号构成,而男性声音的非正弦性是由于其二次谐波及共振峰的存在的结果。

男女声判别 赵浩(15133105) 电子学院 电子与通信工程2015—2 摘要 本文通过对男性和女性声音语言特征的研究,发现男女声的基音频率存在较大的差异,并利用MATLAB设计并运行了基于基音频率分析的男女声识别系统的算法。 关键词:男女声识别基音频率MATLAB 一.引言 人类基音的范围约为70—350Hz左右,由于生理结构的不同,男性与女性的声音呈现出不同的听觉特征,男声的基音频率大都在100—200Hz之间,而女声则在200—350Hz 之间;在会话中,同一发声者的基音频率变化的统计结果,如图一所示。 女声与男声相比,前者的平均值、标准差都为后者的两倍左右。不同发音者的基音频率分布如图二所示,在对数轴上男声,女声f分别呈现正态分布,男声的基音频率的平均值和标准差分别为125Hz及20Hz。女声约为男声的2倍。鉴于男女声音在基音频率的明显差异,基音频率可作为男女声识别的依据。

二.设计任务和要求 1.要求:通过音频分析,识别出男声与女声。 2.任务:(1)录若干个男声、女声信号。 (2)分析信号的频谱,观察不同性别声音信号的频谱特点。 (3)设计识别算法,判断出男声、女声。 三.方案论证 利用低通滤波器滤除多次谐波及共振峰等高频成分得到近似的基音信号,此法可以用硬件电路构成滤波器实现基音信号的粗略提取,避免了大量算法分析和数据处理,实现起来相当简单。为了证明这种方法的有效性,用计算机声卡录制了近10名男女同学的单音、词组和句子的WAV文件。在MATALB上编写程序进行仿真。 四.方案实现 1.将男女声信号通过400Hz低通滤波后的仿真波形进行比较,我们将男女声信号通 过八阶低通滤波器,其截至止频率设定为400Hz,仿真结果如图三所示。从图形上 我们可以看到,通过400Hz的低通滤波器后,男女声输出为约120Hz左右周期性 信号(非单频正弦波);女声输出约250Hz左右周期性信号,其波形接近正弦波。 这说明经过400Hz低通滤波器后,女声声音主要由基音信号构成,而男性声音的 非正弦性是由于其二次谐波及共振峰的存在的结果。

详解指纹识别声音识别虹膜识别等六种生物识 别技术原理 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】

所谓生物识别技术就是,通过计算机与光学、声学、生物传感器和生物统计学原理等高科技手段密切结合,利用人体固有的生理特性,(如指纹、脸象、虹膜等)和行为特征(如笔迹、声音、步态等)来进行个人身份的鉴定。 生物识别技术主要是指通过人类生物特征进行身份认证的一种技术,人类的生物特征通常具有唯一性、可以测量或可自动识别和验证、遗传性或终身不变等特点,因此生物识别认证技术较传统认证技术存在较大的优势。 指纹识别 原理 指纹是手指末端正面皮肤上凸凹不平产生的纹路。尽管指纹只是人体皮肤的小部分,但是,它蕴涵着大量的信息。指纹特征可分为两类:总体特征和局部特征。总体特征指那些用人眼直接就可以观察到的特征,包括基本纹路图案、模式区、核心点、三角点、式样线和纹线等。基本纹路图案有环形、弓形、螺旋形。 局部特征即指纹上节点的特征,这些具有某种特征的节点称为特征点。两枚指纹经常会具有相同的总体特征,但它们的局部特征——特征点,却不可能完全相同。指纹上的特征点,即指纹纹路上的终结点、分叉点和转折点。 指纹识别技术通常使用指纹的总体特征如纹形、三角点等来进行分类,再用局部特征如位置和方向等来进行用户身份识别。 通常,首先从获取的指纹图像上找到“特征点”(minutiae),然后根据特征点的特性建立用户活体指纹的数字表示——指纹特征数据(一种单向的转换,可以从指纹图像转换成特征数据但不能从特征数据转换成为指纹图像)。 由于两枚不同的指纹不会产生相同的特征数据,所以通过对所采集到的指纹图像的特征数据和存放在数据库中的指纹特征数据进行模式匹配,计算出它们的相似程度,最终得到两个指纹的匹配结果,根据匹配结果来鉴别用户身份。由于每个人的指纹不同,就是同一人的十指之间,指纹也有明显区别,因此指纹可用于身份鉴定。 优点 1)指纹是人体独一无二的特征,并且它们的复杂度足以提供用于鉴别的足够特征。 2)如果想要增加可靠性,只需登记更多的指纹,鉴别更多的手指,最多可以达到十个,而每一个指纹都是独一无二的。 3)扫描指纹的速度很快,使用非常方便。 4)读取指纹时,用户必须将手指与指纹采集头互相接触,与指纹采集头直接接触是读取人体生物特征最可靠的方法,这也是指纹识别技术能够占领大部分市场的一个主要原因。 5)指纹采集头可以更加小型化,并且价格会更加低廉。 缺点 1)某些人或某些群体的指纹因为指纹特征很少,故而很难成像。 2)过去因为在犯罪记录中使用指纹,使得某些人害怕“将指纹记录在案”。然而,实际上现在的指纹鉴别技术都可以保证不存储任何含有指纹图像的数据,而只是存储从指纹中得到的加密的指纹特征数据。 3)每一次使用指纹时都会在指纹采集头上留下用户的指纹印痕,而这些指纹痕迹存在被用来复制指纹的可能性。

智 能 信 息 处 理 学院:电气工程学院 学号:20139238 姓名:刘平方

声音在线检测与识别系统设计 摘要:本文主要基于虚拟仪器LabVIEW实现声音在线的检测和特征信息的提取以及识别声音来源的设计。利用微型计算机中自带声卡,采用虚拟仪器中带的子vi调用以及驱动声卡对麦克风的声音在线检测、滤波(带通滤波20~20khz)频谱分析、特征值提取、保存以及最后进行不同声音特征比较,来确定是否为同一人发出来用于未来的声音识别。 关键字:声音虚拟仪器LaVIEW 检测 1、虚拟仪器LabVIEW 虚拟仪器技术就是利用高性能的模块化硬件,结合高效灵活的软件来完成各种测试、测量和自动化的应用。自1986年问世以来,世界各国的工程师和科学家们都已将NI LabVIEW图形化开发工具用于产品设计周期的各个环节,从而改善了产品质量、缩短了产品投放市场的时间,并提高了产品开发和生产效率。 LabVIEW是一种程序开发环境,由美国国家仪器(NI)公司研制开发的,类似于C和BASIC开发环境,但是LabVIEW与其他计算机语言的显著区别是:其他计算机语言都是采用基于文本的语言产生代码,而LabVIEW使用的是图形化编辑语言G编写程序,产生的程序是框图的形式。 2、设计介绍 程序主要由前面板和vi程序框图组成。 2.1程序前面板如下所示:

主要执行步骤: (1)点击进入程序。 (2)配制声音采集设备参数。 (3)点击record后,LED灯亮,即可检测麦克声音5s。 (4)点击回放,即可对录制声音进行回放。 (5)点击对比,检测声音5s,同时与文件中存储的声音信号进行分析,检测出声音为同一人时,红灯闪烁。 2.2程序框图如下: 主要分为:a、初始化部分 b、设备参数配置以及声音检测存取部分 c、声音比较部分

基于声卡的声音识别系统 学生所在学院: 学生所在班级: 学生姓名: 指导教师:

摘要 声音识别系统利用PC声卡对声音进行采集。在LabVIEW中对采集的信号进行存储和重载,并对音频信号处理后提取关键参量进行比对。比对结果比较准确,可以判断录入声音和密钥声音的相似性,实现密钥功能。系统具有成本低,交互性高,便捷的优点,具有一定的应用前景。 关键词LabVIEW 声卡声音识别信号处理

目录 一. 系统设计背景 (4) 1.1 声卡工作原理 (4) 1.2 声音识别技术 (4) 1.3 LabVIEW软件 (4) 二. 系统设计目的和意义 (5) 三.系统设计思路 (5) 3.1 系统功能概述 (5) 3.2 系统流程图 (6) 四. 程序设计介绍 (6) 4.1 声音录用和保存模块 (6) 4.1.1 声音采集 (6) 4.1.2 录入声音处理 (8) 4.1.3 录音保存 (9) 4.2 波形对比识别模块 (10) 4.2.1 用户开锁声音录用 (10) 4.2.2 样本声音“密钥”调取 (10) 4.2.3 声音比对判断 (10) 五. 结果分析 (11) 六. 总结 (13) 参考文献 (13)

一. 系统设计背景 1.1 声卡工作原理 要用虚拟仪器技术完成一个测量任务,一般需要计算机配备具有一定性能的数据采集卡,而价格便宜的声卡是计算机的标准配置。 声卡作为声音信号与计算机的通用接口,其基本工作流程为:输入时,麦克风或线路输入(Line In)获取的音频信号通过A/D转换器转换成数字信号,送到计算机进行播放、录音、等各种处理;输出时,计算机通过总线将数字化的声音信号以PCM(脉冲编码调制)方式送到D/A转换器,变成模拟的音频信号,通过功率放大器或线路输出(Line Out)送到音响等设备转换成声波。 声卡不仅价格低廉,而且兼容性好、性能稳定、灵活通用,驱动程序升级方便。如果测量对象的频率在音频范围,而且对指标没有太高的要求,就可以考虑使用声卡取代常规的DAQ设备。而且LABVIEW中提供了专门用于声卡操作的函数节点,所以用声卡搭建数据采集系统是非常方便的。 1.2 声音识别技术 网络安全建立在密码等个人信息基础上,各种卡、帐号、网络登录号等都需要输入密码,而因忘记密码而无法进入的情况时有发生。若采用生物信息作为密码,则可以很好的解决这一问题。常用的生物信息如声音、手印、指纹等。 声音识别技术和签名识别相同,都属于行为识别技术。声音识别是一项根据语音波形中反映说话人生理和行为特征的语音参数,自动识别说话人身份的技术。它的基本原理是通过分析人的声音,为每个人构造一个独一无二的数学模型,有计算机对模型和实际输入的语音进行精确匹配,根据匹配结构辨认出说话人。 声音识别的优点是非接触识别,用户较易接受。但由于声音变化的范围较大,很难进行精确匹配;且采集的声音会随着音量、速度和音质的变化而变化,进而影响识别;另外,用录在磁带上的声音也可能欺骗声音识别系统。 1.3 LabVIEW软件 LabVIEW(Laboratory Virtual Instrument Engineering Workbench)是一种程序开发环境,由美国国家仪器(NI)公司研制开发。

相关主题
相关文档
最新文档