语音信号数字水印技术

语音信号数字水印技术
语音信号数字水印技术

数字信号处理课程设计报告

题目:语音信号水印技术系统设计

系(院):

专业:

班级:

学号:

姓名:

指导教师:

学年学期:2013 ~ 2014 学年第学期

2013年月日

摘要

随着网络和信息技术的发展,越来越多的数字多媒体信息通过网络进行传播,与传统的模拟媒体相比,数字媒体产品的编辑、复制和传播都很方便,它一方面促进了社会的进步与发展,另一方面正是这些优点突出了版权问题。由于数字多媒体信息很容易被未经授权的用户复制,且采用传统密码方法加密,不能完全解决盗版问题。

数字水印技术正是应运而生的信息隐藏技术,它通过特定的水印算法把版权信息嵌入在数字产品中,被嵌入的可以是一段文字、标识、序列号等等,人们无法从表面上感知水印的存在,只有专用的检测仪器或计算机软件才可以检测出隐藏的数字水印,从而达到了保护数字作品的所有者利益的目的,并促进了数字产品的开发与使用。在数字产品中,音频数据产品的版权保护也显得越来越重要,因为随着数字化音像制品和音乐制品的大量制作与发行,一个令人关注的突出问题是网上下载音乐对传统CD 业的巨大冲击。音频水印技术主要利用了人类听觉模型,在不影响音频信号质量的前提下,将水印信息隐藏在人耳不能感知的位置,来隐藏水印数据。本文主要研究语音信号水印技术,利用小波变换的优点和特性对音频信号嵌入水印,并提取。使嵌入水印音频想好具有良好的安全性,鲁棒性和不可感知性。

关键词数字水印嵌入提取小波变换

目录

1 课题综述 (1)

1.1数字水印技术的介绍 (1)

1.2 数字水印设计原理 (2)

2系统分析与设计 (3)

2.1涉及基础知识 (3)

2.2算法的流程图 (5)

2.3算法实现 (5)

3代码编写 (7)

3.1主要代码 (7)

3.2程序调试 (10)

3.3程序运行与测试 (10)

结论 (14)

致谢 (16)

参考文献 (17)

1 课题综述

1.1 数字水印技术的介绍

数字水印就是指嵌入到被保护对象(如静止图像、音频、视频)中的某些能够证明其版权归属的数字信息,可以是作者的姓名、序列号、公司标志等等。

数字水印技术有着其固有的特点与研究方法。例如,从信息安全保密角度而言,隐藏的信息如果被破坏掉,系统可以视为安全的,因为秘密信息并未泄漏,但是,在数字水印系统中,隐藏信息的丢失意味着版权信息的丢失,从而失去了版权保护的功能。因此数字水印系统必须具有较强的鲁棒性、安全性、透明性等特点:

透明性(隐藏性):经过一系列隐藏处理,目标数据必须没有明显的降质现象,隐藏的数据无法人为的看见或听见。

1)鲁棒性:指抗拒各种处理操作和恶意攻击而不导致水印信息丢失的能力。所谓的

操作包括:传输过程中的信道噪声、滤波、增强有损压缩、几何变换、D/A或A /D转换等等。所谓的攻击包括:篡改、伪造、去除水印等等。数字水印起源于信息隐藏技术,这一点可以从它的隐藏性要求得到证实。

2)安全性:指将水印信息隐藏于目标数据的内容之内,而非文件头等处,防止因格

式转换而遭到破坏。

3)无歧义性:恢复出的水印或水印判决的结果应该能够确定地表明所有权,不会发

生多重所有权的纠纷。

4)通用性:好的水印算法适用于多种文件格式和媒体格式。通用性在某种程度上意

味着易用性。

但数字水印技术并不等同于信息隐藏技术,两者的区别在于对鲁棒性的要求上。信息隐藏的鲁棒性要求可以降低,也就是说在数据经过改动后允许隐藏信息的丢失,信息隐藏主要是关注隐藏信息的检测,而数字水印主要关注被盗版者擦除的可能性。数字水印必须能在一定限度内承受各种攻击而留存下来,这样才能实现有意义的版权保护。

在音频中加入水印,要考虑到音频载体信号的在人类听觉系统、音频格式以及传

送环境等方面的特点。与图像和视频相比,音频信号在相同的时间间隔内采样的点数少。这使得音频信号中可嵌入的信息量要比可视媒体也要少。并且由于人耳听觉系统(HAS)要比人眼视觉系统(HVS)敏感得多,因此听觉上的不可知觉性实现起来要比视觉上困难得多。

1.2 数字水印设计原理

数字水印技术包含水印的嵌入、提取/检测两个过程。数字作品拥有的特定信息,如数字序列、数字标识、文本或图像等,按某种算法嵌入到数字作品中,在需要时,通过相应的算法提取出该水印,从而能够验证数字作品的合法性。为了给攻击者增加去除水印的难度,目前大多数水印制作方案都采用密码学中的加密体系来加强安全性,在水印的嵌入和提取/检测时采用一种密钥,甚至几种密钥联合使用。数字水印的嵌入过程如图1-1所示,数字水印的提取/检测过程如图1-2所示

2 系统分析与设计

2.1涉及基础知识

2.1.1离散小波变换(Discrete Wavelet Transform,DWT)

小波变换是由法国科学家Morlet于1980年进行地震分析工作时提出的,但小波变换研究的热潮始于1986年。小波变换优于傅立叶变换的主要原因在于它的多分辨率特性,它可以针对不同信号变换而进行窗口的伸缩变化。加窗傅立叶变换可以形象地看成是固定尺寸的矩形时频窗口在时频域中滑动,并透过这个窗口来“观察”信号。这种固定矩形窗口的观察方法与人们期望的观察不太一致。例如,对一个高频成分丰富的信号,即变化很快的信号,最感兴趣的问题是它的发生时间,而对其频率则不要求知道的很准确;但是对一个变化很慢的信号,被关注的是频率,而对时间范围则不要求很精细。小波分析适应这种要求,它可以对高频成分使用大的频域窗口、小的时域窗口,而对于低频成分采用小的频域窗口、大的时域窗口。

1988年,Mallat受到塔式算法的启发,在多分辨率分析的指导下建立了Mallat算法,对小波变换的实际应用具有划时代的意义。Mallat算法本质上不需要知道尺度函数Φ(t)和小波函数Ψ(t)的具体结构,只由系数hn和gn就可以实现信号的分解与重构,因此也称为快速小波变换。利用快速小波变换,选择一定的小波函数对输入信号进行一定尺度的分解,得到这个尺度下信号的高频部分和低频部分,在一个尺度下,高频部分和低频部分包含了完全恢复上一尺度下信号的全部信息。这种分解如果重复进行,就得到了信号的多尺度分解,从而得到了信号的多层小波系数,即信号的低频系数和一系列的高频系数。如图2-1所示的小波分解树。

图2-1小波分解树

对于大多数信号来说,低频部分给出了信号的特征,往往是最重要的,而高频部

分则与噪音及扰动联系在一起。将信号的高频部分去掉,信号的基本特征仍然可以保留。所以,一般的信号处理都是针对这部分来进行的。因此,在信号分析中,经常会提到信号的近似部分与细节部分。近似主要是系统全局的、低频的部分,而细节往往是信号局部、高频的成分。

将信号分解成一个个互相正交小波函数的线性组合,可以展示信号的重要特性,但这并不是小波分析的全部。小波分析另一个重要的方面就是分析、比较、处理(如去掉高频信号、加密等)小波系数后,根据新得到系数去重构信号。这个过程称之为逆离散小波变换(IDWT),或小波重构、合成等。信号重构的基本过程如图2-2所示。

图2-2小波重构

2.1.2主要算法

近几年来,数字水印技术研究取得了很大的进步,本文对一些典型的算法进行分析,除特别指明,这些算法主要针对图象数据(某些算法也适合视频和音频数据)。

生理模型算法,人的生理模型包括人类视觉系统HVS(Human Visual System)和人类听觉系统HAS。该模型不仅被多媒体数据压缩系统所利用,同样可以供数字水印系统所利用。利用视觉模型,实现了一个基于分块DCT框架的数字水印系统;实现了一个基于小波分解框架的数字水印系统;实现了一个空域数字水印系统。它们的基本思想均是利用从视觉模型导出的JND(Just Noticeable Difference)描述来确定在图象的各个部分所能容忍的数字水印信号的最大强度,从而能避免破坏视觉质量。也就是说,利用视觉模型来确定与图象相关的调制掩模,然后再利用其来插入水印。这一方法同时具有好的透明性和强健性。

变换域算法:这是一种DCT域数字水印算法,其方法是首先把图象分成8x8的不重叠象素块,在经过分块DCT变换,得到由DCT系数组成的频率块,然后随机选取一些频率块,将水印信号嵌入到由密钥控制选择的一些DCT系数中。该算法是通过对选定的DCT系数进行微小变换以满足特定的关系,来表示一个比特的信息。在水印信号提取时,则选取相同的DCT系数,并根据系数之间的关系抽取比特信息。其

思想类似于扩展频谱通讯中的跳频(frequency hopping)技术,特点是数据改变幅度较小,且透明性好,但是其抵抗几何变换等攻击的能力较弱。另外基于DFT和DWT 算法与上述算法具有相似的原理。

这种以变换域算法为代表的通用算法普遍采用变换技术,以便在频率域实现水印信号叠加,并借鉴扩展频谱通讯等技术对水印信号进行有效的编码,从而提高了透明性和鲁棒性,同时还适当利用滤波技术对水印信号引入的高频噪声进行了消除,从而增加了对低频滤波攻击的抵抗力。

2.2 算法的流程图

算法流程图如图2-3所示

图2-3算法流程图

2.3算法实现

2.3.1水印嵌入

1)设A是原始音频信号,根据音频文件类型将它分为两部分

A = A H +A L

其中:A H 是与文件类型相关的部分,所以保留下来不做处理;A L是可以嵌入水印的部分,长度是L,它可以表示为

A ={a(l),0 l

其中a(l)是A L第I个数据的幅值。

2) 假设水印是长度LS 的音频文件,用ls 表示:

ls ={ls (j ),0 ≤j

3) 水印分段操作:因为原音频信号进行小波变换后,利用量化的方法将其分段,所

以讲水印音频也进行相应的分段,最后对应相加。

N = L/LS

这里水印分段不一定取得正数段,所以对其取整,将余数归为最后一段。

4) 原始音频信号的一维离散小波变换:选择合适的小波基进行一维小波三级分解。

D L =DWT(A L )= cA 3 ⊕cD 3⊕cD 2⊕cD 1

其中:cA 3和cD 3是三级分解的近似分量和细节分量;cD 2和cD 1是二级和一级小波分解的细节分量。由于小波分解的近似分量是信号的低频部分,往往是最重要的,水印嵌入在这部分可以增强水印的稳健性。因此,提取这部分小波系数来进行下一步的变换。

5) 特征区的检测:因为离散余弦变换的中低频系数集中了信号的大部分特征,同时

也是数值较大的部分,所以将水印信号嵌入在此,一是水印的嵌入对其影响不大;二是水印的稳健性也会加强。因此,通过排序将满足水印长度的最大的离散余弦系数作为嵌入水印的特征点。设这些点所组成的序列为

C k ={MAX (C L ’),0≤k ≤K }

6) 水印信号的嵌入:这里通过修改系数来进行水印的嵌入,设C*为嵌入水印后的音

频信号

()()()()???=+=+=0if 11if 1k k *k k v C k v C C αα (0≤k ≤K )

这里的α是大于0的比例因子,通过调节它的大小,在具有听觉不可见性的同时,保证所嵌入的水印信息强度足够大,便于水印信息的正确提取。在此期间其他的离散余弦系数值不变。

7) 离散小波逆变换:以C*’代替5式的cA 3作离散小波变换,得到嵌入水印后的小波

变换域的表示式为

D’L =C *’ ⊕cD 3 ⊕cD 2 ⊕cD 1

将其倒置

A’L =D

将A’L 代替A L 最终得到含有水印的音频信号

A w =A H+ A’L

最后将其输出。

2.3.2水印提取

1)读取嵌入水印的音频信号。对信号进行三级小波分解,再次提取其低频分量ca31

和其他主要分量cd31、cd21、cd11。

2)读取原音频信号,对进行一级小波分解,读取低频分量ca3。

3)对低频分量ca31和ca3进行分段,使用嵌入算法中分段的方式,找到水印嵌入的

数据点。使用嵌入水印音频信号的低频分量减去元信号低频分量,即可得到,原水印信号c3。

c3 = ca31 – ca3

3 代码编写

3.1主要代码

3.1.1三级小波分解

[c,l]=wavedec(y,3,'db4'); %3级小波分解,低频又叫近似,高频又叫细节ca3=appcoef(c,l,3,'db4'); %提取3级小波分解的最低频部分

cd3=detcoef(c,l,3); %提取3级小波分解的次低频部份

cd2=detcoef(c,l,2);

cd1=detcoef(c,l,1);

分析:这段为小波分解过程,对原始音频信号进行三重小波分解,提取其第三级低频分量ca3和一些主要分量cd3、cd2、cd1。并保留到重构时候使用。

3.1.2 原始音频频谱分析

fs=8000; %声卡默认采样频率为8000Hz

[kk.wave,fs,bits]= wavread('c.wav') %采样率fs,采样精度bits

xmax=max(abs(kk.wave)); %计算最大幅度

xmin=min(abs(kk.wave)); %计算最小幅度

l1=size(kk.wave); %计算出总长度l1,便于FFT分析频谱

t=(0:length(kk.wave)-1)/fs;

sound(kk.wave,fs); %回放监听

y1=fft(kk.wave,fs); %对信号做FFT变换

f=fs*(0:900)/fs;%采样

分析:这段为原始语音信号的读入,以及实现它的时域波形和频域波形,作FFT 时域频谱分析。

3.1.3 水印信号频谱分析

fs=8000; %声卡默认采样频率为8000Hz [mark.wave,fs,nbits]= wavread('d.wav') %采样率fs,采样精度bits

symax=max(abs(mark.wave)); %计算最大幅度

symin=min(abs(mark.wave)); %计算最小幅度

l2=size(mark.wave); %计算出总长度l2,便于FFT分析频谱t=(0:length(mark.wave)-1)/fs;

sound(mark.wave,fs); %回放监听

syfft=fft(mark.wave,fs); %对信号做FFT变换

f=fs*(0:900)/fs; %采样

分析:这段为原始水印信号的读入,以及实现它的时域波形和频域波形,作FFT 时域频谱分析。

3.1.4 嵌入水印

randn('seed',10); %产生随机高斯序列

lz=randn(1,lx);

ss=lz;

q=0.2; %设置水印嵌入强度

rr=ss*q;

x(i)=x(i).*(1+2*rr'); %嵌入水印

c1=[x',cd3',cd2',cd1']; %小波

s1=waverec(c1,l,'db4');

file1='已加水印.wav';

dd=length(s1);

ee=reshape(s1,dd/2,2);

wavwrite(ee,fs,bits,file1);

分析:这段首先产生随机的高斯序列,将水印信号分别加到分好段的原始音频信号中。最后乘以一个系数q(这里我们设置为0.2),系数q为水印嵌入强度,可以自由设置,最后生成加入了水印后的音频。

3.1.5 加入白噪

fz=sum(y.*y); %计算嵌入了水印的信号的信噪比

%fm=sum((y-yc).*(y-yc));

%SNR=-10*log(fm/fz)

yyy=randn(1,dd); %加入白噪声

b=sqrt(0.01);

yyy=b*yyy;

s1=s1+yyy;

file2='已加白噪.wav';

ee1=reshape(s1,dd/2,2);

wavwrite(ee1,fs,bits,file2);

kk.wave = wavread('已加白噪.wav'); %读入声音文件

sound(kk.wave,fs); %回放监听

yr=kk.wave;

[cr,lr]=wavedec(yr,3,'db4');

car3=appcoef(cr,lr,'db4',3);

cdr3=detcoef(cr,lr,3);

cdr2=detcoef(cr,lr,2);

cdr1=detcoef(cr,lr,1);

xr=car3;

分析:这段是在原课程设计要求的基本上添加的一个功能,加入白噪声,并将已加白噪的音频进行了过滤,生成去除了白噪声后的含水印信号的原始音频频谱。3.1.6 水印之差

rr1=reshape(rrr,1,lx);

syc=rr1-rr;

plot(syc); %画出水印差别图

%axis([0 16e3 -1 1]);

rrr=((xr(i)./x1(i))-1)/2;

d=length(rr);

x=0;

y=0;

z=0;

for i=1:d

x=x+rr(i)*rrr(i);

y=y+rr(i)^2;

z=z+rrr(i)^2;

end

p=x/((y^0.5)*(z^0.5)) %计算相关度

分析:这段为完成了前面的嵌入水印和加入噪声后,通过相关度的计算,做的一个关于加入水印前和加入水印后音频信号差别的频谱分析。

3.2程序调试

本次语音信号水印技术系统设计程序代码相对较少,但是计算比较复杂。在原理弄懂之后,调试还是比较简单的。试调中碰到最多的问题是数据维数不对称,导致水印信号不能嵌入。因为我们设计的算法使用的是一维数组,可以进行简单的行列转换即可解决。但由于设计之初算法只能满足一些数据量较小的音频数据,对于数据量大的音频数据会出现无法计算的情况,即便可以计算,时间相当之长。这只能不断提高算法的效率性和方便性,这我们会在将来的学习中不断改进。

3.3程序运行与测试

3.3.1 三级小波分解

3.3.2 原始音频频谱

3.3.3 原始水印频谱

3.3.4 嵌入水印信号

3.3.5 去噪提取水印

3.3.6 水印之差

图3-6水印之差波形图

通过嵌入水印后波形图与原音频波形图比较,我们可以看到嵌入水印的波形变化

较小,具有较好的水印隐藏性。

结论

本次课程设计我主要设计语音信号数字水印的嵌入和提取。相对于其他设计题目,音频水印的嵌入与提取难度相对较大,并且借鉴的例子也很少,我和选择相同设计题目的同学通过了大量的学习和不断的讨论,最终将一个稳定性、鲁棒性、透明性都相对良好的算法给确定了下来,并且完成了音频水印的嵌入和提取。在此基础上还添加了噪声和去噪等功能。

在设计之初,我认为要设计一个水印系统满足以设计要求是很困难的。有些性质如鲁棒性、透明性和数据容量之间是相互矛盾的,因此,在这些要求中寻找最佳平衡是水印系统设计的目标。并且在没有先例的情况下,我借鉴了一些图像水印嵌入的方法,试图将其代码变为音频所用。事实证明这并不可取,图像水印可以二值转换,数据处理量瞬间减少很多。音频信号数据量巨大,若要硬性相加,可能出现差错,并且占用数据空间巨大,计算困难。但是图像水印的嵌入思想我可以借鉴,即基于小波分解的方法嵌入水印信号。小波分解的方法可以提取低频分量,将水印信号嵌入其低频分量,并保持较多的原始音频信息,比较合适水印的要求。这使得我们很快进入算法设计,在未清楚相应算法的情况下我和同学讨论后提出原音频信号与水印信号相加的想法。将原音频信号进行小波分解,提取第三级低频分量,直接与水印信号相加。但是我们发现嵌入水印的音频信号还保留了不少水印信号的声音,波形变化也比较大,不能满足较好的鲁棒性,不能较好的满足水印设计的要求。在完成初步的水印嵌入后,我们并不满足于简单的相加算法。之后的大量是间,我都在和同学讨论新的算法——分段相加法。这个方法来源于小波分解,小波分解是将高低频率的信号进行分解,而我们是将时域上的信号进行分段。这个算法由我和同学自主研究,在结合了一些图像水印嵌入和小波分解的思想后,我们终于完成该算法,并顺利应用在信息量适中的音频信号中,水印嵌入效果良好,嵌入水印音频中水印信号声音几乎不可闻,具有较好的鲁棒性和透明性。并且避免了之前提到的维度不同无法相加的情况,因为我们一直是在一维数组的情况下对信息分段,不会出现多维情况。但实验结束后,我们对该算法仍然保有怀疑态度。该算法虽然采用较先进的思想,但是计算上还是比较传统。计

算数据量有所提高,但是并不能满足所有的音频信号。最后通过大量的课外学习,我和同学大胆提出量化的方法,量化的方式是将某段区间内接近1或0的数据向1或0靠拢,最后将他们分别合并到一个区间,最后只剩下1和0的区间,这使得计算量大量减少,并且计算出错率大幅减少。但是该算法及其复杂,我们在短时间内并不能将其完善,只是提出一个框架,并设计了一些量化的步骤和方式。由于时间原因,我们未能将采用量化思想的算法完成,对此我感到比较遗憾。但是在今后的学习中,量化的思想可以应用于较多的数字信息处理当中,这为我今后的学习提供了先进的方法。

本次课程设计,我能按照设计要求和目的,较好的完成任务。并且在多少情况下,具有自主研究的心态,并且感觉良好。也参与了较多个讨论,体会到了团队合作的快乐。在快乐的学习环境下完成了本次课程设计。并且对将来的数字信号处理学习奠定了良好的基础和浓厚的兴趣。

致谢

感谢给我这次锻炼的机会。感谢我的老师,严谨细致、一丝不苟的作风一直是我学习的榜样;循循善诱的教导和不拘一格的思路给予我无尽的启迪。老师多次询问研究进程,并为我指点迷津,帮助我开拓研究思路,精心点拨、热忱鼓励。无论是在程序的编写,还是在系统界面的设计上,我都得到了老师悉心细致的教诲和无私的帮助。多次为我指点迷津,帮助我开拓研究思路,精心点拨、热忱鼓励。渊博的专业知识,严谨的治学态度,精益求精的工作作风,诲人不倦的高尚师德,严以律己、宽以待人的崇高风范,朴实无华、平易近人的人格魅力对我影响深远。不仅使我树立了远大的学术目标、掌握了基本的研究方法,还使我明白了许多待人接物与为人处世的道理。在此,谨向指导老师们表示崇高的敬意和衷心的感谢!同时也要表达对淮阴工学院计算机工程学院实验室的工作人员表达我真挚的谢意,他们为我们提供良好的学习环境,为此次我们课程设计提供了很大的方便,再次对他们辛勤的工作表示感谢!在课程设计过程中,也得到了许多同学的宝贵建议和真诚的帮助,在此也对他们表示真诚的感谢!在这里我要对我的老师以及我的同学真挚的说一声:“谢谢!”没有你们的帮助,我可能要花费更多的时间与精力来完成这次课程设计,最后,对给过我帮助的所有同学和各位指导老师再次表示衷心的感谢!

参考文献

1丁玉美,高西全.数字信号处理.3版.西安:西安电子科技大学出版社,2011.3 2胡广书.数字信号处理—理论、算法与实现.北京:清华大学出版社,1998

3 A.V.奥本海姆,等. 刘树裳,译.西安:西安交通大学出版社,1985.5

4.数字信号处理:基于计算机的方法(第4版).北京:电子工业出版社,2012.1

5黎洪松,陈冬梅.数字视频与音频处理.北京:清华大学出版社.2011.11

6何子述.现代数字信号处理及其应用.北京:清华大学出版社2009.4

浅谈数字水印技术

浅谈数字水印技术 近几年, 许多研究人员放弃了传统密码学的技术路线, 尝试用各种信号处理方法对声像数据进行隐藏加密,并将该技术用于制作多媒体 的“数字水印”。数字水印技术是将一些标识信息即数字水印直接嵌入数字载体包括多媒体、文档、软件等当中,但不影响原载体的使用价值,也不容易被人的知觉系统如视觉或听觉系统觉察或注意到。人们通过隐藏在多媒体内容中的信息,能够了解到内容的原创者、内容的购买者、是否为正版、是否完整。 一般数字水印系统的通用模型包括嵌入和检测(提取)两个阶段。数字水印的嵌入阶段,嵌入算法的嵌入目标是使数字水印在不可见性和鲁棒性之间找到一个较好的折衷点。检测(提取)阶段主要是设计一个相应于嵌入过程的检测(提取)算法。检测算法一般是以基于统计原理的检验结果来判断水印存在与否,它的目标是使错判与漏判的概率尽量小。提取算法通过提取出水印(如字符串或图标等)并与原始水印进行比较以判断水印是否存在。并且,为了给攻击者增加去除水印的难度,目前大多数水印制作方案都在嵌入、检测(提取)时采用了密钥,只有掌握密钥的人才能读出水印。 (1)水印嵌入系统 其功能是把水印信息嵌入到原始图像中,为了能成功地提取水印信号,算法必须使水印对故意或非故意的袭击和失真(相当于信道噪声)具有鲁棒性。 (2)水印的恢复系统 其功能是完成从待检测图像中提取出水印信号。图2 描述了一般的水印恢复过程,其中置信度表明了所考察图像I′ 存在水印的可能性。

图2 数字水印恢复方案 1 数字水印的特点 数字水印应具有以下基本特征:(1)隐蔽性。指水印不可被察觉,不影响媒体产品的使用。(2)鲁棒性。指嵌入水印的图像在经受一定程度的各种有意或无意的图像处理攻击,水印仍能被检测出来。在某种程度上鲁棒性可以反映水印技术的抗干扰能力。(3)安全性。数字水印技术应该使用一个或多个密钥来确保自身的安全,未经授权,用户不能检测出隐藏在原始数据中的水印信息。(4)水印容量:是指载体在不发生形变的前提下可嵌入的水印信息量。嵌入的水印信息必须足以表示多媒体内容的创建者或所有者的标志信息,或购买者的序列号,这样有利于解决版权纠纷,保护数字产权合法拥有者的利益。尤其是隐蔽通信领域的特殊性,对水印的容量需求很大。 2 数字水印的应用 数字水印技术作为数字产品的保护技术,主要应用在这几个方面:(1)版权保护 版权保护:指的是多媒体数据产品的拥有者在公开发表自己的数据产品之前将会对数据产品嵌入隐秘的数字水印。在该多媒体数据产品遇到版权纠纷问题的时候,多媒体数据产品的拥有者就可以使用水印检测算法检测水印,以证明自己的版权归属。数字作品的版权保护是当前的热点问题,由于数字作品的拷贝、修改非常容易,因此原创者不得不加上损害作品的版权标志。数字水印利用其不可感知性,既保证了质量,又保护了数字作品。 (2)数字指纹 多媒体数据产品的拥有者可以在其产品拷贝中嵌入数字指纹,这样可以

基于Matlab的语音信号的特征提取与分类

基于Matlab的语音信号的特征提取与分类语音信号处理是研究数字信号处理技术和语音学知识对语音信号进行处理的新兴学科,是目前发展最为迅速的信息科学研究领域的核心技术之一。本文采用Matlab7.0综合运用GUI界面设计,各种函数调用等对语音信号进行采集、提取、变频、变幅,傅里叶变换、滤波等简单处理。程序界面简练,操作简便,具有一定的实际应用意义。 关键词:语音信号Matlab 信号处理GUI 1、语音信号的低通滤波 本文中设计了一个截止频率为200Hz切比雪夫—Ⅰ型低通滤波器,它的性能指标为:wp=0.075pi, ws=0.125pi, Rp=0.25;Rs=50dB。低通滤波器处理程序如下: [x,fs,bits]=wavread('voice.wav'); wp=0.075;ws=0.125;Rp=0.25;Rs=50; [N,Wn]=cheb1ord(wp,ws,Rp,Rs); [b,a]=cheby1(N,Rp,Wn); [b,a]=cheby1(N,Rp,Wn); X=fft(x); subplot(221);plot(x);title('滤波前信号的波形'); subplot(222);plot(X);title('滤波前信号的频谱'); y=filter(b,a,x); %IIR低通滤波 sound(y,fs,bits);%听取滤波后的语音信号

wavwrite(y,fs,bits,’低通’);%将滤波后的信号保存为“低通.wav” Y=fft(y); subplot(223);plot(y);title(' IIR滤波后信号的波形'); subplot(224);plot(Y);title(' IIR滤波后信号的频谱'); 经过低通滤波器处理后,比较滤波前后的波形图的变化 低通滤波后,听到声音稍微有些发闷,低沉,原因是高频分量被低通滤波器衰减。但是很接近原来的声音。 2、语音信号的高通滤波 运用切比雪夫—Ⅱ型数字高通滤波器,对语音信号进行滤波处理。高通滤波器性能指标:wp=0.6, ws=0.975 ,Rp=0.25;Rs=50dB。高通滤波器处理程序如下: [x,fs,bits]=wavread('voice.wav'); wp=0.6;ws=0.975;Rp=0.25;Rs=50;

语音信号处理答案

二、问答题(每题分,共分) 、语音信号处理主要研究哪几方面的内容? 语音信号处理是研究用数字信号处理技术对语言信号进行处理的一门学科,语音信号处理的理论和研究包括紧密结合的两个方面:一方面,从语言的产生和感知来对其进行研究,这一研究与语言、语言学、认知科学、心理、生理等学科密不可分;另一方面,是将语音作为一 种信号来进行处理,包括传统的数字信号处理技术以及一些新的应用于语音信号的处理方法 和技术。 、语音识别的研究目标和计算机自动语音识别的任务是什么? 语音识别技术,也被称为自动语音识别,(),其目标是将人类的语音中的词汇内容转换为 计算机可读的输入,例如按键、二进制编码或者字符序列。 计算机自动语音识别的任务就是让机器通过识别和理解过程把语音信号转变为相应的文本 或命令的高技术。 、语音合成模型关键技术有哪些? 语音合成是实现人机语音通信,建立一个有听和讲能力的口语系统所需的两项关键技术,该系统主要由三部分组成:文本分析模块、韵律生成模块和声学模块。.如何取样以精确地抽取人类发信的主要特征,.寻求什么样的网络特征以综合声道的频率响应,.输出合成声音的质量如何保证。 、语音压缩技术有哪些国际标准? 二、名词解释(每题分,共分) 端点检测:就从包含语音的一段信号中,准确的确定语音的起始点和终止点,区分语音信号和非语音信号。 共振峰:当准周期脉冲激励进入声道时会引起共振特性,产生一组共振频率,称为共振峰频率或简称共振峰。 语谱图:是一种三维频谱,它是表示语音频谱随时间变化的图形,其纵轴为频率,横轴为时间,任一给定的频率成分在给定时刻的强弱用相应点的灰度或色调的浓淡来表示。 码本设计:就是从大量信号样本中训练出好的码本,从实际效果出发寻找好的失真测度定义 公示,用最少的搜素和计算失真的运算量。 语音增强:语音质量的改善和提高,目的去掉语音信号中的噪声和干扰,改善它的质量 三、简答题(每题分,共分) 、简述如何利用听觉掩蔽效应。 一个较弱的声音(被掩蔽音)的听觉感受被另一个较强的声音(掩蔽音)影响的现象称为人耳的“掩蔽效应”。人耳的掩蔽效应一个较弱的声音(被掩蔽音)的听觉感受被另一个较强的声 音(掩蔽音)影响的现象称为人耳的“掩蔽效应”。被掩蔽音单独存在时的听阈分贝值,或者 说在安静环境中能被人耳听到的纯音的最小值称为绝对闻阈。实验表明,—绝对闻阈值最小,即人耳对它的微弱声音最敏感;而在低频和高频区绝对闻阈值要大得多。在范围内闻阈随频率变化最不显著,即在这个范围内语言可储度最高。在掩蔽情况下,提高被掩蔽弱音的强度, 使人耳能够听见时的闻阈称为掩蔽闻阈(或称掩蔽门限),被掩蔽弱音必须提高的分贝值称为 掩蔽量(或称阈移)。 、简述时间窗长与频率分辨率的关系。 采样周期、窗口长度和频率分辨率△之间存在下列关系:△(*) 可见,采样周期一定时,△随窗口宽度的增加而减少,即频率分辨率相应得到提高,但同时时间分辨率降低;如果窗口取短,频率分辨率下降,而时间分辨率提高,因而二者是矛盾的。 、简述时域分析的技术(最少三项)及其在基因检测中的应用。()

基于小波分析的音频数字水印技术研究

广东工业大学 硕士学位论文 基于小波分析的音频数字水印技术研究 姓名:温洁嫦 申请学位级别:硕士 专业:软件工程 指导教师:凌捷;李伯基 20050501

摘要 随着多媒体技术及网络技术的飞速发展,人们对数字产品的获取极为迅捷方便,但是这些数字产品的原创者的版权与经济利益如何得到保障?数字产品是否安全、可信?围绕这一问题,近几年国际上提出了一种新的有效的数字产品版权保护和安全性维护的新技术——数字水印(Digitalwatermark)技术。 在数字产品中,音频数据产品的版权保护也显得越来越重要,因为随着数字化音像制品和音乐制品的大量制作与发行,一个令人关注的突出问题是网上下载音乐对传统cD业的邑大冲击。音频数字水印技术是一种在开放的网络环境下保护版权和认证来源及完整性的新技术,通过在合法产品中嵌入水印,以达到阻止在非法装置上播放及控制复制的目的。 本文首先回顾了数字水印技术的发展历史,介绍了数字水印的一些基本问题,归纳了数字水印系统的基本框架。 然后重点分析了音频数字水印技术,按照“经典的音频数字水印技术”、“变换域的音频数字水印技术”和“压缩域的音频数字水印技术”这三大类进行了分析、对比和总结。 随后,介绍了小波变换思想,总结了小波变换域的音频数字水印方案,并提出了一种改进的基于小波变换的音频数字水印算法,该算法具有良好的鲁棒性,并且嵌入水印后的音频信号没有引起人耳所感知到的品质变化。算法能抵抗常见的信号处理和音频压缩编码。 沧文最后讨论了音频数字水印技术进一步的研究方向。 关键词:音频数字水印;小波变换;低频系数

ABSTRACT DigitalproductsarcobtainedmoreandmoreeasilyandconVenientlywimthe r印idprogressofimemet趾dmultimediateclln0109ylWhercaShowtoprotect山e copyrightandeconomicbenemofⅡ1eautllorshipofdigitalproductsandwhethertheproductssecllreorcredible?Inrecentyears,anewtechnologynameddigitalwatermarkingisprcseDtedtoprotect也ecopyrightandsafetyofdigitalproducts.Protectingofdigitalaudiopmductshasbeenmoreandmoreimportant.Winltransmissionofd噜italaudioproducts,anoutstandingproblemisthei加pingementofmusicdownloadedfromnetWorkon仃aditiona】Co瑚pactDiscindusnyAudiodigitalwate丌narkingisanewtechnologytopmtectcopyrightandaccoInplishauthenticationandinte掣崎in叩enne觚orks. I且misthesis,nrstlywereViewthedevelopmenthistoryofd远italwatennark,introdllcesomebasicissuesandconcludeme疗锄eworkofembeddinganddetectionsystem. Then,inChapter3,weemphasizeonanalyzingaudiodi垂协1waterrnarking.Classicalaudiodigitalwate瑚ark,audiodigitalwatennarkbasedoⅡtransfonlldomainandcompressiondomainareanalyzed,comparedandsmn眦rized. wavelet咖sfo咖isin打oduced,andmeNext,inChapter4,theideaof wavelet-basedaudiodi西talwatermar咖gschemesaresmnmarized,andthenan wavelet姐nsf0Hnisimprovedaudiodigitalwatermarkingalgorithmbasedon presented.Theexperimentresultsindicate廿lat出eak喊thmhasgoodinVisibmtyandrobusmessandcanresistfhIniliarsi萨a1processingaDdaudio舶quencycompressionencoding Final】yfuturedirectionsformestudyarediscussed. KEYwoRDS:Audiodigitalwatemar岫ng;Wavelet廿ansform;Coe硒cientsoflow缸_cquency

数字水印技术:概念、应用及现状

数字水印技术:概念、应用及现状 一、引言 随着信息时代的到来,特别是Internet的普及,信息的安全保护问题日益突出。当前的信息安全技术基本上都以密码学理论为基础,无论采用传统的密钥系统还是公钥系统,其保护方式都是控制文件的存取,即将文件加密成密文,使非法用户不能解读。但随着计算机处理能力的快速提高,这种通过不断增加密钥长度来提高系统秘密级别的方法变得越来越不安全。 另一方面,多媒体技术已被广泛应用,需要进行加密、认证和版权保护的声像数据也越来越多。数字化的声像数据从本质上说就是数字信号,如果对这类数据也采用密码加密方式,则其本身的信号属性就被忽略了。最近几年,许多研究人员放弃了传统密码学的技术路线,尝试用各种信号处理方法对声像数据进行隐藏加密,并将该技术用于制作多媒体的“数字水印”。 二、认识数字水印 数字水印(Digital Watermark)技术是指用信号处理的方法在数字化的多媒体数据中嵌入隐蔽的标记,这种标记通常是不可见的,只有通过专用的检测器或阅读器才能提取。数字水印是信息隐藏技术的一个重要研究方向。 数字水印技术的基本特性: 1. 鲁棒性(robustness):所谓鲁棒性是指在经历多种无意或有意的信号处理过程后,数字水印仍能保持完整性或仍能被准确鉴别。可能的信号处理过程包括信道噪声、滤波、数/模与模/数转换、重采样、剪切、位移、尺度变化以及有损压缩编码等。 2.安全性(security):指隐藏算法有较强的抗攻击能力,即它必须能够承受一定程度的人为攻击,而使隐藏信息不会被破坏。 3.透明性(invisibility):利用人类视觉系统或人类听觉系统属性,经过一系列隐藏处理,使目标数据没有明显的降质现象,而隐藏的数据却无法人为地看见或听见。 ***典型的数字水印系统模型: 图 1为水印信号嵌入模型,其功能是完成将水印信号加入原始数据中;图 2为水印信号检测模型,用以判断某一数据中是否含有指定的水印信号。

数字水印基本原理

介绍了数字水印技术的基本原理 随着信息技术和计算机网络的飞速发展,人们不但可以通过互联网和CD-ROM方便快捷地获得多媒体信息,还可以得到与原始数据完全相同的复制品,由此引发的盗版问题和版权纷争已成为日益严重的社会问题。因此,数字多媒体产品的水印处理技术已经成为近年来研究的热点领域之一。 虽然数字水印技术近几年得到长足发展,但方向主要集中于静止图像。由于包括时间域掩蔽效应等特性在内的更为精确的人眼视觉模型尚未完全建立,视频水印技术的发展滞后于静止图像水印技术。另一方面,由于针对视频水印的特殊攻击形式的出现,为视频水印提出了一些区别于静止图像水印的独特要求。 本文分析了MPEG-4视频结构的特点,提出了一种基于扩展频谱的视频数字水印改进方案,并给出了应用实例。 1视频数字水印技术简介 1.1数字水印技术介绍 数字水印技术通过一定的算法将一些标志性信息直接嵌入到多媒体内容当中,但不影响原内容的价值和使用,并且不能被人的感知系统觉察或注意到。与传统的加密技术不同,数字水印技术并不能阻止盗

版活动的发生,但可以判别对象是否受到保护,监视被保护数据的传播,鉴别真伪,解决版权纠纷并为法庭提供认证证据。为了给攻击者增加去除水印的难度,目前大多数水印制作方案都采用密码学中的加密体系来加强,在水印嵌入、提取时采用一种密钥,甚至几种密钥联合使用。水印嵌入和提取的一般方法如图1所示。 1.2视频数字水印设计应考虑的几个方面 ·水印容量:嵌入的水印信息必须足以标识多媒体内容的购买者或所有者。 ·不可察觉性:嵌入在视频数据中的数字水印应该不可见或不可察觉。·鲁棒性?押在不明显降低视频质量的条件下,水印很难除去。 ·盲检测:水印检测时不需要原始视频,因为保存所有的原始视频几乎是不可能的。 ·篡改提示:当多媒体内容发生改变时,通过水印提取算法,能够敏感地检测到原始数据是否被篡改。 1.3视频数字水印方案选择 通过分析现有的数字视频编解码系统,可以将目前MPEG-4视频水印的嵌入与提取方案分为以下几类,如图2所示。

语音信号数字水印技术

数字信号处理课程设计报告 题目:语音信号水印技术系统设计 系(院): 专业: 班级: 学号: 姓名: 指导教师: 学年学期: 2013 ~ 2014 学年第学期 2013年月日

摘要 随着网络和信息技术的发展,越来越多的数字多媒体信息通过网络进行传播,与传统的模拟媒体相比,数字媒体产品的编辑、复制和传播都很方便,它一方面促进了社会的进步与发展,另一方面正是这些优点突出了版权问题。由于数字多媒体信息很容易被未经授权的用户复制,且采用传统密码方法加密,不能完全解决盗版问题。 数字水印技术正是应运而生的信息隐藏技术,它通过特定的水印算法把版权信息嵌入在数字产品中,被嵌入的可以是一段文字、标识、序列号等等,人们无法从表面上感知水印的存在,只有专用的检测仪器或计算机软件才可以检测出隐藏的数字水印,从而达到了保护数字作品的所有者利益的目的,并促进了数字产品的开发与使用。在数字产品中,音频数据产品的版权保护也显得越来越重要,因为随着数字化音像制品和音乐制品的大量制作与发行,一个令人关注的突出问题是网上下载音乐对传统CD 业的巨大冲击。音频水印技术主要利用了人类听觉模型,在不影响音频信号质量的前提下,将水印信息隐藏在人耳不能感知的位置,来隐藏水印数据。本文主要研究语音信号水印技术,利用小波变换的优点和特性对音频信号嵌入水印,并提取。使嵌入水印音频想好具有良好的安全性,鲁棒性和不可感知性。 关键词数字水印嵌入提取小波变换

目录 1 课题综述 (1) 1.1 数字水印技术的介绍 (1) 1.2 数字水印设计原理 (2) 2 系统分析与设计 (3) 2.1 涉及基础知识 (3) 2.2 算法的流程图 (5) 2.3 算法实现 (5) 3 代码编写 (7) 3.1 主要代码 (7) 3.2 程序调试 (10) 3.3 程序运行与测试 (10) 结论 (14) 致谢 (16) 参考文献 (17)

基于MATLAB的语音信号处理系统设计(程序+仿真图)--毕业设计

语音信号处理系统设计 摘要:语音信号处理是研究用数字信号处理技术对语音信号进行处理的一门学科。语音信号处理的目的是得到某些参数以便高效传输或存储,或者是用于某种应用,如人工合成出语音、辨识出讲话者、识别出讲话内容、进行语音增强等。本文简要介绍了语音信号采集与分析以及语音信号的特征、采集与分析方法,并在采集语音信号后,在MATLAB 软件平台上进行频谱分析,并对所采集的语音信号加入干扰噪声,对加入噪声的信号进行频谱分析,设计合适的滤波器滤除噪声,恢复原信号。利用MATLAB来读入(采集)语音信号,将它赋值给某一向量,再将该向量看作一个普通的信号,对其进行FFT变换实现频谱分析,再依据实际情况对它进行滤波,然后我们还可以通过sound命令来对语音信号进行回放,以便在听觉上来感受声音的变化。 关键词:Matlab,语音信号,傅里叶变换,滤波器 1课程设计的目的和意义 本设计课题主要研究语音信号初步分析的软件实现方法、滤波器的设计及应用。通过完成本课题的设计,拟主要达到以下几个目的: 1.1.了解Matlab软件的特点和使用方法。 1.2.掌握利用Matlab分析信号和系统的时域、频域特性的方法; 1.3.掌握数字滤波器的设计方法及应用。 1.4.了解语音信号的特性及分析方法。 1.5.通过本课题的设计,培养学生运用所学知识分析和解决实际问题的能力。 2 设计任务及技术指标 设计一个简单的语音信号分析系统,实现对语音信号时域波形显示、进行频谱分析,

利用滤波器滤除噪声、对语音信号的参数进行提取分析等功能。采用Matlab设计语言信号分析相关程序,并且利用GUI设计图形用户界面。具体任务是: 2.1.采集语音信号。 2.2.对原始语音信号加入干扰噪声,对原始语音信号及带噪语音信号进行时频域分析。 2.3.针对语音信号频谱及噪声频率,设计合适的数字滤波器滤除噪声。 2.4.对噪声滤除前后的语音进行时频域分析。 2.5.对语音信号进行重采样,回放并与原始信号进行比较。 2.6.对语音信号部分时域参数进行提取。 2.7.设计图形用户界面(包含以上功能)。 3 设计方案论证 3.1语音信号的采集 使用电脑的声卡设备采集一段语音信号,并将其保存在电脑中。 3.2语音信号的处理 语音信号的处理主要包括信号的提取播放、信号的重采样、信号加入噪声、信号的傅里叶变换和滤波等,以及GUI图形用户界面设计。 Ⅰ.语音信号的时域分析 语音信号是一种非平稳的时变信号,它携带着各种信息。在语音编码、语音合成、语音识别和语音增强等语音处理中无一例外需要提取语音中包含的各种信息。语音信号分析的目的就在与方便有效的提取并表示语音信号所携带的信息。语音信号分析可以分为时域和变换域等处理方法,其中时域分析是最简单的方法。 Ⅱ.语音信号的频域分析 信号的傅立叶表示在信号的分析与处理中起着重要的作用。因为对于线性系统来说,可以很方便地确定其对正弦或复指数和的响应,所以傅立叶分析方法能完善地解决许多信号分析和处理问题。另外,傅立叶表示使信号的某些特性变得更明显,因此,它能更

音频数字水印报告+matlab程序

音频数字水印 目录 1课题背景与现状 (2) 2研究的目的和意义 (4) 3方案设计和实施计划 (8) 4研究的主要内容 (10) 5创新点和结论 (10) 6成果的应用前景 (11) 7附录:个人工作总结 ................................................................................................ 错误!未定义书签。

1课题背景与现状 数字时代的到来,多媒体数字世界丰富多彩,数字产品几乎影响到每一个人的日常生活。信息媒体的数字化为信息的存取提供了极大的便利,同时也显著地提高了信息表达的效率和准确度。计算机网络通信技术特别是互联网的蓬勃发展,使得数据的交换和传输变成了一个相对简单且快捷的过程。人们借助于计算机、数字扫描仪、打印机等电子设备可以方便、迅速地将数字信息传达到世界各地,在国际互联网上发布自己的作品,传递重要的信息,进行各种学术交流和电子商务活动等等。如何保护这些与我们息息相关的数字产品,如版权保护、信息安全、数据认证以及访问控制等等,已受到日益重视并变得迫切需要了,因此数字水印在今天的计算机和互联网时代大有可为。 数字水印技术是近十年才发展起来的,它是信息隐藏学的一个分支。随着国内信息化程度的提高和电子商务逐渐走向实用,数字水印技术将会拥有更加广阔的应用前景。鉴于信息隐藏与数字水印技术的应用前景,众多知名研究机构如麻省理工学院的多媒体实验室、剑桥大学的多媒体实验室、IBM数字实验室、日立、NEC、SONY,PHILIPS、微软等都加入到信息隐藏和数字水印技术的研究和应用并取得了一定的成果。1996年5月,第一届国际信息隐藏学术研讨会(CIHW)在英国剑桥牛顿研究所召开,至今该研讨会已举办了四届。另外,在IEEE

语音信号特征的提取

语音信号特征的提取 摘要 随着计算机技术的发展,语音交互已经成为人机交互的必要手段,语音特征参数的精确度直接影响着语音合成的音质和语音识别的准确率。因此语音信号参数提取是语音信号处理研究中一项非常有意义的工作。 本文采用Matlab软件提取语音信号特征参数,首先对语音信号进行数字化处理,其次,进行预处理,包括预加重、加窗和分帧,本文讨论了预处理中各种参数的选择,以使信号特征提取更加准确。第三,讨论了各种时域特征参数的算法,包括短时能量、短时过零率等。 关键词:语音信号, 特征参数, 提取, Matlab 目录 第一章绪论 1.1语音信号特征提取概况 1.1.1研究意义 语音处理技术广泛应用于语音通信系统、声控电话交换、数据查询、计算机控制、工业控制等领域,带有语音功能的计算机也将很快成为大众化产品,语音将可能取代键盘和鼠标成为计算机的主要输入手段,为用户界面带来一次飞跃。 语音信号特征的提取是语音信号处理的前提和基础,只有分析出可表示语音信号本质特征的参数,才有可能利用这些参数进行高效的语音通信和准确的语音识别,才能建立语音合成的语音库。因此语音信号参数提取是语音信号处理研究中一项非常有意义的工作。 1.1.2 发展现状 语音信号处理是一门综合性的学科,包括计算机科学、语音学、语言学、声学和数学等诸多领域的内容。它的发展过程中,有过两次飞跃。第一次飞跃是1907年电子管的发明和1920年无线电广播的出现,电子管放大器使很微弱的声

音也可以放大和定量测量,从而使电声学和语言声学的一些研究成果扩展到通信和广播部门;第二次飞跃是在20世纪70年代初,电子计算机和数字信号处理的发展使声音信号特别是语音信号,可以通过模数转换器(A/D)采样和量化转换为数字信号,这样就可以用数字计算方法对语音信号进行处理和加工,提高了语音信号处理的准确性和高效性。 语音信号处理在现代信息科学中的地位举足轻重,但它仍有些基础的理论问题和技术问题有待解决,这些难题如听觉器官的物理模型和数学表示及语音增强的技术理论等,目前还有待发展。 1.2 本课题研究内容 本文主要介绍语音信号处理的理论及Matlab的相关内容,然后从Matlab仿真角度验证了录音、预处理、提取语音信号时域特征参数,主要讨论了预处理中各种参数的选择,以使信号特征提取更加准确。再次讨论了各种时域特征参数的算法,包括短时能量、短时过零率等,介绍了各环节的不同软件实现方法。最后对基于Matlab的语音信号特征参数提取进行总结。 第二章Matlab简介 MATLAB是国际上仿真领域最权威、最实用的计算机工具。它是MathWork 公司于1984年推出,它以强大的科学计算与可视化功能、简单易用、开放式可扩展环境,特别是所附带的30多种面向不同领域的工具箱支持,使得它在许多科学领域中成为计算机辅助设计和分析、算法研究和应用开发的基本工具和首选平台。 2.1 发展概况 Matlab是Matrix Laboratory(矩阵实验室的缩写),最初由美国Cleve Moler 博士在70年代末讲授矩阵理论和数据分析等课程时编写的软件包Linpack与Eispack组成,旨在使应用人员免去大量经常重复的矩阵运算和基本数学运算等繁琐的编程工作。1984年成立的Math Works公司正式把Matlab推向市场,并从事Matlab的研究和开发。1990年,该公司推出了以框图为基础的控制系统仿真工具Simulink,它方便了系统的研究与开发,使控制工程师可以直接构造系统框图进行仿真,并提供了控制系统中常用的各种环节的模块库。1993年,Math Works 公司推出的Matlab4.0版在原来的基础上又作了较大改进,并推出了Windows版,

语音信号处理 (第2版)赵力 编著 语音信号处理勾画要点

语音信号处理(第2版)赵力编著 重点考点 第2章语音信号处理的基础知识 1.语音(Speech)是声音(Acoustic)和语言(Language)的组合体。可以这样定义语音:语音是由一连串的音组成语言的声音。 2.人的说话过程可以分为五个阶段:(1)想说阶段(2)说出阶段(3)传送阶段(4)理解阶段(5)接收阶段。 3.语音是人的发声器官发出的一种声波,它具有一定的音色,音调,音强和音长。其中,音色也叫音质,是一种声音区别于另一种声音的基本特征。音调是指声音的高低,它取决于声波的频率。声音的强弱叫音强,它由声波的振动幅度决定。声音的长短叫音长,它取决于发音时间的长短。 4.说话时一次发出的,具有一个响亮的中心,并被明显感觉到的语音片段叫音节(Syllable)。一个音节可以由一个音素(Phoneme)构成,也可以由几个音素构成。音素是语音发音的最小单位。任何语言都有语音的元音(Vowel)和辅音(Consonant)两种音素。 5.元音的另一个重要声学特性是共振峰(Formant)。共振峰参数是区别不同元音的重要参数,它一般包括共振峰频率(Formant Frequency)的位置和频带宽度(Formant Bandwidth)。 6.区分语音是男声还是女声、是成人声音还是儿童声音,更重要的因素是共振峰频率的高低。 7.浊音的声带振动基本频率称基音周期(或基音频率),F0表示。 8.人的听觉系统有两个重要特性,一个是耳蜗对于声信号的时频分析特性;另一个是人耳听觉掩蔽效应。 9.掩蔽效应分为同时掩蔽和短时掩蔽。 10.激励模型:一般分成浊音激励和清音激励。浊音激励波是一个以基音周期为周期的斜三角脉冲串。 11.声道模型:一是把声道视为由多个等长的不同截面积的管子串联而成的系统。按此观点推导出的叫“声管模型”。另一个是把声道视为一个谐振腔,按此推导出的叫“共振峰模型”。 12.完整的语音信号的数字模型可以用三个子模型:激励模型、声道模型和辐射模型的串联来表示。 13.语谱图:人们致力于研究语音的时频分析特性,把和时序相关的傅立叶分析的显示图形。 第三章语音信号分析 1.贯穿于语音分析全过程的是“短时分析技术”。 2.语音信号的数字化一般包括放大及增益控制、反混叠滤波、采样、A/D变换及编码(一般就是PCM码);预处理一般包括预加重、加窗和分帧等。 3.预滤波的目的有两个:

音频数字水印中回声隐藏技术的时域提取方法

万方数据

万方数据

万方数据

音频数字水印中回声隐藏技术的时域提取方法 作者:殷凯, 周辉, Yin Kai, Zhou Hui 作者单位:装备指挥技术学院电子装备系,北京,101416 刊名: 计算机与数字工程 英文刊名:COMPUTER & DIGITAL ENGINEERING 年,卷(期):2006,34(5) 被引用次数:2次 参考文献(5条) 1.贾艳阳;杨震语音回声隐藏技术及分析[期刊论文]-南京邮电学院学报 2003(09) 2.杨榆;白剑回声隐藏的研究与实现[期刊论文]-中山大学学报(自然科学版) 2004(11) 3.L Boney;A Tewfik;K Hamdy Digital Watermark for Audio Singals 1996 4.J D Gordy;L T Bruton Performance Evaluation of Digital Audio Watermarking Algorithms 2000 5.Xin Li;Hong Heather Yu Transparent and Robust Audio Data Hiding in Cepstrum domain 2000 引证文献(2条) 1.吴迪.朱冰莲数字音频水印技术研究综述[期刊论文]-电声技术 2009(2) 2.侯丽萍.李清玲.吴海燕音频数字水印技术及算法研究[期刊论文]-电脑知识与技术(学术交流) 2007(8)本文链接:https://www.360docs.net/doc/3718695407.html,/Periodical_jsjyszgc200605025.aspx

数字水印技术综述

数字水印技术综述 【摘要】本文介绍了数字水印技术的基本原理。并对其特点、分类、攻击技术及应用领域进行了阐述,同时对数字水印的各种算法进行了分类研究与深入分析,最后指出数字水印今后的研究方向。 【关键词】数字水印;水印原理;水印算法;水印应用 1什么是数字水印 所谓数字水印(digital watermark)技术是指用信号处理的方法在数字化的多媒体数据中嵌入隐蔽的标记,这种标记通常是不可见的,只有通过专用的检测器或阅读器才能提取。比如我们通过一定的算法,在图像、视频、音频等多媒体数据中嵌入一个可以标示其知识产权的水印信息。水印信息可以是文字、商标、印章或序列号等可以识别作品的作者、来源、版本、拥有者、发行人或合法使用人对数字产品的拥有权。水印信息通过特殊的方式,可以从宿主信号中提取出水印或是检测出它的存在性。这样的水印不占用额外的带宽,是原始数据不可分离的一部分,并且它可以经历一些不破坏源数据使用价值或商用价值的操作而存活下来。 2数字水印的特点 一般认为数字水印应具有以下特征:(1)鲁棒性:水印信号在经历多种无意或有意的信号处理后,仍能保持其完整性或仍能被准确鉴别的特性。(2)知觉透明性:数字水印的嵌入不应引起数字作品

的视/听觉质量下降,即不向原始载体数据中引入任何可知觉的附加数据。(3)水印容量(水印的位率):数字水印应该能够包含相当的数据容量,以满足多样化的要求。(4)安全性:水印嵌入过程(嵌入方法和水印结构)应该是秘密的,数字水印是统计上不可检测的,非授权用户无法检测和破坏水印。对于通过改变水印图像来消除和破坏水印的企图,水印应该能一直保持存在,直到图像已严重失真而丧失使用价值。(5)实现复杂度低:数字水印算法应该容易实现。在某些应用场合(如视频水印),甚至要求水印算法的实现满足实时性要求。(6)确定性:数字水印所携带的信息能够被唯一地、确定地鉴别,从而能够为已经受到版权保护的信息产品提供完全和可靠的所有权归属证明的证据。 3数字水印的分类 数字水印按照嵌入的位置可分为空域数字水印、变换域数字水印;按照水印的检测方式可分为私有水印、半私有水印和公开水印;按照水印的抗攻击能力可分为易损水印、鲁棒水印;按照水印的选取形式可分为序列水印、标识信息水印、标志图像水印;按照水印的可见性可分为可见水印、不可见水印;按照载体数据的性质可以将数字水印划分为图像水印、音频水印、视频水印、文本水印等等。4数字水印的基本原理 数字水印包含两个基本方面:水印的嵌入和水印的提取或检测。水印可由多种模型构成,如随机数字序列、数字标识、文本以及图

《语音信号处理》实验3-LPC特征提取

华南理工大学《语音信号处理》实验报告 实验名称:LPC特征提取 姓名: 学号: 班级:10级电信5班 日期:2013年5 月24日

1. 实验目的 1、熟练运用MATLAB 软件进行语音信号实验; 2、熟悉短时分析原理、LPC 的原理; 3、学习运用MATLAB 编程进行LPC 的提取; 4、学会利用短时分析原理提取LPC 特征序列。 2. 实验原理 1、LPC 分析基本原理 LPC 分析为线性时不变因果稳定系统V (z )建立一个全极点模型,并利用均方误差准则,对已知的语音信号s(n)进行模型参数估计。 如果利用P 个取样值来进行预测,则称为P 阶线性预测。假P 个 取样值()()(){ } 1,2,S n S n S n p --- 的加权之和来预测信号当前取样值()S n ,则预测 信号()S n ∧ 为: ()() 1 p k k S n a n k ∧==-∑ (1) 其中加权系数用k a 表示,称为预测系数,则预测误差为: ()()()()() 1 p k k e n s n S n s n a n k ∧ ==-=--∑ (2) 要使预测最佳,则要使短时平均预测误差最小有: ()2 min E e n ε??==?? (3) ()20,(1) k e n k p a ????? =≤≤? (4) 令 ()()(),,i k E s n i S n k φ=--???? (5) 最小的ε可表示成: ()() min 10,00,p k k a k εφφ==-∑ (6) 显然,误差越接近于零,线性预测的准确度在均方误差最小的意义上为最佳,由此可以计算出预测系数。 通过LPC 分析,由若干帧语音可以得到若干组LPC 参数,每组参数形成一个

语音信号处理

语音信号处理 ——语音信号的清、浊音分析 班级: 姓名: 学号: 时间:2014年9月22日

1 实验目的 通过Matlab 编程实现语音信号的时域波形图,并观察清音、浊音信号的时域特点。掌握语音信号的时域分析技术,如短时平均能量、短时平均幅度、短时平均过零率分析、短时平均自相关、短时平均幅度差。 2 实验原理 语音信号是一种非平稳的时变信号,它携带着各种信息。在语音编码、语音合成、语音识别和语音增强等语音处理中无一例外需要提取语音中包含的各种信息。语音信号分析的目的就在与方便有效的提取并表示语音信号所携带的信息。语音信号分析可以分为时域和变换域等处理方法,其中时域分析是最简单的方法,直接对语音信号的时域波形进行分析,提取的特征参数主要有语音的短时能量,短时平均过零率,短时自相关函数等。 3 实验过程 1)观察信号波形图 信号的采样周期为20kHz ,图中幅度较大的为浊音,幅度较小的为清音。 2)计算语音信号的短时能量、短时平均幅度并画图 1 20()N n n m E x m -==∑ 1 0|()|N n n m M x m -==∑

由于语音信号的能量随时间变化,清音和浊音之间的能量差别显著。平均幅度函数没有平方运算,因此动态范围比短时能量小,接近于标准能量计算的动态范围的平方根。虽然都可以用来区分清、浊音,但短时平均幅度的清浊音幅度差没有短时能量明显。 3)计算信号的短时平均过零率并画图 1 1{|sgn[()]sgn[(1)]|}2N n n m Zn x m x m -==--∑

过零率可以反映信号的频谱特性。高频率对应着高过零率,低频对应着低过零率。浊音过零率低,清音的过零率低。 4)分别取语音信号的清、浊音部分,分析其短时自相关函数 1 0()()()N k n n n m R k x m x m k --== +∑ 分别取小段浊音、清音信号,计算其短时自相关函数。浊音的自相关函数呈现出周期性,有明显突出的峰值,在80个采样点附近,其基因周期: T=(1/fs)*80=(1/20000)*80=3ms ; 清音的短时自相关函数没有周期性,也不具有明显突出的峰值,其性质类似于噪声。 5)计算语音信号的短时平均幅度差函数并画图 1 0()|()()|N k n n n m F k x m x m k --== -+∑

数字水印技术研究

1. 引言 1.1 数字水印技术提出的背景 二十一世纪是数字时代,通信技术的迅速发展和计算机网络的普遍运用,使人们可以通过互联网收发信息,可以随时上传自己创作的数字图象、音乐、视频等作品,可以进行学术交流。 然而,也正是由于网络的这种便捷性、传播迅速的优点使其很容易被非法拷贝,导致数字产品的版权、完整性、有效性得不到保证,严重损害了创作者的利益。而一些具有特殊意义的数字信息,如涉及司法诉讼、政府机要等信息,更是遭到了不法分子地恶意攻击和随意篡改等,这一系列问题给当今科学家带来了巨大挑战。 基于以上类似问题,数字水印技术可以说是信息时代的特有产物,是一种可以在开放网络环境下保护版权和认证来源及保障信息完整性的新型技术,在音频、图像、视频制品中迅速得到广泛的研究和发展。 1.2 数字水印的基本特点 数字水印是加在数字图象、音频或视频中的微弱信号,这个信号是人们能够建立产品所有权、辨认购买者或提供数字产品的一些额外信息。具体说来,它们都具有以下共同的特征: 1. 不可感知性 对于数字水印的嵌入,应该对观察者没有视觉障碍,理想情况应该是水印图像与原始图像没有丝毫差别。 2. 鲁棒性 鲁棒性是指一个数字水印能够承受攻击的能力,一般来说数字水印方法是针对特定的攻击进行设计。 3. 安全性 水印技术的安全性是其最重要的特性,由于它的商业性,其算法必须公开,算法的安全性完全取决于密钥,而不对算法进行保密。 4. 计算复杂度 不同应用中,对于水印的嵌入算法和提取算法的计算复杂度要求是不同的,复杂度直接与水印系统的实时性相关。 5. 水印容量

水印容量是指载体数据字中可嵌入水印信息位的多少,可以从几兆到几个比特不等。 1.3 数字水印的应用]1[ 数字水印是以不可感知的方式嵌入到数字信息中的,总体来说它有以下应用:数字产品产权保护 这是数字水印最广泛的应用,将秘密的数字信号嵌入到有价值的数字文件中,这些数字信号是产权的标识,在不破坏数字文件的情况下不能被盗版者出去,起到了保护产权的作用。 1. 数据库标识 有时一些文件中提示数据的标识信息往往比文件本身更重要或者一些音像文件需要将说明注释(如字幕等)与音像本身结合起来,这就可以通过数字水印技术加以解决。 2. 文件内容鉴定 水印技术在鉴定数据建立者和鉴别数据内容有着特殊的运用,目的是检测数据是否被修改过或是否经过特殊的处理。 3. 系统升级 日常生活中常常涉及到旧装系统升级情况,这可以通过将“增强层”嵌入到所发送的数据中来给传统的信号发射系统升级。 4. 商务交易中的票据防伪 随着高质量图像输入输出设备的发展,使得货币、支票以及其他票据的伪造变得更加容易。目前,美国、日本以及荷兰都已开始研究用于票据防伪的数字水印技术。 5. 媒体侦破 这一运用的目的是提取对原始信号进行处理过的信息。例如,鉴定方法可以发现一幅图像被篡改过,但无法发现是怎样篡改的。媒体侦破技术就可以指出图像的哪部分被篡改了,指出被插入到原图像中的新对象等等。 1.4 数字水印技术的研究动态 随着多媒体技术和因特网技术的迅猛发展,一系列有关产权保护和信息安全的问题等亟待人们解决。数字水印技术便是二十世纪九十年代初出现的为解决这些问题的一门崭新的技术,也是近几十年来国内外专家和学者研究的一大热点。

语音信号特征参数提取方法

语音信号特征参数提取方法 阮雄飞微电子学与固体电子学 摘要:在语音技术的发展过程中使用了大量的语音信号特征参数, 好的语音信号特征参数能对语音识别起至关重要的作用。本文对语音信号特征参数提取方法以及国内外研究现状进行了介绍,最后介绍了Hilbert-Huang 这一新兴理论成果以及在特征提取中的应用。 关键词:语音技术特征提取HHT 1 引言 语音信号是一种短时平稳信号,即时变的,十分复杂,携带很多有用的信息,这些信息包括语义、个人特征等,其特征参数的准确性和唯一性将直接影响语音识别率的高低,并且这也是语音识别的基础[1]。特征参数应该能够比较准确地表达语音信号的特征具有一定的唯一性。 上世纪40年代,potter等人提出了“visiblespeech”的概念,指出语谱图对语音信号有很强的描述能力,并且试着用语谱信息进行语音识别,这就形成了最早的语音特征,直到现在仍有很多的人用语谱特征来进行语音识别[2]。后来,人们发现利用语音信号的时域特征可以从语音波形中提取某些反映语音特性的参数,比如:幅度、短时帧平均能量、短时帧过零率、短时自相关系数、平均幅度差函数等。这些参数不但能减小模板数目运算量及存储量而且还可以滤除语音信号中无用的冗余信息。语音信号特征参数是分帧提取的, 每帧特征参数一般构成一个矢量, 所以语音信号特征是一个矢量序列。我们将语音信号切成一帧一帧, 每帧大小大约是20-30ms。帧太大就不能得到语音信号随时间变化的特性, 帧太小就不能提取出语音信号的特征, 每帧语音信号中包含数个语音信号的基本周期。有时希望相邻帧之间的变化不是太大, 帧之间就要有重叠, 帧叠往往是帧长的1/2或1/3。帧叠大, 相应的计算量也大[3]。随着语音识别技术的不断发展时域特征参数的种种不足逐渐暴露出来,如这些特征参数缺乏较好稳定性且区分能力不好。于是频域参数开始作为语音信号的特征比如频谱共振峰等。经典的特征提取方法主要有LPCC(线性预测倒谱系数)、MFCC(美尔频率倒谱系数)、HMM(隐马尔科夫模型)、DTW(动态时间规整)等。 2 语音信号特征参数提取方法

相关文档
最新文档