《语音信号处理实验报告.doc》由会员分享,可在线阅读,更多相关《语音信号处理实验报告.doc(8页珍藏版)》请在三一办公上搜索。
1、语音信号处理实验报告实验一:语音信号的端点检测学院:电子与信息学院专业:11级信息工程姓名:学号:提交日期:2014.4.23实验一:语音信号的端点检测1、 实验内容语音信号端点检测技术其目的就是从包含语音的一段信号中准确地确定语音的起始点和终止点,区分语音和非语音信号,它是语音处理技术中的一个重要方面。本实验的目的就是要掌握基于MATLAB编程实现带噪语音信号端点检测,利用MATLAB对信号进行分析和处理,学会利用短时过零率和短时能量,对语音信号的端点进行检测。2、 实验方法本实验中,端点检测的方法有两种:短时能量和短时过零率。2.1.1、短时能量语音和噪声的区别可以体现在它们的能量上,语音
2、段的能量比噪声段能量大,语音段的能量是噪声段能量叠加语音声波能量的和。在信噪比很高时,那么只要计算输入信号的短时能量或短时平均幅度就能够把语音段和噪声背景区分开。这是仅基于短时能量的端点检测方法。信号x(n)的短时能量定义为:2.1.2、短时平均过零率短时过零表示一帧语音信号波形穿过横轴(零电平)的次数。过零分析是语音时域分析中最简单的一种。对于连续语音信号,过零意味着时域波形通过时间轴;而对于离散信号,如果相邻的取样值的改变符号称为过零。过零率就是样本改变符号次数。信号x(n)的短时平均过零率定义为:2.2、检测方法利用过零率检测清音,用短时能量检测浊音,两者配合。首先为短时能量和过零率分别
3、确定两个门限,一个是较低的门限数值较小,对信号的变化比较敏感,很容易超过;另一个是比较高的门限,数值较大。低门限被超过未必是语音的开始,有可能是很短的噪声引起的,高门限被超过并且接下来的自定义时间段内的语音超过低门限,意味着信号开始。此时整个端点检测可分为四段:静音段、过渡段、语音段、结束。实验时使用一个变量表示当前状态。静音段,如果能量或过零率超过低门限,就开始标记起始点,进入过渡段。过渡段当两个参数值都回落到低门限以下,就将当前状态恢复到静音状态。而如果过渡段中两个参数中的任一个超过高门限,即被认为进入语音段。处于语音段时,如果两参数降低到门限以下,而且总的计时长度小于最短时间门限,则认为
4、是一段噪音,继续扫描以后的语音数据,否则标一记结束端点。2.3、实验过程1、录取一段录音,采样率8K,单声道2、用MATLAB的wavread函数把录音都进来并进行归一化处理3、对语音信号进行预加重,分帧处理4、对每帧分别计算短时能量和短时门限过零率5、进行短时能量阈值、过零率阈值等参数6、编写程序实现语音检测端点并绘出检测图3、实验结果4、实验分析4.1结果分析从结果图可知,本次实验是成功的,语音信号的端点基本都检测出来了。短时能量和短时过零率的检测结果和信号的端点分布一致。语音段的能量值比过渡段和静音段的能量都大,语音的过零率比过渡段和静音段的也都大。4.2实验总结这次实验利用MATLAB
5、对信号进行分析和处理,利用短时过零率和短时能量,对语音信号的端点进行检测。由于知识储备的不足,在实验过程中还是遇到比较大的困难,端点检测代码是参考网上的,在理解的基础上加以修改和改进。但是预处理、加窗分帧、短时能量、短时过零率的代码都是我自己根据原理编写的,所有总的来说收获还是很大的。代码如下:function point_check()s1=wavread(1_1.wav);s=s1/max(abs(s1);s=filter(1 -0.9375,1,s);%预加重plot(s);len=length(s);round=160;%帧长repeat=80;%帧移inc=round-repeat;
6、%b_len-2*repeat;ka=ceil(len-round)/(round-repeat)+1;%总帧数s=s;zeros(round-repeat)*(ka-1)+round-len,1);len=length(s);%以下进行分针操作w=zeros(round,ka); for i=1:ka for k=1:round w(k,i)=s(k+(i-1)*(round-repeat),1); end end%计算过零率ST=0.01;%过零门限f=zeros(ka,1);%计算短时能量幅度差F=zeros(ka,round);for i=1:ka for k=0:round-1 fo
7、r j=1:round-k F(ka,k+1)=F(ka,k+1)+abs(w(j,i)-w(j+k,i);%计算短时能量幅度差 end if(k0&w(k+2,i)0) z=sign(w(k+1,i)-ST)-sign(w(k+2,i)+ST);%计算过零率 elseif(w(k+1,i)0) z=sign(w(k+2,i)-ST)-sign(w(k+1,i)+ST);%计算过零率 end if(z=2) f(i,1)=f(i,1)+1;%计算过零率 end end endendamp=sum(abs(w).2,1);%计算端点amp1=10;%短时能量阈值?amp2=2;zcr1=10;%
8、过零率阈值?zcr2=6;minsilence=6;%用无声的长度来判断语音是否结束?minlen=15;%判断是语音的最小长度?status=0;%记录语音段的状态?count=0;%语音序列的长度?silence=0;%无声的长度xpoint=;amp1=min(amp1,max(amp)/4);amp2=min(amp2,max(amp)/8);%一下开始断点检测for n=1:ka %goto =0; switch status case 0,1;%?0?=?静音,?1?=?可能开始 if amp(n) amp1 %?确信进入语音段? x1=max(n-count-1,1);%?记录语
9、音段的起始点? xpoint=xpoint,x1; status = 2; silence = 0; count = count + 1; elseif amp(n) amp2 | f(n) zcr2 % 可能处于语音段 status = 1; count = count + 1; else % 静音状态 status = 0; count = 0; end case 2, % 2 = 语音段 if amp(n) amp2 |f(n) zcr2 % 保持在语音段 count = count + 1; else % 语音将结束 silence = silence+1; if silence mi
10、nsilence % 静音还不够长,尚未结束 count = count + 1; elseif count minlen % 语音长度太短,认为是噪声 status = 0; silence = 0; count = 0; else % 语音结束 status = 3; end end case 3, status=0; count = count-silence/2; x2 = x1 + count -1; %记录语音段结束点 xpoint=xpoint,x2; count=0; silence=0; endend subplot(3,1,1)plot(s)axis(1 length(s)
11、 -1 1)ylabel(Speech);for i=1:length(xpoint) line(xpoint(i)*inc xpoint(i)*inc, -1 1, Color, red);endsubplot(3,1,2)plot(amp);axis(1 length(amp) 0 max(amp)ylabel(Energy);for i=1:length(xpoint) line(xpoint(i) xpoint(i),min(amp),max(amp), Color, green);endsubplot(3,1,3)plot(f);axis(1 length(f) 0 max(f)ylabel(ZCR);for i=1:length(xpoint) line(xpoint(i) xpoint(i),min(f),max(f), Color, black);end