基于ICA的语音信号盲分离.doc

上传人:仙人指路1688 文档编号:4131858 上传时间:2023-04-06 格式:DOC 页数:35 大小:466.50KB
返回 下载 相关 举报
基于ICA的语音信号盲分离.doc_第1页
第1页 / 共35页
基于ICA的语音信号盲分离.doc_第2页
第2页 / 共35页
基于ICA的语音信号盲分离.doc_第3页
第3页 / 共35页
基于ICA的语音信号盲分离.doc_第4页
第4页 / 共35页
基于ICA的语音信号盲分离.doc_第5页
第5页 / 共35页
点击查看更多>>
资源描述

《基于ICA的语音信号盲分离.doc》由会员分享,可在线阅读,更多相关《基于ICA的语音信号盲分离.doc(35页珍藏版)》请在三一办公上搜索。

1、基于ICA的语音信号盲分离 摘 要语音信号盲分离处理的含义是指利用BSS技术对一段语音信号进行处理。混合语音信号的分离是盲分离的重要内容,目前的混和语音分离大多是建立在无噪环境中的混叠情形下,主要以盲源分离(Blind Source Separation,BSS),根据信号的统计特性从几个观测信号中恢复出未知的独立源成分。本文重点研究了以语音信号为背景的盲源分离,在语音和听觉信号处理领域中,如何从混有噪声的的混叠语音信号中分离出各个语音源信号,来模仿人类的语音分离能力,成为一个重要的研究问题。具体实现主要结合ICA技术,将语音去噪作为一个预处理过程,对带噪声的混叠语音盲分离进行了研究,本文详细

2、了介绍了FastICA算法,将这种算法应用于实际的语音信号噪声分离中,并将分离出的语音信号与混合前的原信号进行了分析比较,验证了通过ICA实现语音信号的盲分离是切实可行的。关键词语音信号,盲源分离,独立成分AbstractBlind separation of speech signals processing means for processing refers to a section of the speech signal of microphone detected by BSS technique. Separate the mixed speech signals is an

3、important content of blind separation, the mixed speech separation is mostly based on noise free environment in the overlapping case, mainly to the blind source separation (Blind Source Separation, BSS), according to the statistical characteristics of the signal from the observed signals recover ind

4、ependent source component is unknown.This paper focuses on the blind source separation using speech signal as the background, in speech and audio signal processing field, separating each voice source signal from noisy mixed speech signals, to mimic human speech separation ability, has become an impo

5、rtant research question. Concrete realization mainly with ICA technology, the speech denoising as a pretreatment process, the overlapping speech blind separation of mixed with noise is studied, this paper presents the FastICA algorithm, the speech signal noise separation of this algorithm is applied

6、 to the practice, and the original voice signal mixed with isolated anterior are analyzed and compared, verified by ICA to realize the blind separation of speech signals is feasible.Keywordsspeech signal, blind source separation, independent component analysis目录1 前 言11.1 盲语音信号分离技术的背景及意义11.2 语音的特性22

7、语音信号特性及分析22.1 语音的基本特征22.2语音处理的理论基础32.3语音信号的MATLAB 应用程序42.3.1 输入语言的MATLBA 时域和频谱图程序分析42.3.2 混合语音信号的MATLBA 时域和频谱图程序分析83 盲信号处理103.1 盲信号处理的基本概念103.2 盲信号处理的方法和分类103.3 盲信号处理技术的研究应用103.4 独立成分分析分析113.4.1 独立成分分析的定义113.4.2 ICA的基本原理124 FASTICA算法144.1 数据的预处理144.2 FastICA算法154.3 ICA分离的步骤164.4 混合语音信号的波形图164.5 分离后的

8、信号的波形图174.6对比分析205 小结体会226参考文献237致谢248附件25 1 前 言1.1 盲语音信号分离技术的背景及意义近年来,混合语音信号的分离成为语音信号处理领域的一个研究热点。我们经常在信号处理中遇到这样的问题,如何将这些原始信号从一组随机信号经过一组混合系统得到的观测信号种恢复出,如果在重构过程中没有原始信号和混合系统的先验知识,就将该过程称为盲分离。其理论也不断运用到医学、图像、通讯等领域在语音方面的应用包括有多个人说话构成的声音环境下,从多个话筒接收到的声音信号就是所谓的鸡尾酒会问题,它是指人们在嘈杂环境中或者是在许多人同时说话的情况下有辨识自己感兴趣的声音的能力引起

9、研究者的兴趣。而我们所研究的混合语音信号分离急速虽然不能失信是计算机具有和人类一样的听觉,但 是通过该技术却能使原本相互混叠的语音信号相互剥离,来作为语音识别的预处理,从而使得噪声环境下结合多说话人情形下的语音识别的实现成为可能。1.2 语音的特性(1)短时平稳性通过对语音信号的研究,语音信号是一种非平稳的、时变的随机过程,另一方面,人类声音系统的结构的变化是有一定限制的,在短时间内(1030ms)人的声道和声带形状基本不变,而且大部分情行下,原激励参数也是如此,由此可认为在较短的时间内语音的特征是不变的,语音的这一短时性特点是对语音信号分析和处理的前提。(2) 清音和浊音语音可以分为清音和浊

10、音两大类,他们从语音产生的基础上有明显的分别,前者由随机性噪声产生,后者由周期性脉冲产生,因此在特点上也有本质的区别。在时域上,浊音表现出显而易见的周期性,在频域上,浊音有共振峰构造且能量比较集中在低频段内。清音则不同,清音没有较明显特征,和白噪声差不多。浊音在频域上有共振峰结构,能量大量集中在低频区(1000Hz)。2 语音信号特性及分析2.1 语音的基本特征(1)语音的时域特征由于讲话人不同时间说话内容不同,且没有规律性,因此语音的信号是时变的。但是,人类发出声音器官的变化率有限,在较短时间内(5500ms),声道在平稳状态,因此语音的信号有短时平稳性。并且这种短时平稳性,是语音处理中许多

11、算法和理论的前提。由于人在讲话话时,不同音节、单词之间总存在着一些时间上的间隔,由此在时域上,语音信号存在着两种音段:有音段、无音段。经过有音和无音的检测,可用于去除语音中较平稳的噪声。而且,无音段越占较大比例,语音在稀疏性越好,基于这一特点,产生了很多增强语音稀疏性的算法。(2)语音的频域特征语音的主要频谱能量集中在300-3400Hz。语音由清音音和浊音构成,浊音信号含有语音信号的大量能量,其频谱集中于低频段中的基因频率及其各次谐波上,表现出周期性;清音则表现出随机性,在频谱与白噪声差不多。(3)语音的统计特征可以将语音信号看作是一个遍历性随机过程的样本函数,可用幅度的概率密度函数来描述统

12、计特性。通过对语音信号统计特性的研究,其幅度分布的概率密度函数可以用两种近似的表达式来较好的描述,一种是伽马(Gamma)分布 (2.1)式中k是一个常数,与标准差,有下列关系 (2.2) 另一种是拉普拉斯分布(Laplacian)分布 (2.3)式中,是一个由标准差决定的常数,即 (2.4)相对说来,伽马分布在幅度分布上对语音信号的描述更精确,而拉普拉斯分布函数更加简洁。2.2语音处理的理论基础频谱分析时,在对时域数据进行短时FFT处理之前都要进行加窗处理。 在FFT处理之后,普通频谱分析可以进行频域上的滤波处理,从而使频谱更加平滑。为了得到各种音频信号的特技效果,也需要对各种变声算法进行研

13、究。(1)窗的选择一般来讲,一个较好窗函数具有一定标准:在时域上,因为是语音的波形与窗函数相乘,因此窗两端的坡度要减小,将窗口两端在不引起急剧性变化的同时过渡到零,这样可将截出的语音信号的波形慢慢的降到零,减少语音帧的阶段效应;在频域上必须有较宽的带宽和较小的边带最大值。另外一方面,不同人的基音周期变化很大,主要集中在 70Hz-1000Hz。所以窗一般选择在10ms-20ms之间。此外,为了避免在加窗时加入多 余的高频信号,应该使用平滑窗,例如汉明窗。(2)变声算法的讨论语声可以分为声带振动的浊音部分、声带不振动的清音部分以及静音部分。在这里,我们主要是改变原始话音的基音频率,以达到变声的目

14、的。 第一种方法是不修改采样数据,仅改变Fs 。这种方法操作非常简便。第二种方法是直接乘以一个余弦函数,把语音信号频段搬移到较高频段,以达到变声的目的。第三种方法是插值以后重新抽样。基本过程是这样的:已知当前帧帧长FL(采样)点,采样频率Fs ,目标变换帧频率Fs,则目标变换帧帧长FL=FL*Fs/Fs 。记Rate = Fs/Fs ,那么FL=FL * Rate,其中Rate 为基频变化率。变换开始时,先求得FL 和FL的最小公倍数AL,再将原音频帧插值为AL点,最后将插值后的语音段重新抽样,得到长FL点的变声后的数据。 三种方法操作起来都还比较简单,但为了便于分析时域、频域特效,本设计选择

15、了通信中常用的调制方法,即方案二。2.3语音信号的MATLAB 应用程序 2.3.1 输入语言的MATLBA 时域和频谱图程序分析 一般来说,matlab只能对格式为wav的音乐进行处理,为此,我从酷狗音乐中下载了三个格式为wav的小音乐,分别为开门的声音、越狱的背景音乐和儿歌两只小蜜蜂,将它们作为我对语音信号处理的原始信号。为了对我下载的音乐进行matlab处理,通过查阅资料,我编写出如下程序,分别对三个语音信号进行了分析,并得出了他们的波形、幅值、相位和频谱图。(1)原始信号一的处理 信号一为开门的声音,将它经过程序处理后得出信号一的波形、幅值、相位和频谱图,如图2.1所示,下面为对信号一

16、进行处理的源程序和得出的信号一的图形分析结果:信号一:fs=25600;x,fs,bits=wavread(m.wav,40000);sound(x,fs,bits);y1=fft(x,1024); %对信号做1024点FFT变换 f=fs*(0:2047)/4096;figure(1) magy1=abs(y1); angy1=angle(y1); subplot(2,2,1),plot(x);title(信号1波形) subplot(2,2,2),plot(magy1);title(信号1幅值) subplot(2,2,3),plot(angy1);title(信号1相位) subplot

17、(2,2,4), plot(f,abs(y1(1:2048); title(信号1频谱) xlabel(Hz); ylabel(fudu); axis(0 100 0 50)图2.1 信号一的波形、幅值、相位和频谱图(2)原始信号二的处理 信号二为越狱的背景音乐,将它经过程序处理后得出信号二的波形、幅值、相位和频谱图,如图2.2所示,下面为对信号二进行处理的源程序和得出的信号二的图形分析结果:信号二fs=25600;x,fs,bits=wavread(n.wav,40000);sound(x,fs,bits);y1=fft(x,1024); %对信号做1024点FFT变换 f=fs*(0:20

18、47)/4096;figure(1) magy1=abs(y1); angy1=angle(y1); subplot(2,2,1),plot(x);title(信号2波形) subplot(2,2,2),plot(magy1);title(信号2幅值) subplot(2,2,3),plot(angy1);title(信号2相位) subplot(2,2,4), plot(f,abs(y1(1:2048); title(信号2频谱) xlabel(Hz); ylabel(fudu); axis(0 100 0 50)图2.2 信号二的波形、幅值、相位和频谱图(3)原始信号三的处理 信号三为儿哥

19、两只小蜜蜂,将它经过程序处理后得出信号三的波形、幅值、相位和频谱图,如图2.3所示,下面为对信号三进行处理的源程序和得出的信号三的图形分析结果:信号三fs=25600;x,fs,bits=wavread(s.wav,40000);sound(x,fs,bits);y1=fft(x,1024); %对信号做1024点FFT变换 f=fs*(0:2047)/4096;figure(1) magy1=abs(y1); angy1=angle(y1); subplot(2,2,1),plot(x);title(信号3波形) subplot(2,2,2),plot(magy1);title(信号3幅值)

20、 subplot(2,2,3),plot(angy1);title(信号3相位) subplot(2,2,4), plot(f,abs(y1(1:2048); title(信号3频谱) xlabel(Hz); ylabel(fudu); axis(0 100 0 50图2.3 信号三的波形、幅值、相位和频谱图2.3.2 混合语音信号的MATLBA 时域和频谱图程序分析 将上述的三个原始信号通过编程将其混合成一个语音信号,然后继续进行编程处理,的出混合语音信号的波形、幅值、相位和频谱图,如图2.4所示。下面为将三个语音信号混合和对混合语音信号处理的源程序,及其经过处理得到的混合语音信号的波形、幅

21、值、相位和频谱图:图2.4 混合信号的波形、幅值、相位和频谱图混合语音信号:x,fs,bits=wavread(m.wav,200); y,fs,bits=wavread(s.wav,200); z,fs,bits=wavread(n.wav,200); S=x;y;z; Sweight=rand(size(S,1); MixedS=Sweight*S; x=MixedS(1,:); fs=25600; y1=fft(x,4096); f=fs*(0:2047)/4096; figure(1) magy1=abs(y1); angy1=angle(y1); subplot(2,2,1),plo

22、t(x);title(混合信号波形) subplot(2,2,2),plot(magy1);title(混合信号幅值) subplot(2,2,3),plot(angy1);title(混合信号相位) subplot(2,2,4), plot(f,abs(y1(1:2048); title(混合信号频谱) xlabel(Hz); ylabel(fudu); axis(0 1000 0 50)3 盲信号处理3.1 盲信号处理的基本概念盲信号处理是现代数学信号处理、算智能学近年来迅速发展的重要方向。电子信息、通信、生物医学、图像增强、雷达、地球物理信号处理等众多领域有广泛的应用前景。盲信号处理就是

23、利用系统(如无线信道、通信系统等)的输出观测数据,通过某种信号处理的手段, 获得我们感兴趣的有关信息(如原来独立发射的信号等)。盲信号的研究是当前学术界研究的热点,而在盲信号研究中,盲信号分离则是一个重要课题。BSS是指从混合的语音信号中分离出来一些未知的原信号。盲信号中的“盲”有两个方面的含义:一,对原信号不知道或仅有少许先验知识。二,混合信号是未知的。这看似是不可能完成的任务,而理论和实际都已经证实了只需要一些简单的假设,便可得到该问题的解。这使得BSS成为一种功能强大的处理信息的方法。3.2 盲信号处理的方法和分类在盲信号处理中,就原信号进过传输通道的混合方式而言,其处理方法可分为线性瞬

24、时混合信号盲处理、线性卷积混合信号盲处理和非线性混合信号盲处理三类。根据通道中是否有噪声、噪声特性(白噪声、有色噪声等)、噪声混合形式,可分为有噪声、无噪声盲处理,含加性噪声和乘性噪声混合信号盲处理等。按原信号和观测信号数目的不同可将混合方式分为欠定 、适定和超定情况 ;按原信号的不同可分为 : 平稳 、非平稳 、亚高斯、超高斯、超高斯和亚高斯混合分离等 。盲处理的目的可分为盲源分离和盲辨识两类。其中,盲辨识的目的是求传输通道混合矩阵(新型混合矩阵、卷积混合矩阵、非线性混合矩阵等)。盲源分离是为求出源信号的最佳估计。当盲源分离的各分量相互独立时,就称为独立分量分析,即独立分量分析是盲源分离的一

25、种特殊情况。3.3 盲信号处理技术的研究应用近年来,盲信号处理逐渐成为当今信息处理领域中热门的课题之一,并且已经在尤其在生物医学工程、医学图像、语音增强、遥感、通信系统、地震探测、地球物理学、计量经济学和数据挖掘等领域显示出诱人的前景,特别是盲源分离技术、ICA的不断发展和应用最为引人注目。1.语音识别领域语音信号分离、语音识别是盲处理应用的一个重要领域。最典型的应用就是声控计算机,计算机所接受到的语音指令肯定是肯定是带有各种环境噪声的,还可能存在其他的语音信号,而且这些信号原与接收器的位置也未知,计算机要在此时识别出准确的语音命令。移动通信中,总是存在通信质量等问题,对通话效果产生极大的影响

26、,而盲源分离、盲均衡技术都能够消去噪声、抑制干扰和加强语音,提高语音通话的质量。2.生物医学信号在生物医学方面,盲信号的处理可以应用在脑电图(EEG)信号分离、心电图(ECG)、功能磁共振图像(FMRI)分析、听觉信号分析等。目前,一些学者已经将盲源分离技术应用在脑电图等信号的数据处理方面。3.4 独立成分分析分析独立分量分析 ( Independent Component Analysis , ICA)是由Herault和J utten在1983年提出,该方法不依赖与源信号类型相关的详细知识或信号传输系统特性的精确辨识,是一种有效的冗余取消技术,被广泛应用于盲源分离 ( blind sour

27、ce separation BSS)、特征提取和盲解卷、生理学数据分析语音信号处理、图像处理及人脸识别等领域。该方法根据代价函数的不同 ,可以得到不同的ICA算法,如信息最大化(infomax)算法、Fast ICA算法、最大熵( M E)和最小互信息( MM I)算法、极大似然(ML)算法等。 在统计学中,独立成分分析或独立分量分析(Independent components analysis,缩写:ICA)是一种运用统计原理进行计算的方法。这是一个线性变换。这个变换把信号、数据分离成独立统计的非高斯的信号原地线性组合。ICA是盲信号分离(Blind source separation)的

28、一种特例3.4.1 独立成分分析的定义ICA是一种从多变量(多维)统计数据里找出隐含的因素或成分的方法,被认为是主要成分分析(Principal Component Analysis, PCA)和因子分析(Factor Analysis)的一种扩展。对于盲源分离,ICA是指知道混合信号,且不知道原信号、噪声和混合机制的情况下,分离或近似的分离出原信号的一种分析过程。独立成分分析(Independent Component Analysis, ICA)是近些年来出现的一种强大的对数据分析的工具(Hyvarinen A, Karhunen J, Oja E, 2001; Roberts S J,

29、Everson R, 2001)。1994年由Comon给出了ICA的一个较为严格的数学定义,其思想最早是由Heranlt和Jutten于1986年提出来的。ICA从出现到现在虽然时间很短,然而不论在理论上还是在应用上,它正在被越来越多的人关注,成为国内外的一个研究热点。尤其是从应用角度,它的应用领域和应用前景是非常广阔的,目前主要应用在盲源分离、语言识别、通信、生物医学信号处理、脑功能成像研究、特征提取、金融时间序列分析和数据挖掘等方面。盲源分离技术是近二十年发展起来的一门新型科学,在各国科学家和研究人员的努力下获得了充分的发展,但是对ICA的研究却很缓慢,这毕竟是一个涉及多方面并且处在发展

30、前沿的研究课题,理论上还没有成熟,许多问题都需要进一步的研究、解决。(1)带噪声混合语音信号的盲分离盲信号处理中的条件太多,混合信号在含有噪声的情况下其盲源分离问题的解决是比较困难的。虽然已有部分算法对于有噪声的情行下表现出较好的性能,但出于噪声种类多,因此处理起来仍很困难。现有的多数盲源分离或盲解卷积算法都把信号假设不含噪声或把噪声看做一个独立的信原信号进行处理。(2)非平稳混合语音信号地盲源分离算法很多情况下原信号有可能是非平稳的,如何通过信号的非平稳特性来进行盲源分离是广大研究员必须面临的一个重要现实问题。(3)卷积混合语音信号的盲源分离算法实际应用中,系统接收的混合信号是原信号经过不同

31、的途径传达到接收器。在这一过程中,会不可避免的产生信号的反射。针对这一情况下的盲源分离算法还不够成熟。(4)ICA的推广应用在算法的应用方面,ICA可以取得更大的发展,如可以在语音的识别、图像的处理、特征的提取、医学信号的处理方面作一些进一步的研究。但关键的问题是怎样将理论的算法转变为实际的应用,以及怎样建立更好的反应实际的模型等。(5)算法的收敛性算法在全局收敛性方面的研究,可以将遗传算法、混沌算法等一些具有全局收敛性的算法和ICA结合起来,有助于提高算法的全局收敛性。3.4.2 ICA的基本原理(1)无噪声的ICA模型ICA作为生成模型的估计给定随即变量的一组观测,其中是时间或者样本标号,

32、假设它们有独立成分线性混合而产生:=A (3.1)式中,是某个未知矩阵。用向量和矩阵符号方法表示比上面的表式更加的方便。随机向量x用来表示混合向量,其组成分别为,用来表示元素,矩阵则用来表示混合系数。所有的向量都可以理解为列向量;这样或的转置就可以认为是一个行向量。利用向量和矩阵符号,混合模型可以表示为: (3.2)有时我们需要使用矩阵A中的列向量,如果将其表示为,则模型也可以写为: (3.3)(2)有噪声的ICA模型将基本的ICA模型扩展到有噪声的情形,并且假设噪声是以加性噪声形式存在的。这是一个相当现实的假设,因为加性噪声是因子分析和信号处理中通常研究的标准形式,具有简单的噪声模型表达方式

33、。因此,噪声ICA模型可表示为: (3.4)式中,是噪声向量。信号原噪声,即直接添加到独立成分(即信号原)上的噪声。信号原噪声可用稍有差别的下式来表示: (3.5)实际上,如果可以直接考虑带噪声的独立成分,那么可将此模型写为: (3.6)可以看出,这就是基本的ICA模型,只是独立成分本身变了。4 FastICA算法4.1 数据的预处理在一般情行下,得到的数据都具有相关性,要对这些数据进行白化或球化处理,这是因为通过白化处理可以去掉各观测信号间的相关性,使后续的独立分量的提取得到简化,在一般情况下,对数据白化处理比不对数据白化处理的算法的收敛性更好。如果一零均值的随机向量满足,则这个向量为白化向

34、量。白化的本质表现在去相关。在ICA中,零均值的独立原信号,有:,协方差矩阵为单位阵,因此,源信号是白色的信号。对于观测信号,通过一个线性变换,使投射到子空间后表现为白化向量,即: (4.1)其中为白化矩阵,为白化向量。利用分量的分析,通过对样本向量的计算可以得出一个变换 (4.2)其中、代表协方阵的特征值和向量矩阵。可证明,线性变换符合白化变换的要求。如此通过正交变换,可以保证。由此,协方差矩阵可表示为: (4.3)再将式代入,且令,有 (4.4)由于线性变换连接的是两个随机的白色矢量和,可以得出是正交变换。如果把看做新的观测信号,那么就可以说,白化已经使原来的混合矩阵简化成一个新的正交矩阵

35、。白化这种常规的方法作为ICA的预处理可以有效地降低问题的复杂度,而且算法简单,用传统的PCA就可完成。4.2 FastICA算法 FastICA算法,又称固定法(Fixed-Point)算法,是一种快速寻优迭代算法,采用批处理的方式,即在每一步迭代中有大量的样本数据参与运算。FastICA算法有基于峭度、基于似然最大、基于负熵最大等形式。FastICA算法将最大的负熵做为搜寻的方向。由信息论的理论可知:在所有的随机变量中,高斯变量拥有最大熵,可以通过熵来度量非高斯性,根据中心极限定理,若一随机的变量由很多独立的随机变量之和组成,只要具有有限的均值和方差,则不论它是什么分布,随机变量比更接近高

36、斯分布。在分离的过程中,可以对分离结果的非高斯性度量来表示分离结果间的相互独立性,当非高斯性达到最大时,则表明已实现各独立分量的分离。负熵的定义: (4.5)式中,是一与具有相同方差的高斯随机变量,为随机变量的微分熵 (4.6)根据信息论,拥有相同方差的随机变量,高斯分布的随机变量有较大的微分熵。当有高斯分布时,;具有越强的非高斯性,则其微分熵越小,值越大,所以可以做为随机变量非高斯性的度量。由于计算微分熵需要的概率密度分布函数,于是采用如下近似公式: (4.7)其中为均值运算;为非线性函数,可取或或等非线性函数,这里,通常我们取。FastICA是找一个方向以便具有最大的非高斯性。FastIC

37、A的推导过程如下。首先,的最大负熵的近似值可以通过对的优化处理获得。根据Kuhn-Tucker条件,在的约束下,的最优值能通过下式来获得。 (4.8)这里是恒定值,是优化后的值。用表示上式左边的函数,可得的雅克比矩阵如下: (4.9)为了将矩阵求逆过程简化,可以近似将其看做上式的第一项。但是,由于数据被球化,所以,。因而雅克比矩阵变成了对角阵并且能比较容易的求逆,因而可以得到下面的近似牛顿迭代公式: (4.10)这里是的新值,规格化能提高解的稳定性。简化后就可以得到FastICA算法的迭代公式: (4.11)用迭代公式求W4.3 ICA分离的步骤 (1)均值归零,令 (4.12) (的均值=0

38、,但他的其他统计特性和一样) (2)数据白化 求出自相关函数 (4.13) 对自相关函数 (4.14) (是对角阵) 对数据进行白化,令: (4.15) (可以证明Z是“白”的,及) (3)选择任意正交矩阵作为初值 (4)用迭代公式更新W的每一列 (4.16) 其中可以使下面几个函数中的一个 (4.17) (5)W正交化 (4.18) (6)如果不收敛(W迭代后改变较大),则返回步骤44.4 混合语音信号的波形图对混合语音信号进行编程处理,得到混合语音信号的波形如图4.1所示。下图即为经过matlab处理后的混合语音信号的波形图:图4.1混合信号波形图4.5 分离后的信号的波形图对上面的混合语

39、音信号经过matlab编程,通过ICA算法的处理,并经过程序的调试,得出如下所示的三个分离信号的波形图(其中图4.2为分离信号一的波形图,图4.3为分离信号二的波形图,图4.4为分离信号三的波形图):图4.2 分离信号一的波形图图4.3 分离信号二的波形图图4.4 分离信号三的波形图4.6对比分析通过FastICA算法得到的分离出的信号的波形图4.2、图4.3、图4.4与原始信号的波形图2.1、图2.2、图2.3可以看出该算法较好地恢复了原始信号的波形。为了定量地分析该算法的优劣性下面将对分离前后的相关系数及相对误差进行比较。相关系数相对误差原信号一与分离信号一之差-0.97404179025

40、71570.31547909862450原信号二与分离信号二之差-0.973467311744550.02656320903609原信号三与分离信号三之差-0.986789635130860.13460153701023相关系数性质(1)相关系数可正可负; (2)相关系数的区间是-1,1,即xy1; (3) 具有对称性;即X与Y之间的相关系数(rXY)和Y与X之间的相关系数(rYX); (4)相关系数与原点和尺度无关; (5)如果X与Y统计上独立,则它们之间的相关系数为零;但是r=0不等于说两个变量是独立的。即零相关并不一定意味着独立性; (6)相关系数是线性关联或线性相依的一个度量,它不能用

41、于描述非线性关系; (7)虽然相关系数是两个变量之间的线性关联的一个度量,却不一定有因果关系的含义;一般来说,相关系数越接近于1,说明得到的分离结果越好,否则相反。由得到的相关系数都接近为1可知,经过独立成分分析的FastICA算法分离的效果相当好。通过上面程序的编译调试和算法的实现,我实现了对原始信号的分析、混合和对混合信号的分析,并通过ICA实现了语音信号的盲分离,得出了对混合语音信号分离后的三个分离信号。结论通过比较可以得出将ICA算法用于语音信号的盲分离是切实可行的。但本次设计也存在一些缺陷,例如没有得出分离信号的幅值、相位和频谱,如果可以得出分离信号的幅值、相位和频谱,则结果的分析比较将更加准确,当然还需要考虑噪声对本次设计的影响,这是不可避免的。由此得出。本次设计是比较成功的。5 小结体会在本次毕业设计中,我首先收集了一些关于本次设计的书籍和相关文献,做了充分的前期准备。然后制定了本次设计的进度安排,采集了相关的语音信号并通过matlab软件的程序编程和调试,得出了本次设计的实践结果。最后,撰写论文,将收集的知识、设计的过程和得到的

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公文档 > 其他范文


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号