《音频信号混响器设计.doc》由会员分享,可在线阅读,更多相关《音频信号混响器设计.doc(30页珍藏版)》请在三一办公上搜索。
1、摘 要混响器作为音频系统中十分重要的一部分,备受录音师们的青睐。它不仅能修饰和修补声音,还可以模拟出真实环境的效果。混响可以增加声音的美感,其应用十分广泛。本文主要介绍了混响的原理和混响器的技术指标,及混响器的发展方向。并建立出混响模型及利用MATLAB进行音频信号的混响处理。还介绍了音频信号的格式以及与MATLAB相关的音频信号格式等。编写出延时混响程序,利用这些程序对歌曲进行混响处理。通过试听,混响的效果较好。关键词 信号处理,MATLAB,延时,混响ABSTRACTReverb as a very important part of audio system, much sound en
2、gineer of all ages. It not only can be modified and patch sounds, you can also simulate the real environment effects. Reverb can increase the beauty of the sound, which is widely used. This paper introduces the principle and reverb technical indicators, and the development direction of reverb. And t
3、he establishment of a reverberation model and the audio signal using MATLAB reverb processing. Also describes the format of the audio signal is an audio signal associated with the MATLAB format. Write delay reverb program, and take advantage of these programs and listen to the song reverb effect.Key
4、words Signal Processing,MATLAB,delay,Reverberation目 录摘 要IABSTRACTII1 绪 论11.1 课题背景11.1.1 混响器简介11.1.2 数字混响器的工作原理11.1.3 混响器的发展现状11.2 语音信号处理21.2.1 信号的定义21.2.2 语音信号处理的发展31.2.3 MATLAB在数字语音信号处理中的应用31.3 设计理念42 混响的原理62.1 全通滤波混响模型62.2延时62.3混响72.4声激励82.5相位的调节92.6整体缩混输出92.7多重混响处理102.8频率均衡103 音频信号与MATALB133.1音频信
5、号的格式133.2 MATLAB能读取的音频格式144 设计步骤和编程164.1用MATLAB读取一段音频信号164.2对音频信号进行混响164.3播放混响后的音频信号164.4全通结构的混响器165 实验步骤186 结 论21参 考 文 献22附 录23致 谢251 绪 论1.1 课题背景1.1.1 混响器简介混响器是音频系统中普遍使用的周边设备,它可以改变室内的混响时间,对较“干”的信号进行再加工,以增加空间感,提高音响系统的丰满度。也可以人为地制造一些特殊效果,如山谷、山洞的回声效果等。板式混响器可以说是人工混响器的鼻祖,体积很大而且笨重,只能固定在一个地方使用,安装时要采取隔声措施和防
6、振措施后才能使用。随着计算机科学的高速发展,以及数字音频技术的发展,出现了数字混响器,数字混响器逐渐取代了古老的板式混响器,并且应用更广泛。数字混响器采用数字信号处理技术重现混响效果,提供了比模拟混响器更灵活多变、适应各种需要的效果模式。常用的混响器有机械式(如弹簧混响器、钢板混响器、箔式混响器等)混响器、磁混响器和模拟电子混响器、数字混响器等四种。后两者具有频率范围宽,混响特性好,信噪比高,调节范围大,调整方便等优点,因此被广泛应用于电子扩声系统中。1.1.2 数字混响器的工作原理数字式混响器的工作原理是:先将信号经过A/D转换,把音频信号变为数字信号存储在移位寄存器(MOS)和随机延迟存储
7、器(RAM)的存储单元中,经编码后的数字信号由计算机对其进行运算、处理,最后经过D/A转换,以获得所需的各种混响声和自然效果声。采用数字式混响器对信号的电平、位置、延迟时间以及混响信息均可自由控制、无频率畸变和染色失真现象,所以能够获得更为自然的混响效果,以及自然界根本无法得到的特殊音响效果,故又称之为效果器。1.1.3 混响器的发展现状长久以来,混响器作为音频制作、声学应用等各种应用层面的有力因素,为其提供了源源不竭的活力。混响器可以增加声音的空间感,其利用声音反射相对较小的特点来添加空间感,从而使声音更加悦耳。它是一个神奇的声音加工工具,是所有音频制作相关行业的从业者再熟悉不过的工具了,也
8、是现代流行音乐录音制作、影视歌曲制作中不可或缺的有力工具。对于数字混响器的研究应用,美国莱斯康的PCM 480L、960L。丹麦TC电子混响的Reverb 6000、Reverb 4000等硬件混响装置凭借其优良的算法和出色的声音效果,多年以来仍然是世界上主要的工作室、各大录音棚、电影混音棚里使用最为广泛的混响制作工具。随着科技的不断发展,包括混响操作等问题,数字DSP技术已经可以很好地把计算任务交给专用的DSP芯片来解决,而且已经被TC电子和SSL等音频设备知名厂商大力推广,大大减少了不能做多任务运算的电脑的CPU芯片的负担,从而保证了更加稳定的数字音频工作站(DAW)的运行,因为厂家生产的
9、DSP效果卡等也都有自己的特殊功能,这些DSP效果混响卡继承了很多真正的硬件混响的特点。此外,这些产品可以对VST、AU、RTAS等插件格式的主流音频工作站进行无缝链接,所以这些产品被许多录音师和工程师追捧。近年来,随着不断提高的CPU的速度,出现了64位运算和多核中央处理器的计算机,以前过大混响计算量不能一次达到,而卓越的CPU的出现很好地解决了这一问题,并且有一个很好的发展前景。如此强大的音频信号混响器无论是在公共商业演出还是家庭娱乐中,均发挥着重要作用,它能让我们拥有丰厚,饱满的声音体验,极大地提高了我们的生活质量和精神追求。随着数字技术的发展,当今的数字混响器具有灵活多变等特点,可为我
10、们提供各种需求,根据中国商务部的调查分析,未来五年,混响器产业所带来的效益将以每年百分之二十左右增长。并且用户对产品的期望也越来越高,所以有越来越多的企业开始着力开发更好更完美的混响器产品。不只是在混响器,现在已有混响室等设计理念,并且会有更多的设计理念出来。然而当今的混响器市场主要被国外企业占据,但国内市场巨大,这就为我们的产品设计提供了广阔的市场空间。 1.2 语音信号处理1.2.1 信号的定义信号是传递信息的函数。离散时间信号可以用图形来表示。根据不同的信号的特性,信号可以表示成一个或几个函数的自变量。例如,图像信号就是空间位置(二元变量)的亮度函数。一维变量可以是时间,也可以是其他的参
11、量,习惯上将一维变量看成是时间。信号可以分为以下几种:(1)离散时间信号:时间为离散变量的信号,即独立变量时间被量化了。而幅度仍是连续变化的。(2)连续时间信号:定义的时间范围为连续的信号,但信号的振幅可以是一个连续的值,可以是离散的值。当振幅为连续的情况下,通常被称为作为模拟信号。事实上,常见的连续时间信号和模拟信号可通用,并且以相同的信号来说明。(3)数字信号:时间离散而幅度量化的信号。语音信号是一维数字信号,它是基于时间轴上的,这里主要针对语音信号进行频域分析。在信号分析中,频域比时域包含更多的信息。而对于频域分析,大概有 8种波形可以让我们分析:矩形方波,锯齿波,梯形波,三角波,余旋波
12、,余旋平方波,临界阻尼指数脉冲波形,高斯波。对于这些波形,我们都可以用傅立叶变换来分析,就是:将时域波形转化为频域来分析。1.2.2 语音信号处理的发展早在一两千年以前,人们便对语言进行了研究。由于没有适当的仪器设备,长期以来,一直是由耳倾听和用口模仿来进行研究。因此,这种语言研究常被称为“口耳之学”,所以对语音只是停留在定性的描写上。语音信号处理真正意义上的研究可以追溯到1876年贝尔电话的发明,该技术首次用声电、电声转换技术实现了远距离的语音传输。1939年Homer Dudley提出并研制成功的第一个声码器,从此奠定了语音产生模型的基础。这一发明在语音信号处理领域具有划时代的意义。19世
13、纪60年代,亥姆霍兹应用声学方法对元音和歌唱进行了研究,从而奠定了语言的声学基础。20世纪40年代,一种语言声学的专用仪器-语谱图仪问世了。它可以把语音的时变频谱用语图表示出来,从而得出了“可见语言”。1948年美国Haskins实验室研制成功“语音回放机”,该仪器可以把手工绘制在薄膜片上的语谱图自动转换成语音,并进行语音合成。20世纪50年代对语言产生的声学理论开始有了系统的论述。随着计算机的出现,语音信号处理的研究得到了计算机技术的帮助,使得过去受人力、时间限制的大量的语音统计分析工作,得以在电子计算机上进行。在此基础上,语音信号处理不论在基础研究方面,还是在技术应用方面,都取得了突破性的
14、进展。1.2.3 MATLAB在数字语音信号处理中的应用数字语音信号处理是将数字信号处理与语音学相结合,解决现代通信领域中人与人、人与机器之间的信息交流的学科。近几年来语音信号处理科学在世界范围内已取得了飞速的发展,由于MATLAB是一种运算效率高、功能强大、交互性良好的数值计算和可视化计算的高级语言,它将信号处理、图形显示和数值分析有机地融合为一体,是一个极其方便、操作简单、用户界面友好的操作和开发环境。随着MATLAB的不断更新换代,其功能越来越强大,因而被广泛应用于数字语音信号处理、数值图像处理、仿真自动控制、小波分析和神经网络等领域。同时又由于MATLAB具有大量的信号处理工具箱并能利
15、用非线性动态系统分析工具Simulink等优点,所以近年来MATLAB已经成为数字信号处理的有利工具,因此也成为学习语音信号处理和进行研究工作的仿真软件工具。下面简要介绍MATLAB在数字语音信号中的几方面应用。(1)MATLAB可以对数字语音信号进行时域和频域分析。通过MATLAB可以很方便地画出语音信号的时域波形及频域图,并且可以根据语音信号的特性对其进行分析。例如,清浊音的幅度差别、LPC分析、频谱分析等。(2)MATLAB能对数字语音信号进行判别和评估。可根据语音信号的短时参数,和不同语音信号短时参数的性质对一段给定的信号进行清浊音的判断、对语音信号的基音周期进行估计和有无声判定等。(
16、3)通过利用MATLAB对语音信号进行编程处理。由于MATLAB是一种面向数学和工程计算的高级语言,其允许用数学形式的编程语言,而且拥有大量的库函数,所以它具有编程简单、效率高、易学易懂等特点。可以对信号进行加噪和去噪、滤波、截取语音等,也可以进行语音编码、语音识别、语音合成的编程等。1.3 设计理念如果人为地对声音信号进行处理让其具有更完美的音质效果,这样的方法称之为人工混响,人工混响在广播电影电视和音乐制作中被广泛应用。以前的混响处理是采用模拟技术,效果不够理想。随着数字信号处理技术的发展,一些原来只能通过建筑声学才能解决的声学效果问题如今可以利用电声学技术以及数字信号处理技术来实现。在同
17、一个声学环境下,一个声源除了一部分能直接到达人耳外,还有一部分需要通过人体周围的障碍物反射到人耳,而直达声和反射声叠加在一起就形成了混响。本设计正是利用这一特性对音频信号进行了延时,然后进行叠加以达到混响效果,设计效果明显。数字信号处理主要是研究用数字或符号序列表示和处理信号。处理的目的可以是削弱信号中的多余内容,滤除混杂的噪声和干扰,或者是将信号变换为容易分析和识别的形式,便于估计和选择它的特征参数。声音信号是一维连续信号,而计算机只能处理离散信号。为了从离散信号还原连续信号,根据采样定理,可以确定采样频率的最小值。wav文件是一种数字声音文件格式,本设计基于MATLAB分析了wav声音文件
18、频谱与声音的关系。通过MATLAB载入一首歌曲进行延时、混响等处理,然后设计一个混响器来处理这个原始声音的wav文件,并比较输出声音信号与原声音信号的异同。利用MATLAB中的wavread命令来读入(采集)语音信号,将它赋值给某一向量。再将该向量看作一个普通的信号,依据实际情况对它进行延时、混响等操作。对于波形图与频谱图(包括前后的对比图)都可以用 MATLAB画出。我们还可以通过sound命令来对语音信号进行回放,以便在听觉上来感受声音的变化。 2 混响的原理2.1 全通滤波混响模型全通滤波的混响模型如图2.1所示:图2.1全通混响模型图中m表示延时,而g(g1)是反馈增益。此混响模型输入
19、输出方程为: y(n)=-gx(n)+x(n-m)+gy(n-m) (2.1)传递函数为: H(z)= (2.2)2.2延时延时就是将音源延迟一段时间后,再播放出来的效果处理。根据其延迟时间的长短,可产生镶边、回音、合唱等效果。当延迟的时间在335ms之间时,人耳会感觉不到滞后的声音的存在,并且滞后的声音与原音源相叠加后,会因为其相位的干涉而产生梳状滤波效应,这就是我们所说的镶边效果。如果延迟时间达到50ms以上,延迟的声音就清晰可辨,这时的处理效果称之为回音。处理回音一般都是用来产生比较简单的混响声效果。镶边、延时、回音、合唱等效果所具有的可调参数大致都相同,包括以下几项:(1)延时时间(D
20、ly),即调整主延时电路的延时时间。(2)反馈增益(FB Gain),即控制延时反馈的增益。(3)反馈高频比(Hi Ratio),即控制反馈回路上面的高频衰减。(4)调制频率(Freq),指主延时电路的调频周期。(5)调制深度(Depth),指调频电路的调制深度。(6)高频增益(HF),指控制高频的均衡。(7)预延时(Ini Dly),指调整主延时电路的预延时时间。(8)均衡频率(EQ F),这里的均衡频率用于音色的调整,即为频率选择一个均衡的中点。由于进行延时操作所产生的效果均复杂多变,如果非效果处理的专家,可以使用设备提供的预先设置的参数,因为这些预置参数给出的处理效果会比自己设置的要好。
21、2.3混响混响效果主要是用于增加音源的融合感。自然音源的延时声阵列非常密集、复杂,所以模拟混响效果的程序也复杂多变。常见参数有以下几种:(1)混响时间:能逼真的模拟自然混响的数码混响器上均有一套非常复杂的程序,虽然其拥有很多参数可调,然而相比原有的效果,调整这些技术参数都不会更为自然,特别是对于混响时间。(2)高频混降:为了产生比较自然的混响效果,此项参数用于模拟空气对高频部分的吸收效应。一般情况下高频混降的可调范围为0.11.0。高频混降越高,混响效果就越接近自然混响;相反较低时,混响效果就较清澈。(3)扩散度:扩散度可改变混响声阵密度的增长速率,其可调范围为010,位于较高值时,混响效果体
22、现出丰厚、温暖的特点;位于较低值时,混响效果就比较空旷、冷僻。(4)预延时:建立自然混响声阵会延迟一段时间,预延时即为模拟次效应而设置。(5)声阵密度:调整声阵密度参数可改变声阵的密度,当数值较高时,混响的效果为温暖,但有明显的声染色;相反,数值较低时,混响效果变为深邃,并且声染色也相对较弱。(6)频率调制:这一参数技术性较高,由于电子混响的声阵密度比自然混响的稀疏,为了让混响声听起来比较平滑、连贯,需要对混响声阵列的延时时间进行调制。此项技术可以有效的消除延时声阵列的段裂声,可以增加混响声的柔和感。(7)调制深度:指上述调频电路的调制深度。(8)混响类型:不同房间的自然混响声阵列差别也较大,
23、而这种差别也不是一两项参数就能表现的。在数字混响器当中,不同的自然混响需要不同的程序。其可选项一般有房间(Room)、小厅(S-Hall)、大厅(L-Hall)、随机(Random)、反混响(Reverse)、钢板(Plate)、弹簧(Sprirg)等。其中自然混响效果包括房间、小厅、大厅混响;早期机械式混响效果可以用钢板、弹簧混响来模拟。2.4声激励 如果对音响音源信号进行浅度的限幅处理,就会产生一种类似饱和的音感效果,从而使其发音在不增大其实际响度的基础上表现出有响度增大的效果。一些常用的效果器上也有非线性饱和的效果,实际上就是有信号的振幅处理,用来模拟三极管上的大电平信号达到饱和所引起的
24、非线性,进而产生发硬的音感效果。由于限幅失真主要是产生额外的高次谐波,因而现在设计的激励器,为了达到柔和的处理效果,在音源中, 通过加置高次载波的成分来模拟限幅失真,能营造出不那么嘶哑的声激励效果。另外,用一个高通滤波器来强化高次谐波,对原来的信号进行处理之后再叠加在经过延时处理的原信号上,这样可以产生清澈的声音效果。所以,经过这样的处理方式后便可产生出清澈的激励。由于激励处理和音响设备的过载失真大致类似,所以如果对音源进行过量的激励,就会产生令人不适的嘈杂感。由于早期的音响设备保真度都不高,我们已经慢慢习惯了那种略显嘈杂的音响,而现在接触的音感清澈的高保真音响,反而让我们不太习惯,感觉它的发
25、音十分柔弱。人声音源中,除了那些经过特殊训练的人之外,我们大部分人的发音都缺乏劲度,所以需要对声音进行激励处理。声激励处理主要有下面几个方面:(1)对人声的乐音激励处理,频谱的分布以2500Hz处为中间点。这种激励处理后的效果比较好,音源突出感的增加也很明显。(2)对人声的鼻音激励处理,频谱的分布以500Hz为中点。这种激励能有效地增加人声的劲度。(3)对于人声的800Hz附近的激励,音源的喧嚣嘈杂感大大增加,然而此处理方法不应经常使用,最好只在演唱摇滚乐时使用。(4)对人声3500-6800Hz的频谱,激励处理不适合使用,因为它容易让音源产生令人不适的嘈杂声。(5)而人声的齿音一般不使用激励
26、处理,那是由于此频段很容易让人察觉有失真。如果要对齿音做少量的激励处理,可以用数字式激励器,因为数字式激励器的激励效果比较柔和,可以增强齿音的清析感。而处理的频谱应该在7200Hz以上。激励处理对于歌唱发音通常要保守一些。我们在调音当中,因为激励处理所产生的音感效果可能会随听音的时间而逐渐被弱化,那么我们在调节激励效果时,时间最好在10分钟以内。对于人声音源的激励处理,最好是用数码效果器。它通常有以下几项调整参量:(1)输入增益(Gmn),用来进行输入电平的调节,这里千万别使设备产生过载。(2)调谐频率(Tuning),根据你需要处理的频段来选择一个恰当的频率。(3)驱动电平(Drive),用
27、来调整激励的深度。当驱动电平较大时,会产生比较嘈杂的效果;而驱动电平较小时,产生的效果则比较温和。(4)混合比率(Mix),即原信号与效果信号的响度比。2.5相位的调节 立体声的音乐作品需要进行相位的调节,这是混音中很重要的一环。这样能使混好的音乐作品层次分明,并且真正体现立体声的效果。相位的调节有左右,前后之分。左右声道的调节比较简单,一般的音频软件都可以很方便的调节,只要戴上耳机,可以很轻松的调整和听到调整后的效果。前后层次的音相调节比较复杂,一般来说,用简陋的硬件设备很难录出层次感很强的多轨音乐。只能依靠软件后期下比较大的工夫去慢慢调节。有一些专门调整音相的效果器插件,如Pan Hand
28、le,还有Ul trafunk出的Surround插件都是不错的相位调节器。前与后的关系,实际上就是混响时间长与短的关系。对于要处于后方的声音,使其混响时间更长一些,它的声音便会模糊和有距离感,对于要处于前方的声音,使其混响时间稍短一些,它的声音就会清晰和逼近。2.6整体缩混输出这一部分实际上没有什么太多可以提及的。因为我们用电脑软件来操作,和专业的母带生产流程自然不同。在多轨录音软件如Samplitude 2496,Cool Edit Pro里面编辑完成以后,选择Export命令(Cool Edit Pro里面是Mix Down命令),就可以将多轨音频合成为2轨立体声输出。你可以选择输出的格
29、式,如wav、mp3、rm等等。当然wav文件的音质最好,占的空间也要大的多。这样,辛辛苦苦的录音、编辑、混音终于有了一个成果。有时候,这样导出的.wav文件还需要处理一下。比如用母带处理软件T-racks最后小小压缩一下,使声音更加柔和温暖,更符合人耳的听觉习惯。2.7多重混响处理 多重混响的处理,大多数人都是使用反复试探性调节的方法,以寻找音感效果最好的处理效果。此种调音方式的不足十分明显:寻找一个理想的调音效果,需经多次猜测,所以需要教长的时间。较好的调音效果常常是偶然遇到的,这对于调音规律的归纳总结没什么帮助,并且以后也不易再现。不同设备的各项固定参数和可调参数都不尽相同,因而使用某一
30、设备的经验,通常都无法用于另一设备。发展到目前的效果处理设备,用于改变音源音色的手段并不是太多,比较常用的方法只有限幅失真、延时反馈、频率均衡等3种,但是这些效果处理设备的参数的不同组合所产生的音色大不一样。效果处理器参数的设置可以有很多项,特别是延时反馈,模拟混响效果参数的设置在理论上可以达到几十项。当然这些专业性非常强的参数,大多数人都难以理解。因此,绝大部分的效果处理设备都只有一、二个参数可调,并且其可调的范围也比较狭窄。这种使用简单的效果处理设备容许人们在上面进行微幅的调整,因而不会出现太大的问题。但是对于处理效果要求比较高的调音场合,如在多轨录音系统当中,就必须使用更加专业的效果处理
31、设备,用以做出更为精细的处理效果。2.8频率均衡 很明显,如果频率均衡的分段越多,那么效果处理的精细程度也就越高。一般调音的均衡单元通常只有三四个频段,这显然满足不了精确处理音源的要求。为了能足够灵活的对人声进行任意的均衡处理,我们建议使用增益、频点和宽度都可调整的四段频率均衡。大多数的频率均衡的可调参数只有增益一项,然而这并不意味着其他两项参数不存在,而且这两项参数为不可调的固定参数。当然这两项参数设置为可调也并非难事,但这些会增加设备的生产成本,并会使其调整变得复杂化。所以增益、频点和宽度都可调整的参量均衡的电路,常常只有在一些高档设备上才能见到。实际上,增益、频点和宽度都是可调整的频率均
32、衡,不可能胡猜乱试就可以找出一个接近完美的音色。在这里我们必须探究出音频信号的技术参数和物理特性以及它们在人的听感上所对应的关系。由于人声音源频谱的分布会比较特殊,就其发音方式而言,就有3个部分:一是由于声带震动产生乐音,这部分发音最灵活,还有不同发音、不同音高的方式产生的频谱的变化也很大;第二是鼻腔内形状比较稳定,所以其共鸣产生的谐音频谱的分布变化不是太大;第三是口腔中的气流流动在齿缝间的摩擦声,它与声带震动产生的乐音基本上没有关系。频率均衡可以大致的将这三部分频谱区分出来。鼻音的频率段一般在500Hz以下,均衡的中点频率大概在80150Hz,均衡带宽为4个倍频程。比如,可以将100Hz设定
33、为频率均衡的中点,均衡曲线可从100400Hz平缓的过渡,均衡增益调节的范围可以为+10dB-6dB。这里应该注意的是:进行此项调整的监听音箱不能使用低频发音不强的小箱子,这样可以避免无意间加重鼻音。人声乐音的频谱随者人声的音调的变化也很大,因而调节乐音的均衡曲线应非常平缓,均衡的中点频率可在10003400Hz之间,均衡带宽为六个倍频程。此频段影响歌唱发音的明亮度,再向上调节可温和地提升人声的亮感。然而如需降低人声的明亮度,就会麻烦一些。在一般情况下人声音感过分明亮多是由于2500Hz左右的频谱较强,这里我们可用均衡带宽为1/2倍频程,均衡增益大概为-4dB的均衡处理,在2500Hz附近找到
34、一个频点的效果比较好即可。人声齿音的频谱分布主要在4kHz以上。由于此频段也包括了部分乐音频谱,因此建议调节齿音的频段为616KHz,均衡带宽为三倍频程,均衡中点频率在1012KHz,均衡增益最大可调至+10dB;如果需要使人声齿音响度降低,则应使用均衡带宽为1/2倍频程,均衡中点频率为6800Hz的均衡处理,其均衡增益可下降至-10dB。从上面的分析可以看出,在进行人声频率均衡处理时,为突出某一音感进行频段的提升,都应该尽量地使用平缓的宽频带来均衡。这样可以使人的鼻音、乐音、齿音三部分频谱分布均匀连贯,使其发音更加自然、流畅。理论上讲,应使人声在发出任何音时,其响度都应保持恒定不变。为了在不
35、破坏人声自然感的基础上对其进行特定的效果处理可以使用1/5倍频程来均衡处理,具体情况有以下两种:(1)音感狭窄,缺乏厚度,可以在800Hz处用1/5倍频程衰减来处理,衰减最大值可以在-3dB。(2)卷舌齿音的音感尖啸,嘘音缺乏清澈感,可在2500Hz处用1/5倍频程的衰减处理,其衰减的最大值可以在-6dB。对音源的均衡处理,最好是使用能显示均衡的曲线的均衡器。一般数字调音台均衡器上的均衡增益的调节用按钮 “G”来标识,均衡频率调节钮用“F”来标识,均衡带宽调节钮用“F”或“Q”来标识。3 音频信号与MATALB3.1音频信号的格式(1)WAV格式WAV文件格式由微软公司开发,它符合 PIFF文
36、件规范,用于保存WINDOWS平台上的音频信息资源,它支持WINDOWS平台和应用程序。“.WAV”格式支持MSADPCM等压缩算法,并且支持多种采样频率、声道及音频位数,和CD格式一样,标准格式的WAV文件也是44.1K的采样频率,速率88K/秒,量化位数为16位。所有的WAV文件都是有一个文件头的,这个文件头就是音频流的编码参数。WAV对音频流的编码没有一定的要求,除PCM之外,几乎所有支持ACM规范的编码都可以对WAV的音频流进行编码。同样,WAV也可以使用多种的音频编码来压缩其音频流,只不过我们常见的音频流都是被PCM编码所处理的,但并不是WAV只能使用PCM编码,而MP3编码同样也可
37、以运用在WAV中。在Windows中,基于PCM编码的WAV格式是被支持得最好的音频格式,当中所有音频软件都能完美支持,由于其本身可以达到较高的音质要求,因此,WAV也是音乐编辑创作的首选格式,也适合保存音乐素材。基于PCM编码的WAV是一种中介格式,经常用于其他编码的相互转换,比如MP3转换成WMA。(2)MP3格式MP3格式指的是MPEG标准中的音频部分,也就是MPEG的音频层。根据其压缩的质量和编码处理的不同将它分为3层,分别是“.mp1”、“.mp2”、“.mp3” 3种声音文件。MPEG音频文件是有损压缩,相同长度的音乐文件,用.mp3格式储存,一般只有.wav文件的1/10,而且音
38、质没有CD格式和WAV格式好。但是其文件尺寸小,而且音质好,在它问世之初其它的音频格式不能与之匹敌。直到现在,MP3格式还在风靡,其主流音频格式的地位难被撼动。(3)WMA格式WMA就是经Windows Media Audio编码后的文件格式,由微软开发,WMA针对的不是单机市场,而是网络。它的竞争对手就是网络媒体市场中著名的Real Networks。微软声称,只有在64kbps的码率情况下,WMA才可以达到接近CD的音质。和以往的编码不同,WMA支持防复制的功能,它通过Windows Media Rights Manager 加入保护,能限制播放的时间和播放的次数甚至于播放的机器等等。WM
39、A还支持流技术,即一边读一边播放,因此WMA可以很轻松的实现在线广播,微软在Windows中加入了对WMA的支持,并且WMA有着优秀的技术特征,在微软的大力推广之下,这种格式正被越来越多的人所接受。(4)OGG格式随着MP3播放器的流行,生产MP3播放器的品牌和厂家越来越多,它们的竞争也越来越激烈,还有MP3手机的挤压,所以许多上游MP3随身听厂商纷纷寻找其它出路,有的在外观上改变创新,有的在做工上更加求精,有的推出更大容量的机型,还有的改进解码功能,支持新的文件格式。而在众多的新格式当中,OGG凭借其免费、开源的特点,得到了MP3播放器厂商的青睐。这里所说的OGG的全称是OGG Vobis。
40、OGG是一个庞大的多媒体开发计划的项目名称,其涉及视频音频等方面的编码开发。Vobis是某音乐作品中一个人物的名字,这里借用它来说明OGG Vobis是关于音频方便的。OGG Vobis有一个很出众的特点,就是支持多声道,它的流行,使以后用随身听来听DTS编码的多声道作品将不再是梦想。在压缩技术上OGG Vobis比MP3好,但稍逊于MP3po,但是它的多声道、免费、开源等特点,能够让它很有可能成为一个流行的趋势,这也正是一些MP3播放器对其支持的原因。(5)APE格式APE是由Monkeys Audio提供的一种无损的压缩格式。Monkeys Audio提供了Winamp的插件支持,这就意味
41、着压缩后的文件不再是单纯的压缩格式,而是和MP3一样可以播放的音频文件格式。由于这种格式的压缩比远低于其他的格式,能够做到真正的无损,因此获得了不少发烧用户的青睐。在现有的不少无损压缩方案种,APE是一种有着突出性能的格式,极低的压缩比以及快速的压缩速度,成为了不少朋友私下交流发烧音乐的一个选择。(6)ACC格式AAC(高级音频编码技术)是一种为音乐社区提供的技术,来自于杜比实验室。AAC号称最大能容纳48通道的音轨,其采样率达96 KHz,并在320Kbps的速率下能为5.1声道的音乐节目提供近似于ITU-R广播的品质。与MP3比较起来,其音质比较好,还能够节省大约30%的储存空间和带宽。它
42、遵循MPEG-2的规格。3.2 MATLAB能读取的音频格式利用专门的音频处理软件,比如CoolEdit、Spectralab等,可以方便的录制声音、分析频谱。这种方式也无需复杂的操作或者专业知识,就可以实时的观察结果。利用这些软件在平时实验数据的测量和分析中,足够用了;但是这些软件处理的数据精细程度往往不够,无法应用于论文中。这种情况下,就需要把音频文件导入到MATLAB中进行处理。而MATLAB能直接输入输出的有.wav和.au文件。下面我将利用MATLAB载入一首.wav格式的歌曲来进行混响的操作。4 设计步骤和编程4.1用MATLAB读取一段音频信号这里以Taylor Swift的22
43、为例。x,fs,bits=wavread(22.wav);%读取音频信号,采样值放在向量x中,fs表示采样频率(Hz),bits表示采样位数。4.2对音频信号进行混响 fs=44100;Nbits=16;x,fs,bits=wavread(22.wav);%读取名为“22”的音频文件。a=zeros(100,1); zeros(100,1);x;%对音频文件进行延时,延时时间为25ms。b=zeros(100,1);x; zeros(100,1);%另一路延时,时间为12.5ms。c=x;zeros(100,1); zeros(100,1);%原信号。y=a+b+c;%将两路延时与原信号叠加。
44、4.3播放混响后的音频信号fs=44100;Nbits=16;x,fs,bits=wavread(22.wav);a=zeros(100,1); zeros(100,1);x;b=zeros(100,1);x; zeros(100,1);c=x;zeros(100,1); zeros(100,1);y=a+b+c;sound(y,fs);%回放经叠加混响后的音频信号。4.4全通结构的混响器fs=44100;Nbits=16;x,fs,bits=wavread(22.wav);a=zeros(100,1); zeros(100,1);x;b=zeros(100,1);x; zeros(100,1
45、);c=x;zeros(100,1); zeros(100,1);y=a+b+c;d=0.5;%反馈增益为0.5。Az1=d,0,0,0,0,0,0,1;Bz1=1,0,0,0,0,0,0,d;z=filter(Az1,Bz1,y);%进行全通滤波混响后的音频信号。sound(z,fs);%回放最后的混响效果。5 实验步骤(1)打开MATLAB软件,输入程序fs=44100;Nbits=16;x,fs,bits=wavread(22.wav);载入歌曲,如图5.1。图5.1载入歌曲(2)输入延时叠加程序a=zeros(100,1); zeros(100,1);x;b=zeros(100,1);x; zeros(100,1);c=x;zeros(100,1); zeros(100,1);y=a+b+c;进行叠加混响,如图5.2。图5.2混响操作(3)输入回放命令sound(y,fs);进行音频回放,如图5.3。图5.3回放操作此时就可以听到混响后的歌曲。(4)同理,可输入fs=44100;Nbits=16;x,fs,bits=wavread(22.wav);a=zeros(100,1); zeros(100,1);x;b=zeros(100,1);x; zeros(100,1);c=x;zeros(100,1); zeros(100,1);y=a+b+c;