《汉语擦音的实验分析.ppt》由会员分享,可在线阅读,更多相关《汉语擦音的实验分析.ppt(41页珍藏版)》请在三一办公上搜索。
1、汉语擦音的实验分析,擦音概说,定义:擦音是声道中有阻碍但没有完全闭塞,气流从缝隙中摩擦发出的辅音。擦音不是每一种语言都出现的音类,它不如爆发音普遍。擦音最常见的部位是舌尖。现代汉语方言擦音丰富,每一种方言都至少包括一个舌尖擦音/s/。汉语方言中擦音最少的为两个(厦门话),最多的为8个(青岛话,上海话)。清擦音比浊擦音占绝对优势。,关于擦音研究的综述,对擦音进行声学方面的调查是一项有意义的课题,尽管擦音性质非常复杂,不像元音、塞音相对简单,他们的声学特征是含时长变量的连续体,而不是冲直条。关于英语和其他一些语种擦音研究的文献已有很多,但是关于汉语擦音研究的相对较少。此外,早期的擦音研究偏重于单音
2、节中的声学特征与音渡现象(Fant,1960;Fant,1977;Stevens,1960;Stevens,1987;Shoup,1976;Ladefoged吴宗济,1988等等)。,关于擦音研究的综述,自从20世纪50年代以来,强频集中区及其过渡被认为是擦音的全部特征。因此,对擦音的研究多重于这两方面的考察。但是,由于擦音本身的复杂性,其中可能还包含其它重要的因素,比如音节内部辅音可能有的各种协同发音作用等等,吴宗济先生在普通话清擦音协同发音的声学模式一文中曾经提到过这种说法。,研究擦音(格局)的原因和意义:,辅音是音素的一大类别,辅音种类繁多,特征各异,而且多具离散性。在辅音的研究中要按类
3、别分为不同的系列,实验的程序方法和测算的指标也各有不同。辅音格局的研究是语音格局研究的重要内容。元音、声调在声学表现上往往具有较长的时长,其本身的声学特征容易考察分析,而辅音则略显复杂。,研究擦音(格局)的原因和意义:,首先是辅音的种类很多,其下位类别包括塞音()、擦音、塞擦音、鼻音、边音、颤音、闪音等。这些辅音不管是在发音特征上,还是声学表现上都很不相同,要进行整体贯通的辅音格局分析是很困难的。其次,很多辅音本身的声学特征不容易提取,例如塞音,其时长非常短,一般都在数十毫秒以内。而有的辅音虽然时长较长,但怎样提取到充分体现其声学特点的数据很不容易,例如擦音、鼻音等。进行辅音格局研究应该在总体
4、的格局观念方法指导下,按不同种类辅音的特点,分类别进行考察。换言之,就是在总体的辅音格局下进行不同的下位子格局研究。),在所有辅音中,塞音是最能体现辅音特点的一类音,它在发音时声道形成有完全的闭塞,塞音格局的分析是辅音格局研究的重要内容。擦音在发音时气流通过声道中狭窄的摩擦缝隙,也是辅音发音特点的重要体现,擦音格局的分析也是辅音格局研究的重要部分。冉启斌(2011,当代外语研究 辅音声学格局研究),汉语普通话清擦音的声学空间分析冉启斌(2008,第八届中国语音学学术会议),一、前言,1、研究对象:汉语普通话清擦音普通话声母当中清擦音共有5个,是12345、/f/、/x/。声母r的语音性质,研究
5、者们曾有各种不同看法,有人认为是浊擦音,也有人认为是浊通音、闪音,还有人认为是半元音、元音等(焦立为等2004:262)。石锋、廖荣蓉(1987)用声学实验的方法研究了普通话的r声母,指出声母r在部位和方法上都存在变体,本身在语音性质上并不是单一的,正因为如此才出现不同研究者看法的分歧。由于r声母不是单纯的擦音,所以本节考察擦音只包括普通话中的前述5个清擦音。,2、研究任务:,本文利用 Svantesson(1986)的方法对普通话 5个清擦音的声学空间重新进行了分析。由于Svantesson(1986)所用的发音语料很少,1)得到的结论在更多的语料中是否仍然如此;2)同时,擦音空间分析的方法
6、在不同擦音的区分效力上如何;3)以及擦音空间分析的各项参量存在哪些内在关系,这都还可以进一步进行考察。结果看到,1)/s/的谱重心最高,分散程度最小,分布范围最小;/x/的谱重心最低,分散程度最大,分布范围最大。2)普通话 5个清擦音可以分为两类,谱重心高而分散程度小、分布范围小的一类/s/、/、/./;谱重心低而分散程度大、分布范围大的一类/f/、/x/。3)擦音某个时间点上的能量分布情况与该擦音在一段时间上的整体表现具有一致性。文章分析指出,这种一致性与擦音的发音生理具有密切关系。,3、研究方法Svantesson(1986)的方法,辅音中的擦音具有较长的时长,和短暂的爆发音相比,擦音的频
7、谱能够相对容易地考察到。利用不同擦音的频谱特性,分析得到相关数据,可以做出擦音的声学空间图。Svantesson(1986)对汉语普通话中的六个擦音声母(包括 r声母)和六个塞擦音声母进行了研究。Svantesson研究的方法是通过临界带谱计算出各个声母的频谱重心(center of gravity),在频率轴上能量的分散程度(dispersion)参数,以及不同声母的平均强度级(mean intensity level)。以上述三个参量中的任意两个参量作为二维坐标,便可以形成一个擦音空间。不同擦音由于其参量的不同在二维坐标中就有了一定的位置。,本文所用的声学参量谱重心、分散度,1)谱重心:所
8、有临界带内最强频率的集中区域;2)分散程度:该时间点上能量在整个频率范围内的分散情况。(一般地说,擦音的特性主要表现在强频集中区的不同分布状况上,包括强频集中区的位置高低及强频集中区的分散程度。)为什么不用Svantesson(1986)平均强度级这个声学参量?不同的擦音在音强上是有差别的,但是音强也不是一个绝对参量,它与发音时用力的程度、录音时的不同增益等都有关系。只有在这些外在条件完全相同的情况下音强才具有可比性。因此,在本文的擦音空间分析中我们只取谱重心和分散程度这两个相对不容易变化的参量为考察对象,只对由谱重心和分散程度构成的二维空间进行分析。,3、这种分析方法的意义,这种方法提取了不
9、同擦音的声学参量,这些参量基本上能反映不同擦音的声学特性。并且,由于各个擦音在声学空间中都有了一定位置,也就可以对不同语言中的擦音进行对比。Svantesson说:“这种做出临界带谱并计算出有关参量的方法,使得在擦音空间中显示一种语言中某个擦音的位置特点成为可能,并可以比较不同语言中的擦音。”另外,利用这种擦音声学空间分析的方法,还可以对不同方言点中的所有擦音进行较为全面的考察,从声学角度发现方言中擦音的很多细微表现。,二、实验方法与材料,1、谱重心和分散程度的计算 1)声学参量的测量方法:按 Svantesson(1986),谱重心和分散程度的测量方法为,先在擦音的某个时间点上做快速傅立叶变
10、换(FFT),得到该点的即时功率谱。然后将即时功率谱转换为临界带(critical band)谱。转换为临界带谱的原因主要是为了匹配人耳的听觉特性。,2)计算公式,a.划分临界带的公式为:fn=650 sinh(n/7)其中得到的 fn就是第 n个临界带的频率上限。由于第 1个临界带的频率范围在 093Hz之间,对语音研究的意义不大,一般只取后面的 23个临界带进行分析。b.频谱重心的计算公式为:这样得出的结果 m为2-24之间的一个数值,表示谱重心在第个临界带。c.分散程度的计算公式为:这样得出的结果 s为分散程度的一个参量。上述公式中的值为:,2、实验操作与语料,本文发音人为一名北京生北京
11、长的青年女性。发音表为带有普通话清擦音声母的二字组各 25个(发音表从略)。擦音前面和后面邻接有不同类型的元音。录音采样频率为 22050Hz。计算擦音某个时间点上的谱重心和分散程度时选取波形图上能量相对较强的位置,计算出的数值即该点的声学参量。对一段擦音做擦音空间图时一般选择擦音中间的一段,长度约 50毫秒。数据的统计分析使用 SPSS10.0完成。测量数据及分析结果均精确到百分位。,2、实验操作与语料,我们以谱重心作为横坐标,以分散程度作为纵坐标,将按照上述公式计算出的数值绘入坐标系中,得到该擦音在擦音空间中的位置。桌上语音工作室(MiniSpeechLab)能够按照上述公式自动计算出擦音
12、某个点上的谱重心、分散程度和平均强度级。本文只取谱重心和分散程度进行考察。同时,在波形图上选择擦音的一段,桌上语音工作室还能够自动对该段作谱重心和分散程度的分析,并在二维坐标中画出相应的点。,三、实验结果与分析,实验分为两个方面:一是从擦音的波形图上取一点计算其谱重心和分散程度;二是在擦音波形上选取一段作出擦音空间图。录音时每个擦音声母各 25个样本,由于有的文件意外受损,声母 s和 h的实际样本只有 17个。测得所有擦音某时间点上谱重心和分散程度的数据较多,这里从略。,1、五个清擦音的谱重心与分散程度,计算得到的五个清擦音的谱重心与分散程度的平均值结果见下表 1。,数据结果分析,1)谱重心:
13、s的谱重心是最高的,为 22.36临界带单位,换算成赫兹,大约在 8000Hz左右。h的谱重心最低,为 15.99临界带单位,大约在 3000Hz左右。2)从分散程度上看,h的分散程度最高,为 4.72,f的分散程度也很高,达到 3.95;分散程度最低的是 s,为 1.38;x、sh两个声母的分散程度数值也比较小。,谱的重心与擦音的能量集中区具有一定的关系。一般能量集中在某个频率范围,谱的重心也会离这个频率范围不远。由谱重心得出的擦音的相对关系从能量集中区及音强方面得到的擦音的相对关系大致一致,只是f的谱重心略高。,数据结果分析,3)五个擦音大致显示出分为两组的趋势。按分散程度得出的擦音的相对
14、关系与它们长度上的关系是完全一致的,即 h、f为一组,s、x、sh为一组。前一组在时长上比较短,音强上比较弱,在能量集中区、谱重心上则相对较低;后一组在时长上比较长,音强上比较强,在能量集中区、谱重心上则相对较高。,发音生理原因分析,我们认为这是由不同擦音发音时的不同生理状态决定的。不同擦音收紧处缝隙的大小是不同的。s、x、sh三个音的缝隙较小,而h、f相对较大。由于 h、f发音时开口缝隙较大,从而造成气流泄露的面积较宽,形成平流(阻碍缝隙和气流速度越大则摩擦噪声越强,为湍流;反之,为平流)的成分较多,在高频区以及在某个频率范围上的能量都降低了,这样就造成整个谱的重心下降,能量的分散程度增加。
15、初步认为正是由于缝隙大小的不同造成了这5个擦音声学 表现上的各种差异。,与Svantesson(1986)数据比较,比较结果:1)具体数值上存在差异:本表显示 s的谱重心为最高,其次是 x,f,sh,h。这种顺序与表 1一样。分散程度表 2中最高的是 f,最低的为 x,与表 1略为不同。2)总体数据上,表 1各个擦音数值的跨度更大,相互的区别更明显。相比之下,表 2的数值跨度略小,换言之,不同擦音参量之间仍然存在差异,但差别较小。这可能是表 2将四个发音人的数值进行了平均的结果,也可能Svantesson(1986)的语料相对较少有关。不过从 f、h与 s、x、sh两组的情况来看则它们的相互关
16、系在总体上仍然一致。,2、擦音空间分析的方法在不同擦音的区分效力,本文得到的五个普通话清擦音的谱重心参量和分散程度参量在区分不同擦音的效果怎样?即五个擦音分别在谱重心和分散程度上的差异是否显著?为此分别进行了多变量的 Post-Hoc检验,以显著性系数的大小来判别几个擦音之间是否能够得到区分。结果发现,根据谱重心能够两两之间进行区分的有以下擦音对:f-h,s-sh,s-h,sh-x,sh-h,x-h,上述擦音对之间的显著性系数都小于 0.05。根据分散程度能够两两之间进行区分的有以下擦音对:f-s,f-sh,f-x,s-h,sh-h,x-h,上述擦音对之间的显著性系数也都小于 0.05。,综合
17、上面的谱重心和分散程度两组参数,至少有一组参数能够区分的有如下擦音对:f-h,s-sh,s-h,sh-x,sh-h,x-h,f-s,f-sh,f-x.,共 9对。普通话 5个清擦音的两两组合只有 10种情况,换言之,5个清擦音按照谱重心和分散程度实际上只有一对不能进行区分,其余的擦音之间都能够区分出来。不能区分的一对是 s和 x。从数值上看,s和 x无论是在谱重心还是分散程度上差别的确都非常小(见表 1)。不过从整体上看来,利用谱重心和分散程度两个参量对普通话的清擦音进行分析能够显示出绝大多数擦音之间的区别。,2、利用谱重心和分散程度参量考察擦音空间,“桌上语音工作室”的“一段辅音的参数图”功
18、能能够作出以谱重心为横坐标、分散程度为纵坐标的二维平面图。作一段辅音的参数图时在该段上取若干个点,分别计算出谱重心和分散程度。这样作出的普通话 5个清擦音的二维图如图 1所示。其中每个擦音取的是多个音节上的多个样点。,在擦音空间图上,s处于最低、同时也是最右的位置,表明 s的谱重心最高,分散程度最小。的位置比s略为靠左,且略为靠上,表明的谱重心也很低,分散程度也很小。的位置更靠左,且比s、都略高,表明其谱重心相对低一些,分散程度稍大。x、f在高度上的总体位置几乎一致,表明二者的的分散程度差不多,但 x的总体位置明显在 f左边,表明 x的谱重心比 f低。,上文我们曾从同一个擦音的若干个音节中各取
19、一个点,计算了它们谱重心和分散程度的平均值;这里我们又对同一个擦音的若干个音节中的一段取出谱重心和分散程度进行作图,从得到的结果看二者是相当一致的。从擦音空间图上能直观看到的另一个信息是各个擦音面积的大小,也即各个擦音样点的分布范围。s的面积最小,分布范围最集中。、的范围比s略大。最大的是 x和f,x在纵轴(分散程度)上跨越约 5个单位(26);f在纵轴上跨越 6个单位(27)。在横轴(谱重心)上,f跨越约 6个单位(1823),x则跨越约 10个单位(1120)。从整体上看普通话的五个清擦音都集中在二维图的右半部分,相互之间拉开的距离不是太大。这主要与五个清擦音的声学特性有关,同时也与横轴的
20、标度具有一定的关系。横轴的标度本身比较密集,如果将标度扩大,五个擦音之间的距离应该会有一定程度的改善。,从前面分析的情况我们能够看出一种内在的联系,即擦音某个点上的能量分散程度与该擦音一个段落上的谱重心和分散程度的变化情况具有一致性。例如x,我们计算出它在一个点上的能量分散程度是最大的(平均值 4.72,见表 1)同时在该擦音的一段长度上谱重心与分散程度的变化范围也是最大的(见图 1)简单说来,擦音在频率轴上的能量分散程度与时间轴上参量的变动情况具有一致的关系。这两者一个是频域上的情况,一个是时域上的情况。频域上的分散程度大暗含着时域上的变动也大;反之亦然。,擦音的参量为何出现频域和时域上的对
21、应关系呢?,这应该是由于发音上的原因。频域上的分散程度反映了发音时摩擦缝隙的大小,一般摩擦缝隙越大则能量在频域上的分散程度也越大。同时,摩擦缝隙大也使气流呼出的特性在时间上不稳定,容易出现波动。这样便出现擦音参量特性在频域和时域上的对应关系。,四、结语,本文利用 Svantesson(1986)提出的方法重新分析了普通话 5个清擦音在声学空间中的表现。重点在于探讨:Svantesson(1986)的结论是否能够在更多的语料中得到一致的结果;擦音的空间参量对于区分不同擦音的效力如何;以及擦音各声学参量之间具有怎样的内在关系。,本文以擦音空间分析的参量为基础,对普通话的 5个清擦音进行了统计区分。
22、分析看到,除 s和 x之外,其他擦音在谱重心和分散程度的差异上是显著的。换言之,谱重心和分散程度两个参量对于大多数擦音能够进行有效的区分。另外,本文还探讨了擦音多项声学特征之间的内在关系。指出普通话 5个清擦音在声学空间中可以分为两类,谱重心高而分散程度小、分布范围小的一类/s/、/、/;谱重心低而分散程度大、分布范围大的一类/f/、/x/。分析看到,擦音在频域上谱重心较高,则一般分散程度较低,在时域上长度较长,参量变动也较小。反之亦然。这种内在关系根源于擦音特定的发音生理。,四、结语,擦音格局分析,冉启斌(2011,当代外语研究 辅音声学格局研究),引言,在上面进行的擦音声学空间分析中,不同
23、擦音虽然占据不同位置,但各个擦音之间在分布范围上常常存在重合和交叉。为使各个擦音相互之间的关系更清楚地表现出来,冉启斌和石锋()使用语音格局分析的思路,对频谱重心参数和分散程度参数分别进行相对化处理。,相对化处理,1)频谱重心()的相对化处理公式:()()(其中表示个擦音中谱重心的最大值,表示个擦音中谱重心的最小值,为某个擦音的谱重心值。)2)分散程度()的相对化处理公式:()()(上式中各项数据的含义与频谱重心相同,这里不再赘述。),按照上述公式做出的北京话清擦音格局,从北京话个清擦音的格局图可以看到,普通话中的分散程度最大,频谱重心最低;的分散程度最小,频谱重心最高。二者处在格局图的两个顶
24、点位置上,确定了擦音格局图的范围,其他擦音处在这个范围以内。,和的极端性是它们各自特有的声学特性的反映,这是由不同的发音生理状态产生的。两者发音体的质地、肌肉软硬各不相同,靠软腭和舌面产生摩擦,缝隙面积较大,肌肉柔软,是柔性的摩擦;是由舌尖和齿龈产生摩擦,缝隙面积较小,骨质较硬,属于刚性的摩擦。擦音格局较好地揭示了不同擦音各自的声学特性和相互之间的对比关系。,图2 北京话擦音格局图,图2 北京话擦音格局图,声学空间图与声学格局图,Questions:,1)声学空间与声学格局2)提取波形图上的一点与一段目的是什么3)声学参量谱重心、分散程度各自含义4)如何理解“擦音在频率轴上的能量分散程度与时间
25、轴上参量的变动情况是有一致关系的”?,擦音分析研究的应用,擦音空间是二维的,但由于它是从一段擦音样点得出的声学数据,所以实际上反映了擦音三个方面的信息,即某个时间点上频谱重心的高低,分散程度的大小,以及频谱重心、分散程度在时间维度上的变化情况。擦音空间分析综合了这三个方面的信息,不同擦音在声学频谱上的特点基本上能够从擦音空间中直观地反映出来,因而对于揭示擦音的语音特性以及比较不同擦音之间的差异具有较为明显的意义。,通过提取计算其频谱重心和能量的分散程度从而建立二维坐标,能够使不同擦音各自的声学特性得到直观的展示,并使不同语言(方言)擦音的对比分析更加便捷有效。,冉启斌()曾使用擦音声学空间分析
26、的方法对除北京话之外的青岛话、上海话、湘潭话、南宁话、厦门话等个方言点中的所有擦音进行较为全面的考察,从声学的角度看到了方言中擦音的很多细微表现。以喉擦音为例,上海话的由于属于清喉擦音,而浊擦音并非真正的带音擦音,而是相当于元音性质;湘潭话的 基本上是清喉擦音;厦门话中的则摩擦非常弱,能量很小。,1、方言研究方面关于汉语方言擦音的不同声学空间特性,在所有擦音中,舌尖擦音是最为常见的。冉启斌()在冉启斌()有关数据的基础上专门以汉语方言中的舌尖前擦音音位为例对比分析了北京话、青岛话、上海话、湘潭话、南宁话、厦门话等个方言点这一擦音的声学特点,并结合以往研究分析了这些舌尖擦音的异同。通过这些分析可
27、以看到,不同方言虽然使用相同的音标符号,但是这些音标符号的所指在语音特性上可能具有很大的差异。同时,不同语言(方言)间语音的差别也表现在其音位变体的不同上。,2、语言习得方面,中国学生习得英语:通过汉英擦音对比分析,深层次认识各自发音的方法和特点,找出发音不标准,不规范的原因,从而进行纠正改善,提高二语习得水平。比如,汉语中的卷舌音sh和英语中的舌叶音/有所不同,二者都是擦音系列,但是发音部位不同,所表现出来的声学特征也不同;再如英语中的/v/和汉语中的/w/不同,因此,很多学生就会把very发成/weri/,把visit发成/wizit/,主要原因是汉语普通话里没有摩擦浊音/v/。,外国学生习得汉语普通话:比如,泰国学生发r不标准,经过录音进行语图分析发现,母语者的语图乱纹中夹杂着横杠,在400赫兹左右较为明显,泰国学生的语图只有浊音横杠,没有乱纹,更接近于边音/l/。在对外汉语教学中,声母r是一个难点,石锋、廖荣蓉在对外汉语教学中r声母音质的实验研究一文中针对汉语普通话这个声母的音质特征和外国学生发音的出错类型,指出了几条关于发音教学的具体措施。,Thank you!,