汉语擦音的实验分析
关于擦音研究的综述
• 对擦音进行声学方面的调查是一项有意义的课题, 尽管擦音性质非常复杂,不像元音、塞音相对简 单,他们的声学特征是含时长变量的连续体,而 不是冲直条。 • 关于英语和其他一些语种擦音研究的文献已有很 多,但是关于汉语擦音研究的相对较少。此外, 早期的擦音研究偏重于单音节中的声学特征与音 渡现象(Fant,1960; Fant,1977;Stevens,1960; Stevens,1987;Shoup,1976;Ladefoged&Wu,1984;吴宗 济,1988等等)。
3、研究方法——Svantesson(1986)的方法
• 辅音中的擦音具有较长的时长,和短暂的爆发音相比, 擦音的频谱能够相对容易地考察到。利用不同擦音的频 谱特性,分析得到相关数据,可以做出擦音的声学空间 图。 • Svantesson(1986)对汉语普通话中的六个擦音声母 (包括 r声母)和六个塞擦音声母进行了研究。 Svantesson研究的方法是通过临界带谱计算出各个声母 的频谱重心(center of gravity),在频率轴上能量的分 散程度(dispersion)参数,以及不同声母的平均强度级 (mean intensity level)。以上述三个参量中的任意两个 参量作为二维坐标,便可以形成一个擦音空间。不同擦 音由于其参量的不同在二维坐标中就有了一定的位置。
二、实验方法与材料
• 1、谱重心和分散程度的计算 1)声学参量的测量方法:
按 Svantesson(1986),谱重心和分散程度的测 量方法为,先在擦音的某个时间点上做快速傅立 叶变换(FFT),得到该点的即时功率谱。然后将 即时功率谱转换为临界带( critical band)谱。转 换为临界带谱的原因主要是为了匹配人耳的听觉 特性。
数据结果分析
1)谱重心:s的谱重心是最 高的,为 22.36临界带单 位,换算成赫兹,大约 在 8000Hz左右。 h的谱 重心最低,为 15.99临界 带单位,大约在 3000Hz 左右。 谱的重心与擦音的能量集中区 2)从分散程度上看,h的 具有一定的关系。一般能量集 分散程度最高,为 4.72, 中在某个频率范围,谱的重心 f的分散程度也很高,达 也会离这个频率范围不远。由 到 3.95;分散程度最低 谱重心得出的擦音的相对关系 从能量集中区及音强方面得到 的是 s,为 1.38;x、sh 的擦音的相对关系大致一致, 两个声母的分散程度数 只是f的谱重心略高。 值也比较小。
发音生理原因分析
• 我们认为这是由不同擦音发音时的不同生理状态决定的。 不同擦音收紧处缝隙的大小是不同的。s 、 x 、 sh三个音 的缝隙较小,而h、f相对较大。由于 h、f发音时开口缝隙 较大,从而造成气流泄露的面积较宽,形成平流(阻碍缝 隙和气流速度越大则摩擦噪声越强,为湍流;反之,为平 流)的成分较多,在高频区以及在某个频率范围上的能量 都降低了,这样就造成整个谱的重心下降,能量的分散程 度增加。 • 初步认为正是由于缝隙大小的不同造成了这5个擦音声学 表现上的各种差异。
重要体现,擦音格局的分析也是辅音格局研究的重 要部分。冉启斌(2011,当代外语研究 辅音声学 格局研究)
汉语普通话清擦音的声学空间分析
冉启斌
(2008,第八届中国语音学学术会议)
一、前言
• 1、研究对象:汉语普通话清擦音
• 普通话声母当中清擦音共有5个,是12345 、/f/、/x/。 声母r的语音性质,研究者们曾有各种不同看法,有人认 为是浊擦音,也有人认为是浊通音、闪音,还有人认为是 半元音、元音等(焦立为等2004:262)。石锋、廖荣蓉 (1987)用声学实验的方法研究了普通话的r声母,指出 声母r在部位和方法上都存在变体,本身在语音性质上并 不是单一的,正因为如此才出现不同研究者看法的分歧。 由于r声母不是单纯的擦音,所以本节考察擦音只包括普 通话中的前述5个清擦音。
三、实验结果与分析
• 实验分为两个方面:一是从擦音的波形图 上取一点计算其谱重心和分散程度;二是 在擦音波形上选取一段作出擦音空间图。 录音时每个擦音声母各 25个样本,由于有 的文件意外受损,声母 s和 h的实际样本只 有 17个。测得所有擦音某时间点上谱重心 和分散程度的数据较多,这里从略。
1、五个清擦音的谱重心与分散程度 • 计算得到的五个清擦音的谱重心与分散程 度的平均值结果见下表 1。
汉语擦音的实验分析
擦音概说
• 定义:擦音是声道中有阻碍但没有完全闭 塞,气流从缝隙中摩擦发出的辅音。
• 擦音不是每一种语言都出现的音类,它不 如爆发音普遍。擦音最常见的部位是舌尖。 现代汉语方言擦音丰富,每一种方言都至 少包括一个舌尖擦音/s/。
• 汉语方言中擦音最少的为两个(厦门话), 最多的为8个(青岛话,上海话)。清擦音 比浊擦音占绝对优势。
研究擦音(格局)的原因和意义:
• 首先是辅音的种类很多,其下位类别包括塞音(sto p)、擦音、塞擦音、鼻音、边音、颤音、闪音等。这 些辅音不管是在发音特征上,还是声学表现上都很不相 同,要进行整体贯通的辅音格局分析是很困难的。 • 其次,很多辅音本身的声学特征不容易提取,例如塞音, 其时长非常短,一般都在数十毫秒以内。而有的辅音虽 在所有辅音中,塞音是最能体现辅音特点的一类音, 然时长较长,但怎样提取到充分体现其声学特点的数据 它在发音时声道形成有完全的闭塞,塞音格局的分 很不容易,例如擦音、鼻音等。进行辅音格局研究应该 析是辅音格局研究的重要内容。擦音在发音时气流 在总体的格局观念方法指导下,按不同种类辅音的特点, 分类别进行考察。换言之,就是在总体的辅音格局下进 通过声道中狭窄的摩擦缝隙,也是辅音发音特点的 行不同的下位子格局研究。)
2、研究任务:
• 本文利用 Svantesson(1986)的方法对普通话 5个清擦音 的声学空间重新进行了分析。由于Svantesson(1986)所 用的发音语料很少,1)得到的结论在更多的语料中是否 仍然如此;2)同时,擦音空间分析的方法在不同擦音的 区分效力上如何;3)以及擦音空间分析的各项参量存在 哪些内在关系,这都还可以进一步进行考察。 • 结果看到, 1) /s/的谱重心最高,分散程度最小,分布 范围最小; /x/的谱重心最低,分散程度最大,分布范围 最大。 2)普通话 5个清擦音可以分为两类,谱重心高而 分散程度小、分布范围小的一类/s/、//、/./;;谱重心低 而分散程度大、分布范围大的一类 /f/、/x/。 3)擦音某 个时间点上的能量分布情况与该擦音在一段时间上的整体 表现具有一致性。文章分析指出,这种一致性与擦音的发 音生理具有密切关系。
与Svantesson(1986)数据比较
比较结果: 1)具体数值上存在差异:本表显示 s的谱重心为最高,其次是 x,f,sh, h。这种顺序与表 1一样。分散程度表 2中最高的是 f,最低的为 x,与 表 1略为不同。 2)总体数据上,表 1各个擦音数值的跨度更大,相互的区别更明显。 相比之下,表 2的数值跨度略小,换言之,不同擦音参量之间仍然存在 差异,但差别较小。这可能是表 2将四个发音人的数值进行了平均的结 果,也可能Svantesson(1986)的语料相对较少有关。不过从 f、 h与 s、x、sh两组的情况来看则它们的相互关系在总体上仍然一致。
关于擦音研究的综述
• 自从20世纪50年代以来,强频集中区及其 过渡被认为是擦音的全部特征。因此,对 擦音的研究多重于这两方面的考察。 • 但是,由于擦音本身的复杂性,其中可能 还包含其它重要的因素,比如音节内部辅 音可能有的各种协同发音作用等等,吴宗 济先生在《普通话清擦音协同发音的声学 模式》一文中曾经提到过这种说法。
2)计算公式
a.划分临界带的公式为: fn=65Байду номын сангаас sinh (n/7)
其中得到的 fn就是第 n个临界带的频率上限。由于第 1个 临界带的频率范围在 0-93Hz之间,对语音研究的意义不 大,一般只取后面的 23个临界带进行分析。
b.频谱重心的计算公式为:
这样得出的结果 m为2-24之间的一个数值,表示谱重心在 第个临界带。
2、实验操作与语料
• 我们以谱重心作为横坐标,以分散程度作为纵 坐标,将按照上述公式计算出的数值绘入坐标 系中,得到该擦音在擦音空间中的位置。桌上 语音工作室(MiniSpeechLab)能够按照上述公 式自动计算出擦音某个点上的谱重心、分散程 度和平均强度级。本文只取谱重心和分散程度 进行考察。同时,在波形图上选择擦音的一段, 桌上语音工作室还能够自动对该段作谱重心和 分散程度的分析,并在二维坐标中画出相应的 点。
数据结果分析
3)五个擦音大致显示出分 为两组的趋势。按分散程 度得出的擦音的相对关系 与它们长度上的关系是完 全一致的,即 h、f为一组, s、 x、sh为一组。前一组 在时长上比较短,音强上 比较弱,在能量集中区、 谱重心上则相对较低;后 一组在时长上比较长,音 强上比较强,在能量集中 区、谱重心上则相对较高。
研究擦音(格局)的原因和意义:
• 辅音是音素的一大类别,辅音种类繁多, 特征各异,而且多具离散性。在辅音的研 究中要按类别分为不同的系列,实验的程 序方法和测算的指标也各有不同。 • 辅音格局的研究是语音格局研究的重要内 容。元音、声调在声学表现上往往具有较 长的时长,其本身的声学特征容易考察分 析,而辅音则略显复杂。
c.分散程度的计算公式为:
这样得出的结果 s为分散程度的一个参量。
上述公式中的F值为:
2、实验操作与语料
• 本文发音人为一名北京生北京长的青年女性。 发音表为带有普通话清擦音声母的二字组各 25个(发音表从略)。 • 擦音前面和后面邻接有不同类型的元音。录音 采样频率为 22050Hz。计算擦音某个时间点上 的谱重心和分散程度时选取波形图上能量相对 较强的位置,计算出的数值即该点的声学参量。 对一段擦音做擦音空间图时一般选择擦音中间 的一段,长度约 50毫秒。数据的统计分析使 用 SPSS10.0完成。测量数据及分析结果均精确 到百分位。