An Acoustic Study on Monosyllabic Tone in Nantong Dialect

Abstract

To study the tone pattern of Nantong dialect, this study adopts objective acoustic and statistical methods to analyze the production of tones from 16 Nantong speakers, so as to further explore the acoustic realizations of the citation tones in Nantong dialect. The results show that, compared with the previous studies. The f0 onset of Yinping, Yinqu and Yinru tones are slightly higher, and the f0 onset of Yangping is slightly lower. Shang, Yangqu and Yangru are basically unchanged. In terms of duration, the Yangqu is the longest, and Yangru and Yinru are the shortest, which is due to the short tone-bearing portion of the checked-tone syllable. This study reexamines the tone pattern of Nantong dialect and enriches the research on Nantong dialect.

Share and Cite:

Zhou, Z.L.L., Cai, J.W. and Yin, R.S. (2024) An Acoustic Study on Monosyllabic Tone in Nantong Dialect. Open Access Library Journal, 11, 1-10. doi: 10.4236/oalib.1112079.

1. 南通话单字音研究概述

南通地处南北交汇点,内部方言复杂多样,不同方言片区的人甚至难以沟通。唐宋以来,从全国其他地方流徙到南通的人们共同生活、互相交际,逐步形成了既有吴语特点,又带有北方方言基本性质的南通方言,其中既有属吴语系的启海话与通东话,又有属江淮方言的如海话等,语言资源丰富。本文中的南通话主要是指在南通城区、郊区和南通县的兴仁、石港、刘桥、平潮的大部分地区使用的方言[1],界于启海话和如皋话之间。当前,南通方言仍在广泛使用当中,但由于其与普通话的差异较大,在年轻一代中的普及率明显有所下降。且随着时间发展,南通方言也在不断发展变化。

前人关于南通方言声调的研究多是基于单一发音人的主观记录,缺少客观的声学语音学描写。而本次实验采用更为客观的声学语音学方法,对多位发音人进行统计分析,从而揭示不同发音人之间的普遍规律。实验结果可以在同一客观尺度下与其他方言结果比较,得出普遍的类型学意义,由此进一步细化对南通方言声调格局的描写,丰富汉语方言声调类型学数据库,为进一步的音系学分析提供数据基础,为语言变异发展现象研究提供实例,同时为相关部门方言保护与发展工作提供理论支撑。

自建国以来,有关南通话的调查已取得了一定的成绩,许多专家学者对南通话的研究做出了有益的探索,为之后的调查研究奠定了一定的基础。前人对南通话声调的主要调查记音结果如下:

1. 前人记载的南通话单字调调值

调类

阴平

阳平

上声

阴去

阳去

阴入

阳入

江苏省地方志编纂委员会(1998) [2]

21

35

55

42

213

4

5

鲍明炜等(2002) [3]

21

35

55

42

213

42

55

刘俐李等(2007) [4]

31

35

55

52

323

54

5

陶国良(2007) [5]

21

35

55

42

213

4

5

朱瑛(2017) [6]

31

35

44

53

323

54

55

表1可见,前人得出的结果较为统一,记载的单字调调值与高度大体相同。舒声调方面,阴平为低降调、阳平高域升调、上声高平调、阴去高降调、阳去为凹调。入声方面,阳入为高调,阴入略低于阳平,且可能伴有基频下降的趋势。在研究方法上,《江苏省志·方言志》、《南通方言词典》与鲍明炜等人采取了传统的调查方法对南通话进行记音,而朱瑛与刘俐李等人则是通过实验的方法调查南通的声调情况。本文试采用客观的声学语音学方法,对多位发音人进行统计分析,重新审视南通方言的声调格局。

声调格局是指由一种语言中所有的单字调构成的格局。单字调的声调格局是声调研究的基础形式,也是考察各种声调变化的起始点[7]。“声调格局”的思想被广泛应用于汉语方言声调研究中,既可用于描述不同方言声调系统的整体表现,还可被应用于语音共时变异研究之中[8]。在声调变异方面,石锋、王萍基于大量的发音样本,对北京话四个声调调型进行取点,通过计算样点T值的标准差来呈现出声调的变异指数,从而使不同的实验结果之间具有最大程度的可比性。此后,梁磊采用了这一方法,并将研究的范围扩大到了多个汉语方言中[9]。据此,本文也采用了T值的方法,就南通方言七个声调的五度值与样点T值的标准差等进行研究分析。

2. 声学实验和统计分析的基本步骤和程序

2.1. 实验例字

通过社会调研,参考《南通方言字典》及其他相关文献设计了覆盖较为全面的单字表。根据南通方言的七个声调,单字表每个声调选取了15个例字,共计105个字。选取内容均为目前南通方言使用者生活中出现的高频词汇。

大部分所选例字的韵母为单元音,即该单元音韵母承载着这个声调的主要信息。这样一种声母与韵母的组合便于准确迅速地对声调承载段进行确认和切分。大部分例字的选择还遵循了声母与韵母组合的最简原则,并注意在后续操作中排除可能存在的介音和韵尾对声调的影响。但同时也注意保留了具有南通方言特色的双元音韵母例字和存在介音、韵尾的例字。见表2

2. 南通方言单字调实验例字表

阴平

thʌŋ

thi

thō

seŋ

tsɿ

mo

ko

xo

kʌŋ

su

ɕø

ka

tsha

kua

阳平

thʌŋ

thi

hi

pha

xe

mo

xuo

vu

tsho

the

mɛ͂

tshɛ͂

la

meŋ

上声

pa

peŋ

tsh

ta

nø͂

li͂

hi

thō

tshō

mʊ͂

pa͂

fɛ͂

tsɛ͂

阴去

hi

ɕø͂

tshe

te

kɛ̃

thɛ̃

khũ

tɕø͂

tsõ

pe

hy

tshe

ke

阳去

ni

ne

lɛ̃

xɛ̃

ve

the

se

ŋa

xa

vu

阴入

pɑʔ

fɑʔ

tɑʔ

kh

xɛʔ

ŋoʔ

tɛʔ

thøʔ

tsoʔ

ɕøʔ

koʔ

poʔ

tshɛʔ

xʊʔ

sɛʔ

阳入

sɛʔ

h øʔ

tsh

khɑʔ

soʔ

nøʔ

lɛʔ

mɑʔ

th

foʔ

niɑʔ

vɛʔ

xɑʔ

phɑʔ

moʔ

2.2. 发音人

考虑到南通方言不断发展的特点及不同年龄段的差异性,遴选30岁以下、30~55岁、55岁及以上三个年龄层共16位发音合作人(其中9位女性,7位男性)。由于南通方言不同片区间的方言具有差异,且随着时间发展,南通地区居民可能掌握多种南通方言。而本文研究的是南通话,因此籍贯要求为:首选为江苏省南通市人,如有其他籍贯,但就南通方言口音纯正、发音自然者亦可选为被试。该16份语料均真实有效,按照录音顺序进行编号,如下表3

3. 南通方言声调实验研究发音人基本信息表

语料编号

性别

年龄

W1

>55

W2

>55

W3

30~55

W4

<30

M1

30~55

M2

30~55

M3

30~55

M4

30~55

M5

>55

W5

<30

W6

30~55

M6

30~55

W7

30~55

W8

30~55

M7

30~55

W9

<30

2.3. 声学实验程序

2.3.1. 录音

本次实验的录音以电脑设备外接麦克风Samson C01U pro,录音软件是Adobe Audition 2020,设置声道为单声道,采样率为44,100 Hz,分辨率为16位。录音环境为安静的房间。每个被试需要朗读语料表2,每个单字朗读一遍,每个字间间隔1~2秒,共获取有效样本1680个。录制时按字表逐一录制,要求以自然的语音习惯逐个朗读。误读或读得过快,则舍弃该样本重新朗读。每个实验词之间间隔一定的时间,录制完成后将文件按编号命名,统一保存为.wav格式。

2.3.2. 录音文件的切分和标注

对于录音文件按照发音人信息归档后,使用praat [10]软件逐一地切分和标注,参照波形图和频谱图手动标注出音节的韵母段。首先将之前所保存的录音文件按例字进行切分,在第一层为每个例字标注一个序号。再在第二层对每个例字的声母和韵母进行标注。标注时先排除声调的弯头和降尾,确定好声调承载段,以助于准确标注。同时,在标注时还充分参考宽带语图和窄带语图。如下图1所示:

1. 语料切分标注示意图

2.3.3. 数据的提取和处理

使用praat对每个标注样本的基频和时长数据进行提取后,运行ProsodyPro (Xu 2013)脚本程序[11]提取每个样本的声调承载段的基频,每10%取一个采样点,共提取10个测量点的数据。同时,该脚本可以手动完成基频的修补、提取以及平滑。脚本输出文件除了包含归一了时长的基频值,还包含声调的韵母段时长、最大基频值、最小基频值以及基频速率。

对所有样本的基频和时长数据求取算术平均值和标准差,然后再对基频和时长数据进行归一化。通过归一化基本消除人际差异,提取恒定参数,从而获得具有语言学意义的信息。同时,归一化还可以消减录音时不同发音人的发音风格。根据石锋[12]的方法,将数据进行处理,以进一步作出五度值图。声调分析全部采用相对归一的T值计算。声调T值的计算公式如下:

T= lgxlgb lgalgb ×5

其中,a为调域上限频率,b为调域下限频率,x为测量点频率。得出的T值就是x点的五度值参考标度。根据公式计算的T值取值范围在0到5之间:从0到1之间大体可以看作五度值的1度;1到2之间看作2度;2到3之间看作3度;3到4之间看作4度;4到5之间看作5度(见图2)。

对16位被试7个声调所有样本的10个基频值的平均值进行“T值”转换和整合后,求出每个声10个点对应的均值和标准差,得出南通方言的单字调格局,再以采样点为横轴,T值为纵轴做出基频曲线,如图2所示。其中,声调均值各声调的调型曲线为中间的主线;标准差表示发音人之间存在的变异,在图中为主线上方和下方的两条曲线,分别由平均值加减标准差得到。

2. 各声调主体分布图

3. 南通方言单字调格局

阴平调是主要位于调域下半部分的低降调。起点的平均T值最高,为2.25;终点最小,为0.30。阴平调声学空间的动态范围:起点的标准差最高,为0.51,以后各点逐渐降低,到第九点达到最小0.39。总体标准差都控制在0.50上下浮动,变化幅度不大。对应为五度值可记为31。

阳平调是先降后升,在前半段呈现较为平缓“凹”形的调性。起点的平均T值为1.88;音高最小的是第三个点,T值为1.32;终点的T值最高,为3.88。阳平调的动态范围:起点标准差最大,为0.74,以后各点逐渐减低,到尾点略有增加,第八点到尾点的标准差小于等于0.50。对应为五度值:24。

上声调是主要位于调域上半部分的高平调。它的特点可用“高”和“平”来概括,T值基本保持在3.82左右。起点和终点T值均为3.80;第二个点最低,T值是3.77;第七个点最高,为3.87。上声调的动态范围:标准差在0.55上下浮动,变化幅度不大。起点标准差为0.56,第二个点0.58,此后几个点依次减低,到折点标准差最小,为0.51;然后再逐渐增高,至终点标准差最大,为0.59。整个声调的音高范围基本在4度上半部分,起伏不超过0.1度。因此,其调值可以记为44。

阴去调是从调域上部到调域中下部的全降调,下降较为平缓。起点的平均T值最高,为4.37;终点最小,为1.90。阴去调声学空间的动态范围:起点标准差最小,为0.48;以后各点逐渐增高,到终点标准差最大,为0.79。对应调值可记为52。

阳去调是主要位于调域下半部分的曲折调,整体呈现较平缓的“凹”形调性,前半段下降较缓,后半段上声稍陡。起点的平均T值为2.04;音高最小的是第六个点,T值为0.88;终点的T值最高,为2.29。阳去调的动态范围:起点标准差最小,为0.62,以后各点逐渐升高,中间平缓,靠近尾点略陡,第七点到尾点的标准差在0.88到1.52之间。对应为五度值213。阴平和阳去调虽然都位于调域的下半部分,存在21降调的部分,但存在一定差异。阳去调为曲折调,且拐点靠后,感知上音调下降更明显。阳去存在明显的回升部分,在中点左右开始有较快的上声,且尾点比起点更高,发声也很清晰,213的调性特点明确。因此,虽存在相同调值的部分,但差异明显,易区分。

阴入调是主要位于调域上半部分的降调,终止处有不太明显的“凹”形。起点的平均T值最高,为4.58;音高最小的是第八个点,为3.67;终点的平均T值为3.76。阴入调的动态范围:起点标准差最小,为0.62,以后各点逐渐升高,至第八点达到最高,为1.13,后又降低,终点的标准差为1.03。其调值可记为54

阳入调是主要位于调域上半部分的高平调,整体有轻微的上升趋势。起点的平均T值为4.33;第三点的平均T值最低,为4.29;音高最高的是尾点,为4.44。阳入调的动态范围:整体标准差非常稳定,在0.45左右,浮动不超过0.03。起点标准差最大,为0.48,以后各点逐渐降低,至第九点达到最低,为0.42,后尾点又升高,标准差为0.47。其调值可记为5。而阴入、阳入两个入声调的区分重点性在于阴入调的下降趋势。入声为收喉塞音,均较为短促,阴入略低,阳入略高,但区别较小。阴入一个调值左右的降低虽然较为平缓,但其微降的特点,是两个入声的主要区别所在,而且阳入微扬。

从七个声调各个测量点的数据分布范围来看:阴平和阴去都是全降调,阴平为低降调,阴去为高降调。阳平的升调与阳去的“凹”形曲折调形成对比,其主要声调拐点的位置不同导致了音调的主要差异,阳平拐点位于前半部分(第3点),而阳去则位于后半部分(第6点)。且阳平跨度更大,而阳去整体上位于调域下半部分;阳平的动态范围在起点最大,表明音高的变化在发音开始时最为显著,阳去在中间的折点最小,向两端逐渐增高,到起点和终点最大,其动态范围在结尾较大,变化在发音结束时更为明显。上声调和阳入类似,为位于调域上半部分的高平调,且两端标准差更大,中间变化更小。

对比《南通方言字典》中的调查结果,阴平仍为低降调,但由21到31,如图起点为最高处2.25,为轻微高化。阳平仍总体上升,但由35降至25,且根据更精确的实验数据,显示呈平缓“凹”形。字典中称上声介于55和44之间,高平调,记值55,现实验得出数据T值平均值为3.82,在四度区间,靠近5度数,记为44。阴去由42到52略有高化,起点处均值4.37,最低值3.89,变化不大。字典称,入声收喉塞音,阴入低,阳入高。阴入短促微降,标写为4;阳入调值比上声还高,记为5调。现得出阴入起点处略有高化,记为54,确实整体微降,终止处有不太明显的“凹”形。阴入调的鲜明特点可进一步进行感知实验,探讨其在听感上,“低”与“降”哪一因素更为重要。阳去213、阳入5没有变化。因此,相较于前人研究结果,阴平、阴去、阴入调起点处略有高化,而阳平调起点处略有低化,上声、阳去、阳入基本不变。

根据石锋的理论,把标准差的数值作为声调稳定段的指标,以0.5为界限,小于0.5为较稳定的分布,大于0.5为不稳定的分布。其中,变异较大的点(标准差大于0.5)被称为动态段,变异较小的点为静态段。以此标准来看,阴平整体标准差均小于等于0.5,整体都较为稳定;阳平的动态段在前半段,静态段在后半段;上声调整体略高于0.5,但整体较为稳定,起点和尾点略高;阴去的稳定段在前半段,动态段在后半段;阳去、阴入调整体标准差均大于0.5;阳入整体标准差0.45左右,略低于0.5,整体较稳定。

由于本实验样本数量没有石锋的研究样本大,所以整体标准差值要稍微大一些。我们将七个声调10个标准差数值做单因素方差分析,以调类为组间因子,结果表明调类对于标准差数值的影响具有统计学意义(F = 38.564, p < 0.05)。七个声调(阴平、阳平、上声、阴去、阳去、阴入、阳入)在标准差上的均值分别为:0.439/0.601/0.552/0.623/0.958/0.938/0.448,采用Bonferroni法校正显著性水平的事后两两比较发现,阴平和阴去、阴平和阳去、阴平和阴入、阳入和阴去、阳入和阴入、阳入和阳去、上声和阴入的差异有统计学意义,其它组之间的差异无统计学意义。七个声调的比较显示,阴平和阳入的变异相对最小,阳去和阴入的变异显著大于其他音调。在七个声调中,阳去调和阴入调的变异最大。从客观因素来看,阳去调中存在转调且幅度较小,而阴入调则体现出“短促微降”的特征,这就可能导致被试在发这两个音时面临更大的不稳定性。从主观因素来看,被试的发音受性别、年龄与语言习惯等的影响而存有差异,在这两个声调上体现出的差异性也就更为明显。

4. 单字调时长分析

南通方言声调时长模式见图3。结果表明,阳去调的时长最长,均值为369.25毫秒,标准差为73.5。其次为阳平调,均值为333.38毫秒,标准差为45.25。再者为上声,均值为305.88毫秒,标准差为46.25。阴去调,均值为239.19毫秒,标准差为51。阴平调的均值为226.31毫秒,标准差为48.25。阳入调的均值为177.5毫秒,标准差为43.69。时长最短的是阴入调,其均值为139.06毫秒,标准差为35。

各调类时长(阴平、阳平、上声、阴去、阳去、阴入、阳入)在标准差上的均值分别为:48.25/45.25/46.25/51.0/73.5/35.0/40.5;方差分析结果F = 5.868,P值 ≤ 0.05,因此统计结果显著,说明不同调类时长在标准差上存在显著差异。

3. 南通方言声调时长图

5. 结论

综上,本文基于16位南通人的样本,探索了南通方言七个声调的单字调格局及其时长特点。通过声学和统计方法分析得出南通话的单字调格局,即阴平为31,阳平为25,上声为44,阴去为52,阳去为213,阴入为54,阳入为5。为各声调作出主体分布图后,清晰得出了七个声调的调型趋势。对比前人研究,南通方言声调中,阴平、阴去、阴入调起点处略有高化,而阳平调起点处略有低化,上声、阳去、阳入基本不变。

通过对基频点的标准差分析得到了七个声调的稳定段和动态段的分布:阴平、上声、阳入调整体稳定;阳平的动态段在前半段,静态段在后半段;阴去的稳定段在前半段,动态段在后半段;阳去、阴入段整体较不稳定。阴平和阳入的变异相对最小,阳去和阴入的变异显著大于其他音调。阳去曲折调的特点,及阴入调的“短促微降”的特征可能为导致不稳定性的原因,且此类声调特点易放大被试的发音习惯区别、男女音高差异等的主观因素。而在时长上,阳去调时长最长,阳入和阴入调最短,符合其作为收喉塞音短促的特点。

Acknowledgements

本研究是2023年度大学生创新创业训练计划(编号:S202310251212)的阶段性成果。感谢指导老师王磊在项目研究过程中的支持与帮助。

Conflicts of Interest

The authors declare no conflicts of interest.

Appendix (Abstract and Keywords in Chinese)

南通方言单字调实验研究

摘要:为研究南通方言的声调格局,本文采取客观的声学与统计方法,对16位南通发音人的语音材料进行分析,从而进一步探索南通方言中七个声调的单字调语音表现。结果表明,较于前人研究结果,南通方言阴平、阴去与阴入调起点处略高,而阳平调起点处则略低,上声、阳去与阳入调基本不变;在时长上,阳去调时长最长,阳入和阴入调最短,符合其入声音节的特点。本文重新审视了南通方言的声调格局,丰富了有关南通方言的实验语音学研究。

关键词:南通方言,单字调,声调格局,语音实验

Conflicts of Interest

The authors declare no conflicts of interest.

References

[1] 南通市地方志编纂委员会. 南通市志[M]. 上海: 上海社会科学院出版社, 2000: 2363-2364.
[2] 江苏省地方志编纂委员会. 江苏省志∙方言志[M]. 南京: 南京大学出版社, 1998.
[3] 鲍明炜, 王均. 南通地区方言研究[M]. 南京: 江苏教育出版社, 2002.
[4] 刘俐李. 江淮方言声调实验研究和折度分析[M]. 成都: 巴蜀书社, 2007.
[5] 陶国良. 南通方言词典[M]. 南京: 江苏人民出版社, 2007.
[6] 朱瑛. 江苏境内江淮官话声调实验研究[D]: [硕士学位论文]. 南京: 南京师范大学, 2017.
[7] 梁磊. 声调格局与元音格局的研究综述[J]. 当代外语研究, 2011(5): 18-23.
[8] 张琦. 烟台话单字调的格局与变异[J]. 同济大学学报(社会科学版), 2022, 33(4): 111-119.
[9] 梁磊. 动态与稳态——汉语声调的共时变异研究[J]. 中国语文, 2014(4): 371-382.
[10] Boersma, P. and Weenink, D. (2005) Praat: Doing Phonetics by Computer [Computer Program]. Version 5.4.08.
https://www.fon.hum.uva.nl/praat/
[11] Xu, Y. (2013) ProsodyPro: A Tool for Large-Scale Systematic Prosody Analysis. Proceedings of Tools and Resources for the Analysis of Speech Prosody (TRASP 2013), Aix-en-Provence, January 2013, 7-10.
[12] 石锋, 王萍. 北京话单字音声调的统计分析[J]. 中国语文, 2006(1): 33-40.

Copyright © 2025 by authors and Scientific Research Publishing Inc.

Creative Commons License

This work and the related PDF file are licensed under a Creative Commons Attribution 4.0 International License.