A Corpus-Based Study of the English Translation of Qian Ziwen

Abstract

As one of the three major reading materials of Chinese traditional elementary education, the original text of Qian Ziwen is unique, with its language understandable, full of musical rhythm, and easy to read and memorize. This paper conducted a corpus-based study to make a comparative analysis of the English versions of Zhao Yanchun and Wang Baotong based on the self-built small corpus, and uses statistical tools such as Wordsmith 6.0, Complete Lexical Tutor and Readability Analyzer 1.0 to analyze the gains and losses of the two versions from three aspects: text form, recitation and language style.

Share and Cite:

Fang, X. (2023) A Corpus-Based Study of the English Translation of Qian Ziwen. Open Access Library Journal, 10, 1-10. doi: 10.4236/oalib.1109758.

1. 引言

《千字文》是由梁朝(502~557)周兴嗣从王羲之书法作品中选取的一千个字编撰而成的蒙学读本,是中国经久流传的国家经典读物。《千字文》流传1400多年,独领蒙学读物之风骚,堪称训蒙长诗。作为中国经典的启蒙读本,《千字文》的西传历程较早、译本丰富,诸如Matteo Ricci、Nathan Sturman、王宝童及赵彦春等译者都先后翻译了《千字文》。通过文献统计可知,现有《千字文》英译本的研究主要集中于分析译本翻译策略、从形式或内容出发探析译文效果等。而自语料库应用于翻译研究以来,译者风格探究快速发展,如陆少辉(2020) [1] ,董芳、张凌(2018) [2] 开展的研究。因此,本文基于现有研究,采用语料库语言学方法,选取以形式对等而著称的赵彦春译本(以下简称赵译本)以及以通俗易懂为主的王宝童译本(以下简称王译本)为研究对象,基于自建小型语料库,结合文本研究和语料库研究,全面分析两个译本在文本形式、朗诵效果及语言风格方面的得失。

2. 《千字文》分析

作为中国经典的蒙学读物,《千字文》的蒙学特征是译本分析中不可忽视的文体特点。根据《汉代汉语词典》,“蒙学”也称作“蒙馆”,即对儿童进行启蒙教育的学塾,主要教学教材包括《千字文》、《百家姓》、《三字经》、《四书》、《弟子夫》、《女儿经》、《增广贤文》等;所谓蒙学教育即指幼童和少年的教育,“包括了幼儿学前教育和部分小学教育,它是连接小学与学前教育之间的启蒙教育(陈汉才,1996:p. 192) [3] 。”基于蒙学教育对象的特殊性,诸如《千字文》在内的蒙学读物,在文体风格上也独具特色。首先,蒙学读物文本形式独特,往往根据文本特点采用特定的体例,如《三字经》三字成句,句短精炼,《千字文》全书千字,字无重复;另外,蒙学读物语言平实,通俗易懂。虽然经典蒙书中也包含一定晦涩难懂的语言,但文本仍以浅显易懂的表达为主,以达到识字教育和品德培养紧密结合的目的;最后,经典蒙学读物句短韵谐,朗朗上口,文本往往取韵文形式,韵律优美,富有节奏,易于朗读记忆。

《千字文》是中国经典的蒙学读物,一直以来都广受好评,受到名人大家的极力称赞。《千字文》文本富含经典的蒙学特征,其独特的诗歌形式、朗朗上口的朗诵效果及简单易懂的语言风格独具特色。文本形式上,《千字文》为四言长诗,每四字一句,共250句,全文千字,字不重复;朗诵效果上,全文取韵文形式,隔句押韵,韵律优美,朗朗上口,易诵易记;语言风格上,《千字文》侧重于识字教育,全文语言平实,语句平白如话,词义形象具体、通俗易懂;基于独特的文本特征,《千字文》成为中华民族浩瀚广阔的文学长河中一部典型的诗中经典,经久流传,意义深远,而在《千字文》的西传历程中,译本能否再现原文独特的诗歌形式、朗朗上口的朗诵效果及通俗易懂的语言风格也成为了评价译本的重要标准。

3. 语料库检索分析

本文以《千字文》原始语料为汉语文本,同时选取赵译本和王译本为英译研究文本,利用Paraconc,通过分词、标注和对齐等方法自建《千字文》两个小型平行语料库,并通过Complete Lexical Tutor (lextutor)、Wordsmith 6.0、Praat、Antconc和Readability Analyzer等统计工具得出统计结果,从类符形符比、词汇密度、平均词长、格律韵脚及句子可读性等信息对比分析赵译本和王译本的文本形式、朗诵效果及语言风格。

3.1. 文本形式

为了方便儿童识记,蒙学读物往往根据文本特征采用特定的体例,文本往往短小简洁,句短凝练,如《千字文》作为蒙学经典,文本形式独具特色,每四字一句,共250句,全文千字,字不重复。通过运用语料库检索工具,本文主要从句法维度和类符形符比值出发,分析赵译本和王译本在是否重现原文本形式特征。

句法维度是考察译本风格的重要指标,主要考察的是译文的句子总数以及平均句长。其中,平均句长指的是文本中句子的平均长度。通过分析平均句长能反映译文中原文信息是否被充分传达,原文信息是否被增删。通过使用Wordsmith 6.0对赵译本和王译本的句子总数和平均句长进行了检索,得到了如表1的信息。

表1. 句子总数和平均句长

通过Wordsmith 6.0对赵译本和王译本的句子总数和平均句长检索可知,赵译本诗行250行,诗句250句,平均句长为4.08;而王译本诗行250行,诗句215句,平均句长8.17。由此可以得出结论,赵译本保留了原文250句的形式,力求与原文诗句逐一对照,且句子凝练,单句字数也几乎贴近原文,再现了原文四字一句的形式;而王译本中绝大部分诗句与原文诗句实现了逐一对照,但仍有部分诗句进行了整合重组,且平均句长高达8.17,是原文的两倍之多,说明其句子包含的信息量较大,与原文短小凝练的形式大相径庭。

形符(Token)是指语料库中所有词汇的总数,类符(Type)是指不重复计算的形符数,类符和形符的比叫类符/形符比(Ratio),该比值与文本用词的变化性和丰富度呈正比关系,即通过分析该比值,比值越高则文本使用的词汇变化越大、越丰富。通过Complete Lexical Tutor的Frequency功能对赵译本和王译本的相关信息进行了统计,得到了如表2的结果。

表2. 形符类符比

《千字文》的另一形式特征是全文1000字,且字无重复(古文版)。但实行简化字、归并异体字后,其简体中文版本只剩下992个相异汉字,类符形符比值为99.2%。由表2可知,赵译形符数为1022,几乎和原文相差无几,基本还原了原文本全文1000字的形式特征,呈现出赵译本译文简洁、冗余度低的特征;而王译本形符数高达1760,远远高于原文,呈现出译本冗余的显化特征。从类符形符比值来看,赵译本高达95.69%,无限趋近于原文本,体现出赵译本的用词丰富,变化多样,除极少数用词重复外,尽力还原原文本字无重复的形式特征;而王译本的比值仅为49.66%,明显低于原文本,体现出王译本词汇重复使用率较高的特点,没有还原《千字文》全文1000字,且几乎字无重复的形式特征。

综合分析可知,赵译本和王译本在文本形式上风格迥异,赵译本基本做到了还原《千字文》四字一句、共250句、全文千字、字不重复的形式特征,但王译本显而易见并未还原原文本形式。

3.2. 朗诵效果

为了方便儿童记忆朗诵,蒙学读物文本往往富含音乐性和节奏感,读起来铿锵有力、抑扬顿挫。如《千字文》音高和谐,尾音流畅自然,隔行押韵,节奏鲜明,节奏韵律恰到好处,有利于背诵。本文通过建立语音语料库和文本语料库,分别从音高和响音分析译本的音乐性,从格律和押韵分析译本的节奏感,看两个译本能否富含音乐节奏,是否朗朗上口、易诵易记。

音高(Pitch),是指各种音调高低不同的声音,即音的高度,音高和谐事关蒙学读物的音乐性。研究音域有助于分析音高变化,音高跨度较大,则音域范围也越广。若音域值较大,则话语情感更丰富,音域值较小,则话语更平静。使用Praat软件分析《千字文》原文本、赵译本和王译本,得到如表3所示的结果:

表3. 平均音域和标准差

蒙学读物更注重普及知识和教书识字,而不是情感表达或精神寄托,音域值更小更符合蒙学读物的文体风格。根据统计结果可知,《千字文》原文本的平均音域值仅13.9030 Hz,相对较低,原文语言情感较平淡。蒙学读物外译,应重现原文音域,实现音高和谐,增强文本的音乐性。赵译本平均音域值达到了16.7175 Hz,远高于《千字文》原文本的平均音域,文本语言情感丰富、激昂;而王译本的平均音域值低于15 Hz,接近于《千字文》原文本,语言情感协调、平静。另外,赵译本的标准差变化更大,诗行的音高变化更大,而王译本音高变化更小,音高起伏更稳定、更规律。因此,王译本在音域处理上更接近蒙学读物要求,音高更和谐,起伏更稳定,文本的音乐性和朗诵性更强。

响音是指发音时不受气流阻碍,并不受干扰而产生湍流,与阻碍音相对,比如元音、流音、鼻音和边音。这四种尾音的发音流畅自然,没有摩擦,富含音乐性,适合阅读和背诵蒙学读物。现代语音学通常根据语音特征将音素分为五大类,表4展示了响音特征,表5统计了译本带尾音的诗行占比,表6统计了带不同尾音的诗行占比。

表4. 响音特征

根据英文发音特点,元音、滑音、流音、鼻音都是响音,但声音响度受气流受阻情况影响,元音、滑音、流音、鼻音发音时,所受气流阻碍依次增加,所以从元音到阻塞音,响音程度呈由高到低的走向,元音响度最高,其次是滑音,流音,最后是鼻音。以元音结尾的尾音,声音响度更大,音乐性更强,更适合朗诵,而滑音、流音和鼻音等依次次之。另外,儿童早期语音学习中,使用频率最高的也是以元音结尾的开音节,是儿童最适合、最容易发的音。因此,在蒙学读物翻译中,应充分考虑尾音对文本朗读性的影响。另外,滑音[j]和[w]不会出现在词尾,分析尾音时可忽略不计,因此,下文主要分析元音、流音和鼻音。

表5. 带尾音的诗行占比

表6. 带不同尾音的诗行占比

由表5可知,赵译本中带尾音的诗行占比36.4%,而王译本中带尾音的诗行占比达55.8%,近一半诗行带尾声,展现了王译本更注重每句诗行最后一个音节的响音。由表6可知,赵译本带尾音的诗行共计91行,其中鼻音占比最大,45行,其次是元音和流音,分别为40行和6行。而王译本带尾音的诗行达120行,其中元音和鼻音高达60行和48行。结合上文表4的分析可知,以可朗诵性为标准排列,结果分别是元音、流音和鼻音。通过对比可知,王译本带尾音的诗行和以元音作尾音的诗行均远远高于赵译本,发音更流畅自然,音乐性更强,更适合朗诵。

诗歌节奏来源于诗的格律,音步和韵脚。英诗中,音步是由重读音节(扬)和非重读音节(抑)构成的诗的分析单位,依照每一音步中扬抑格的排列方式,可以把音步分成不同种类,即格律。格律是英诗朗读时轻重音的依据,对诗歌的节奏感具有重要影响,译本音步、格律分析情况见图1。

《千字文》作为蒙学读物,原文整体上采用诗歌形式,大部分诗句基本实现了格律平仄工稳,方便儿童朗诵记忆。通过分析赵译本和王译本四个诗行的格律,得到了如图1所示的分析结果,其中“_”表示该音节是轻读音节,

图1. 格律、音步分析

而“/”则表示该音节是重读音节。分析可知,赵译本中,诗行之间的音步并不统一,而且格律也不稳定,没有特定的音步和格律,读起来缺乏节奏感。相反,王译本每个诗行8个音节,分为4个音步,且整体而言奇数个都是非重读音节,而偶数个都是重读音节,每两个音节都是前弱后强的关系,诗行之间音步统一,格律清晰,是典型的四音步抑扬格。由此可知,赵译本整体上缺乏规律的音步和格律,而王译本整体上是典型的四音步抑扬格,基本实现了格律工整,加强了文本的节奏感,读起来朗朗上口。

为了使文本具有节奏和声调美,蒙学读物往往还会取韵文形式,使文本富含韵律,便于吟诵和记忆。蒙学读物外译,也应充分考虑译本押韵情况,使译本更具有韵律美,表7展现了两个译本的押韵情况:

表7. 押韵诗行统计

根据韵律划分,英诗押韵有全韵和半韵之分,与之对应的分别是中文诗歌里的宽韵和窄韵。据表8统计结果可知,《千字文》原文隔行押韵,前后贯通,共125对押韵诗行,其中全韵119对,半韵6对,读起来朗朗上口,易诵易记。另外,赵译本和王译本通篇押尾韵,押韵诗行达250行,押韵连贯,节奏鲜明。但全韵相较于半韵而言,其押韵更加严格,读起来更有节奏感。即使赵译本和王译本押韵行数相等,但王译本中的全韵高于赵译本的全韵,因此更具有节奏和声调美,更易诵读。

通过从音高、响音、格律及韵脚综合分析赵译本和王译本的音乐性和节奏感,最后可知,与赵译本相比,王译本音高更和谐、尾音的响音发音更流畅自然、格律更工整、韵律更丰富,因此王译本更富含音乐节奏、更易诵易记。

3.3. 语言风格

为了方便儿童理解文本,蒙学读物往往语言平实,通俗易懂。如《千字文》语言平白如话,句子结构简单,词汇意义具体,文章易懂。蒙学读物译本,也应该注重还原原文本的语言风格,本文从词汇密度和可读性出发,研究赵译本和王译本的语言风格特征。

词汇密度是指语料库中,实词数占文本总词数的比例,计算公式为:词汇密度 = 实词数/总词数 × 100%,其中实词是指名词、实义动词、副词和形容词等。词汇密度的大小反映的是文本的信息承载量,即比值越高,实词使用率越高,因此文本信息量越大、文本难度也就越大。通过Tree Tagger对译文进行分词和赋码,再使用统计软件Antconc,得到了两个译本的实词频率及词汇密度,见表8:

表8. 实词频率及百分比

通过分析可知,赵译本的词汇密度约为94%,王译本的词汇密度约为70%。由此可见,首先,两个译本都使用了很多实词,都传递了丰富的文本信息。其次,相比较起来,赵译本的词汇密度又远远高于王译本的词汇密度,即赵译本实词数更多,文本缺乏连接语法和逻辑的虚词,且译文的信息承载量过高,译文难度更大;而王译本的词汇密度更低,包含了更多虚词,使用了更多介词、冠词及表示转折、并列和因果关系的连词等,文本更符合英语表达的语法习惯,而且译文的信息承载量更低,译文难度更小,更浅显易懂。

可读性指的是作品适合于阅读的程度,也可以理解成作品的可理解性,影响因素包括词长和句长,即词汇的音节数和句子的复杂度。通过Readability Analyzer 1.0分别检测赵译本和王译本的可读性,得到表9里的数据:

表9. 可读性(Readability Analyzer)

根据Flesch Reading Ease Score提供的数据,可供检测文本的阅读难度水平,从而有助于分析译本的难易度。文本的可读性分为7个等级:90~100:极容易;80~89:容易;70~79:相对容易;60~69:标准;50~59:相对困难;30~49:困难;0~29:十分困难。根据Readability Analyzer 1.0的统计可知,赵译本的适读值为69.00,属于标准文本,且平均词长大于5,文本不易理解;王译本的适读值为90.90,属于极容易阅读的文本,且平均词长小于5、接近4,文本简单易懂。另外,赵译本的文本难度值为31.00,适用于4~5年级左右(10~11岁)的儿童阅读,王译本的文本难度值为9.10,适用于2~3年级左右(7~8岁)的儿童阅读。结合前文分析可知,蒙学教育是连接小学与学前教育之间的启蒙教育,蒙学读物适合3~6岁的儿童阅读。由此可知,赵译本和王译本的适用年级和年龄都超过了蒙学教育年龄段,但相比较而知,王译本仍然适度性更高,文本难度更低,适用年级也更接近蒙学年龄段。

为了进一步补充表9中对适用年级的分析,本文还使用Compleat Lexical Tutor的VacabProdilers功能分析了译本在0~4年级(1~10)儿童阶段的词汇匹配度。考虑到蒙学读本的读者对象是6岁及以下的儿童,表10只呈现了译本在1~6岁阶段的匹配度。由表10统计结果可知,赵译本中仅40.63%内容适合6岁左右的儿童阅读,仍有一半以上的内容超出了儿童的理解范围;而王译本内适合6岁左右儿童阅读的内容涵盖范围达71.17%,仅五分之一左右的内容超出了理解范围。由此可知,赵译本可读性更高,更适合蒙学阶段的儿童阅读,其句子结构更简单,词汇意义更具体、易懂。

表10. Compleat Lexical Tutor分析

通过综合分析赵译本和王译本的词汇密度和可读性可知,与王译本相比,赵译本的词汇密度更低,译文难度更小,且可读性属于极容易阅读的文本,适用年级也更接近蒙学年龄段,因此王译本的语言风格更浅显易懂。

4. 译本“得”、“失”分析

综合上文语料库检索和分析可知,在还原《千字文》形式上,赵译本优于王译本。赵彦春曾提到,希望能还原《千字文》的文本形式,力求“在形式和意义的张力之间和种种矛盾之中找到最佳平衡点”(赵彦春、吕丽荣2016:p. 137) [4] 。基于该翻译目的,其译本基本还原了四字一句,共250句,全文千字,字不重复的形式特征。但是由于赵译本受形式限制,再加之英汉语言差异,导致其译本在语言风格方面有所损害。一方面,中文是表意文字,而英语是表音文字,再加之古文蕴含的意义更为丰富,千字英语和千字古汉语所所蕴含的信息量是不匹配的,所以很难用英语还原《千字文》全文千字的形式。赵译本为还原全文千字且字无重复的形式,译本主要以实词为主,难词居多,平均词长偏长,用词丰富多样、易于变化。另一方面,汉语重意合,英语重形合,其句法逻辑处理方式迥异,且中英文词汇意义并不完全一一对等,所以要想在全文千字且字无重复的基础上,进一步实现四词一句则更为困难。为了保留四字一句的形式,赵译本省略了语法上用来连接逻辑和句法的虚词,句法活跃,且语言文字信息浓缩精炼。这一切导致赵译本实词和难词居多,平均词长较长,信息负载量过大,可读性较低,且实词和虚词比例严重失调,文本缺乏连接逻辑和句法的虚词,语言艰深难懂,不利于儿童理解。另外,赵译本致力于还原《千字文》的文本形式,也导致该译本在朗诵效果方面存在一定不足。一方面,赵译文采用四词一行的形式,省略了用于调节音步和格律的虚词或连词,再加之译本以实词和难词为主,导致音节及轻重读情况多变,译本没有特定的音步和格律,读起来缺乏节奏感。另一方面,赵译本翻译重心集中于还原《千字文》的文本形式,忽略了蒙学读物的朗诵效果,译本在音高和响音的处理上有一定欠缺。其译本音高跨度大,音域范围广,情感变化大,且尾音占比少,尾音的响音发音缺乏流畅自然的效果,导致该译本缺乏音乐性,朗诵效果不佳。

相反,虽然王译本在还原形式上存在不足,但在朗诵效果及语言风格上,王译本明显优于赵译本。首先,王宝童认为英译《千字文》时,保留其原文形式是无法实现的,“英译因受英语语法和本人功力制约(例如不可能只用一次冠词、助动词或某些起连贯或加强作用的词语),无法用1000个不重复的音节甚至单词表达”(李黎、王宝童,2008:p. 150) [5] 。基于该翻译思想,王译本不拘泥于还原文本形式,其译本平均句长不局限于四词,单词量远超于一千字,且单词重复使用率高达50%左右。由于不受形式限制,赵译本语言风格方面达到了通俗易懂的效果:译本实词数量适中,难词比例较小,平均句长较短,信息负载量较小,可读性属于极容易阅读的文本,适用年级也更接近蒙学年龄段,且实词数和虚词数比例平衡,文本逻辑和句法清晰,语言风格浅显易懂。其次,王译本还注意到了蒙学读物的朗诵效果。一方面,王译本富含音乐性,其译本音高跨度小,音域范围窄,情感变化小,且尾音占比多,尾音的响音发音流畅自然。另一方面,译本平均句长合适,实词和虚词比例协调,多音节难词占比小,音节及轻重读情况稳定,是典型的四音步抑扬格,格律工整,节奏感强。

5. 结语

综上以上语料库检索和分析可知,赵译本和王译本在文本形式、朗诵效果和语言风格方面各有千秋。赵译本基本还原了《千字文》的形式特点,使用中国古代的四言诗体,全文千字且字无重复,这无疑会给西方读者带来眼前一亮的新鲜感,可能会更激起读者的阅读兴趣。但是由于受形式的限制,该译本的朗诵效果和语言风格相应地有所损害。而王译本较好地实现了朗诵效果、传递了简单易懂的语言风格,更有利于西方儿童朗诵与记忆。但是,其译本在还原形式方面也相应地存在不足,未能还原原文形式。

基于蒙学教育对象的特殊性,蒙学读物在文体风格上往往独具特色,如特定的文本形式、朗朗上口的朗诵效果及通俗易懂的语言风格等。蒙学读物外译过程中,虽然这些蒙学特征是不容忽视的,但是由于中英语言上的差别,译本在还原原文形式、朗诵效果及语言风格方面恐难以做到面面俱到。虽然赵译本和王译本在还原文本形式、传递朗诵效果和保留语言风格方面各有得失,但不论是致力于还原《千字文》形式特征的赵译本,还是重在传递译文朗诵效果及语言风格的王译本,都对中国蒙学读物的外译有所借鉴。通过选用适合目的与读者的译介方式,可以让海外读者感受中国古典文化的博大精深(刘睿,2020:p. 162) [6] 。

基于语料库的《千字文》英译本分析

摘要:作为中国传统蒙学三大读物之一,《千字文》原文形式独具特色,语言通俗易懂且文本富含音乐节奏、易诵易记,可谓独领蒙学读物之风骚。本文采用语料库语言学方法,基于自建小型语料库对赵彦春和王宝童的《千字文》英译本进行对比分析,运用Wordsmith 6.0、Complete Lexical Tutor和Readability Analyzer 1.0等统计工具,从文本形式、朗诵效果及语言风格等三个方面,分析两种译本在形式、朗诵效果及语言上的得与失。

关键词:《千字文》,语料库,赵彦春译本,王宝童译本

Conflicts of Interest

The author declares no conflicts of interest.

References

[1] 陆少辉. 基于语料库的许渊冲《诗经》英译本特征研究[J]. 兰州教育学院学报, 2020, 36(3): 80-82.
[2] 董芳, 张凌. 基于语料库的《离骚》英译本译者风格的比较[J]. 温州职业技术学院学报, 2018, 18(3): 74-77+96.
[3] 陈汉才. 中国古代幼儿教育史[M]. 广州: 广东高等教育出版社, 1996.
[4] 赵彦春, 吕丽荣. 国学经典英译的时代要求——基于外文出版社出版的《英韵: 三字经·弟子规·千字文》[J]. 外语教学, 2016, 37(4): 96-99.
[5] 李黎, 王宝童. 《千字文》英译的文体关注[J]. 复旦外国语言文学论丛, 2008(2): 149-158.
[6] 刘睿. 基于语料库计量语言特征的译者风格研究——以《淮南子·时则训》三译本为例[J]. 文化学刊, 2020(10): 159-162.

Copyright © 2024 by authors and Scientific Research Publishing Inc.

Creative Commons License

This work and the related PDF file are licensed under a Creative Commons Attribution 4.0 International License.