1. 前言
随着计算机技术的进步和发展,机器翻译的应用越来越广泛。机器翻译可以提高翻译效率,降低翻译成本,但机器翻译的质量与手工翻译相差甚远,无法直接交付。然而,译后编辑可以有效地弥补机器翻译的不足,因此机器翻译与译后编辑(MTPE)模型得到了广泛的应用,对这一模型的研究也是业界研究的热点。
2. 错误类型
本文在参考李梅、朱希明(2013)、崔其亮和李文(2015)的机器翻译错误类型的基础上,将这类信息类材料的机器翻译错误分为词汇错误、句法错误和语篇错误三类。词汇层面包括欠译、术语误译、词义误译;句法层面包括被时态误译、短语误译和语序不当;在语篇层面,信息冗余、指称模糊和逻辑混乱是主要的错误。
3. 错误实例及对策
3.1 词汇错误
3.1.1 欠译
从整个机器翻译来看,有许多翻译不足错误,及欠译错误。
Example1:但一切服饰文本又凭借自身的开放性、生成性,与语境发生相互交织与彼此生成的关联。
MT: However, all clothing texts, relying on their own openness and generativeness, are intertwined with the context and related to each other.
PE: However, all clothing texts, through their own openness and generativity, are interwoven and mutually generated with the context.
分析:根据机器翻译的原理,机器翻译必然会导致翻译不足错误。因此,在人工编辑过程中,这些漏掉的词应该尽可能地翻译出来,使译文和原文和译文在正确性方面保持一致。例(1)“彼此生成”,在译后编辑中应该添加“and mutually generated”。
3.1.2 术语误译
虽然机器翻译使用强大在线语料库快速输出术语翻译,从而为翻译节省大量的验证时间。然而,对于一些不寻常的或特殊的术语,机器翻译的精度并不高。因此,在译后编辑时,仍然需要验证术语翻译,以确保术语翻译的准确性。
Example2:而能指的一无所指就开启了一种自由游戏。
MT: The absence of signifier will open a free game.
PE: the signifier without any signified will open a free game.
分析:例(2)中,“能指”和“所指”本是语言学的一对术语,其对应的英语表达是“signifier”和 “signified”。机器翻译在有限的语境下,并未能识别出“所指”这个术语,而是作为一个普通名词翻译,结果出错,不正确的翻译还有,如“something to point to”。
3.1.3 词义误译
词义误译是机器翻译中最多的错误类型。一般来说,英语单词通常有多个意思,在翻译时,译者必须根据上下文选择最接近的意思。然而,机器翻译不能做到这一点,而且经常选择错误的意义,从而导致突然的翻译和意义上不同程度的偏差。
Example3:不同的民族信仰
MT:different ethnicall beliefs
PE: different national beliefs
An indicator/a referent
分析:例(6)中,经网站https://www.linggle.com/检索,并没有ethnical belief 这一搭配。同时从单词意义来说,ethinical 词义偏窄,不符合作者的原文原意。
3.2 句法错误
3.2.1 语态错误
在英语中,被动语态可以突出动作的接受者,使讨论更加客观,因此它被广泛使用,尤其是在正式风格中。在中文中也有被动的句子,但没有高频出现。主动语态和非主语句在汉语中往往被用来表达被动的意义。因此,经验丰富的翻译人员会有意识地使用英语被动语态,以避免句子中过多主动语态。但机器翻译只能根据语法结构坚持源文本的声音,导致翻译中频繁出现主动句子,导致翻译的可读性下降,导致所谓“汉式英语”腔。
Example4:在不同的主体之间,以及主体与他者之间,都可以通过对话来触及对隐喻的关涉意义的揭示。
MT:Between different subjects, as well as between the subject and the other, we can touch on the revelation of the relevant meanings of metaphor through dialogue.
PE:Between different subjects and between subjects and others, dialogue can be used to reveal the relevant meaning of metaphor.
分析:例(4)中,机器翻译将其翻译为主动态,这使得上下文之间显得有些突兀,不够连贯,在人工编辑中,被动态被取而代之,上下文之间自然而连贯。
3.2.2 短语误译
就像词汇层面一样,在机器决定单个单词和短语的意义后,它将根据语法规则结合每个部分的意义,有时忽略上下文因素,特别是一些章节的标题,因为机器翻译默认其为一个独立的语法,分离与上下文的关系,容易导致误译。
Example5:身体成为隐喻的关涉物
MT:the body becomes a metaphorical concern
PE: The Body Becoming the Subject of Metaphor
分析:例(5)中“concern”作名词时确有关切之意,但是“metaphorical concern”这一搭配并没有。另外,就上下文而言,“关涉物”应该理解为对象,翻译成“the related object”,“subject”等亦可。虽然文本中短语的翻译主要取决于具体的语境,但其表达仍然需要根据英文表达进行调整。
3.2.3语序不当
中英文词序差异明显,机器主要根据源文本的词序输出翻译。因此,在译后编辑中,应按英文表达合理调整词序,使译文能够传达准确信息,更加地道。
Example6符号学思想历史性
MT:the historical thought of semiotics
PE: the historicity of semiotic thought itself
Example12:应该看到,能指与所指关系的任意性,原初之意并没有脱离约定俗称,直到后现代对这种对应加以更为彻底的解构。
分析:例(6)中,“历史性”是中心词,“符号学思想”是修饰词。在机器翻译中,中心词成了“历史性思想”,修饰语成了“符号学”,这显然和源语意思不符。因此,在译后编辑中,源语信息需要重新切分,对语言表达顺序进行重新调整。
3.3 语篇错误
3.3.1 信息冗余
冗余是指机器翻译输出中的一些单词或表达式,这在目标语中是不必要的。通常,翻译引擎翻译单词和短语,然后机械地将这些部分连接成句子。因此,有时在机器翻译输出中有额外的单词。在翻译过程中,应删除多余的部分,调整句子结构,使翻译简洁、清晰。
Example7:意指包括直接意指、含蓄意指与主体间的互动。
MT:signifier includes direct signifier, including the interaction between signifier and subject.
PE:signification includes denotations, connotation, and the interaction between the subject.
分析:例(7)中,机器翻译中不仅翻译欠缺,缺失了“含蓄意指”这一原文原意,更重要的是出现了多余信息including。由此可见,如果没有后期人工编辑的干预,单独的机器翻译是无论如何没法完成翻译工作的交付任务。
3.3.2 指称模糊
清晰性和明确性是语言表达的基本要求。如果语言令人困惑或不能表达明确的含义,就会出现歧义,也就是说,有歧义的指称。这种情况在机器翻译中更为常见,主要原因之一是主语指称不明。
Example8:对符号的这种质疑,促成了从结构主义到后结构主义的根本性转变。
MT:This questioning of symbols contributed to the fundamental change from structuralism to post-structuralism.
PE:This questioning of symbols has led to a fundamental change from structuralism to post-structuralism.
Example9:隐喻的实现也是与意指及其关涉分不开的,同时将所喻之物隐藏在某种符码及其遮蔽之中。
MT: The realization of metaphor is also inseparable from meaning and its relevance, and at the same time, it hides the metaphorical thing in some kind of code and its cover.
PE:The realization of metaphor is also inseparable from meaning and its implications. At the same time, the metaphor is hidden in some symbol and its covering.
分析:例(8)中,机器翻译中定冠词the 是确指,指上文提到的已知信息,这不符合原文原意,故而应用在人工编辑中不定冠词a来修正;例(9)中,it 指代不明确,在人工翻译干预下通过词语重复的衔接手段,保证译文的连贯、清楚明白。
3.3.3 逻辑混乱
逻辑混乱是指翻译引擎无法理解源文本的含义,导致机器翻译输出的逻辑混乱。一般来说,句子越长,机器翻译中出现逻辑混乱的可能性就越大。在这种情况下,需要重新排列逻辑,以使编辑后的句子更清晰。
Example10: 应该看到,能指与所指关系的任意性,原初之意并没有脱离约定俗称,直到后现代对这种对应加以更为彻底的解构。
MT:It should be noted that the original meaning of the arbitrariness of the relationship between signifier and signified did not break away from the convention until the postmodernism deconstructed this correspondence more thoroughly.
PE: It should be noted that the arbitrariness and original meaning of the relationship between signifier and signified did not break away from the convention until post-modernism deconstructed this correspondence more thoroughly.
分析:在例(10)中,“任意性”“原初之意”是中心词,处于并列关系,“能指与所指关系”是修饰语。在机器翻译中,这两个中心词和其修饰语出现逻辑混乱,在译后编辑中,需要要重新调整成并列中心词加上修饰语的关系。
4. 结论
本文为机器翻译和人工编辑模式在翻译项目中的应用提供了宝贵的参考,帮助翻译人员更好地理解机器翻译容易出错的地方,提高了人工编辑的效率。此外,这些研究结成果还可以为未来机器翻译和人工编辑的研究提供参考,有利于促进机器翻译和人机交互模式的改进。
参考文献
[1] Arenas,A. G. What do professional translators think about post-editing?[J]. The Journal ofSpecialized Translation, 2013(19):75-95.
[2] Arenas,A. G. Productivity and quality in the post-editing of outputs from translation memories.
and machine translation[J]. Localisation Focus: The International Journal of Localisation,2008.
[3] David Vilar, et al. ErrorAnalysis of Statistical Machine Translation Output[J]. In Proc. of the
Fifth Int. Conf. on Language Resources and Evaluation (LREC), 2006(5): 697–702.1):11-21.
[4]崔启亮. 论机器翻译的译后编辑[J]. 中国翻译,2014(6):68-73.
[5]崔启亮,李闻. 译后编辑错误类型研究——基于科技文本英汉机器翻译[J]. 中国科技翻译,2015(4):19-22.
[6] 李梅,朱锡明.译后编辑自动化的英汉机器翻译新探索[J].中国翻译,2013(4):83-87.
[7] 李梅,朱锡明. 英汉机器翻译错误分类及数据统计分析[J].上海理工大学学报(社会科学版),2013 (3):201-207.
黎杨,男,汉族,籍贯:湖北武汉生于:1979-08,,职称:讲师,研究生学历,研究方向:主要从事大学英语教学、语料库语言学和口语教学。