高端学术
您当前的位置:核心期刊咨询网文史艺术论文》机器翻译与人工翻译发展趋势浅析

机器翻译与人工翻译发展趋势浅析

来源:核心期刊咨询网时间:12

摘要:摘 要:随着经济全球化的迅猛发展,世界各国间交流日益频繁,因此对各语言之间转换需求量和转换速度的要求不断提高,人工翻译逐渐难以应对超负荷的翻译工作量,机器翻译由此应运而生。本文从机器翻译的历史和发展现状出发,探析机器翻译其不容忽视的优越性及

  摘 要:随着经济全球化的迅猛发展,世界各国间交流日益频繁,因此对各语言之间转换需求量和转换速度的要求不断提高,人工翻译逐渐难以应对超负荷的翻译工作量,机器翻译由此应运而生。本文从机器翻译的历史和发展现状出发,探析机器翻译其不容忽视的优越性及应用过程中不可避免的弊端。进而得出机器翻译离不开人工翻译,人工翻译也需要机器翻译的辅助。有鉴于此,机器翻译与人工翻译之间的关系应是相辅相成的促进关系,而非水火不容的敌对关系,在未来,二者应协同发展,互补互助。

  关键词:机器翻译;人工翻译;发展趋势

人工翻译

  机器翻译,又称计算机翻译,是指运用计算机来进行不同自然语言之间的转换,一般指自然语言之间的部分或全文的翻译。近年来,各类翻译软件及翻译系统层出不穷。如2006年,Google公司开始研发并最终推出自身品牌的翻译系统。2011年,百度公司推出能够支持27种语言互译的百度机器翻译系统。随着机器翻译系统功能的不断扩充,翻译质量的不断提升,这些软件越来越广泛的应用于人们的日常生活中。特别是其在科技类文献中的翻译表现几可与人工翻译水平一较高下。由此,学界中有些声音认为人工翻译终将有一日会被机器翻译所取代,届时,人工翻译将不复存在。然而,提出此种论调的人却忽视了机器翻译不可避免的一大现实——双语对齐语料库的建立离不开人工翻译的积淀与发展。在未来,机器翻译与人工翻译,究竟是相辅相成、携手并进、共同发展?还是机器翻译有朝一日能够脱离人工翻译的基石独立发展?为此,本文将在分析机器翻译发展历史及现状的基础上,探讨机器翻译与人工翻译的发展趋势,阐明两者齐头并进、相辅相成的可能性。

  1 机器翻译发展历史及现状

  机器翻译(Machine Translation,MT)的起源可以追溯到17世纪有关通用语言和及其词典的思想,但实用性的成果直到20世纪30年代才出现。当时法国人Georges Artsrouni和俄国人Petr Trojanskij分别取得了通用多语机器词典的发明专利。现代意义上的机器翻译, 即基于计算机的翻译,来源于工程师W. Weaver于1949年发表的《翻译》备忘录。1954年乔治敦大学和IBM首次联合实验使用电脑的机译系统,用250个词将俄文材料译成英文。这个实验标志着机器翻译进入了新的发展阶段。总体而言,机器翻译主要分为四个阶段,即基于规则的机器翻译、基于统计的机器翻译、基于实例的机器翻译和基于不同方法应用的机器翻译。

  1.1 阶段一:基于规则的机器翻译

  从Chomsky提出转换生成文法之后,基于规则的方法一直是机器翻译研究的主流,他认为一种语言无限的句子可以由有限的规则推导出来。早期的机器翻译系统,从体系结构上可以分为直译式、转换式和中间语言式,它们的不同点在于对源语言分析的深度,它们的相同点在于都需要大规模的双语语料积累,如源语言推导规则、语言转换规则和目标语言生成规则等。这些规则的分析涉及词汇、语法、语义等语言层面,依据源语和目的语之间的转换规则和目的语语言生成规则,将源于语言自动转换成目的语语言。基于规则的机器翻译的优点在于:规则可以很准确地描述出一种语言的语法构成,并且可以很直观地表示出来。机器可以按照一组规则来理解它面对的自然语言,这组规则包含了不同语言层次的规则,包括用以对源语言进行描述的源语言分析规则、用以对源语言和目标语言之间的转换规则以及用于生成目标语的生成规则。由此可见,基于规则的机器翻译的核心在于这些规则系统的描写和构建,其成功与否及其翻译质量的高低直接取决于这些规则描写的广度、深度及其适用性。然而,规则库的建立需要耗费巨大,即使如此,规则的完备性仍然不能得到根本保证,规则库很难包含所有的语言现象。随着规则数量的不断增加,规则之间的冲突无法从根本上避免;同时也很难用系统化的规则分类体系,用恰当的规则去刻画所有的语言特征。而且早期的规则系统通常采用的都是确定性规则,即非此即彼的规则,系统的适应性很差。

  1.2 阶段二:基于统计的机器翻译

  基于上述问题,如何自动地获取语言规则、如何更好地表示规则以及如何更好地增强系统的适应能力成为研究人员关注的焦点。随着大量语料库的产生,统计方法为我们提供了很好的从己有的语言资源中自动得到我们所需要的语言信息的工具,传统的基于规则的机器翻译方法研究逐步发展成为对以规则为基础、语料库方法为辅助的高性能机器翻译方法的研究。对于机器翻译来说,基于统计的方法可以从两个层面上来理解,一种是指某些概率统计的方法在具体的机器翻译过程中的应用,比如用概率统计的方法解决词性标注的问题、词义消歧的问题等。另一种较狭义的理解是指纯粹的基于统计的机器翻译,翻译所需的所有知识都来源于语料库本身。基于统计的机器翻译主要涉及模型问题、训练问题和解码问题。模型问题指建立于源于句子转化为目的语句子的翻译概率模型。训练问题指利用语料库获取翻译概率模型的所有参数。解码问题则指在已知模型和参数的基础上,查找并确定源语语句概率最大的译文。尽管统计机器翻译在一些领域取得了一定的成绩,但是它需要大量的双语语料库,而且存在着数据稀疏问题。因此,如何构建大规模的对齐双语语料库,以及找到比较好的平滑算法进行准确的参数估计,成了基于统计机器翻译系统实现中的关键问题。除此之外,要找到最优的译文,也需要好的搜索算法。

  1.3 阶段三:基于实例的机器翻译

  基于实例的机器翻译思想最早由Nagao提出,其基本思想是,在已有的源语言实例句库中,待翻译句子按照类比原理匹配出最相似的实例句,取出实例句对应的目标语句子,进行适当的改造,最终得出待翻译句子所相应的目标语句子。如果待译文本与语料库现有文本完全一致,可以直接获得高质量的译文。整个翻译过程实际上是一个匹配过程。它的特点是不需要对源语言进行任何的分析,仅仅是通过类比进行翻译。从翻译過程来看,句子一级对齐的双语语料库是基于实例的机器翻译系统的知识源,在基于实例的机器翻译系统中,双语对齐语料库被称为翻译记忆库(Translation Memory)。基于实例的机器翻译系统的翻译质量取决于翻译记忆库的规模和覆盖率。因此如何构建大规模翻译记忆库成为基于实例的机器翻译研究的关键问题。对于双语语料对齐研究,Gale等描述了基于长度和基于偏移量的语料库的句子和段落对齐方法,Kay提出了基于词汇特征的句子对齐方法。不过,由于大规模的双语对齐语料库建设难度大,且不多见,基于实例的机器翻译在翻译通用文献时往往很难取得较高的匹配度,但在翻译专业文献时却能取得较好的效果。

  推荐阅读:《语言与翻译》(季刊)创刊于1985年,由新疆《语言与翻译》杂志社办。坚持党的四项基本原则,宣传党的民族政策和民族语言文字政策,贯彻“百家争鸣,百花齐放”的办刊方针。

转载请注明来自:http://www.qikan2017.com/lunwen/wyi/17158.html

相关论文阅读

论文发表技巧

期刊论文问答区

文学历史优质期刊

最新期刊更新

精品推荐