[摘 要:通过应用机器学习和自然语言处理技术,机器翻译正处于飞速发展的阶段。本文以百度翻译的《在城崎》译文为例,旨在通过分析机器翻译目前的不足之处,提出改进意见,为推动机器翻译在跨语言、跨文化交流方面的发展贡献力量。
关键词:机器翻译;日译汉;日本文学;自然语言处理

一、引言
“机器翻译是利用计算机把一种自然源语转换成另一种自然目标语言的过程。机器翻译研究如何利用计算机实现自然语言之间的自动翻译,是人工智能和自然语言处理领域的重要研究方向之一”(刘洋,2017)。当前,随着经济全球化的深入发展,各国在经济、贸易、环境、教育、文化方面的交流与合作日益频繁,语言互通的需求愈加强烈。机器翻译的快速发展,不仅在外语学习中发挥着越来越大的作用,也正在为跨语言、跨文化交流带来便利。
在关于机器翻译的先行研究中,英汉互译的相关研究占多数,而日汉翻译方面的研究尚且为数不多。随着中日两国不断加强交流,深化合作,两国在生产、贸易、教育、文化等领域的交流越来越密切,日汉翻译的需求也在不断扩大。文学作品是加强对彼此文化理解的重要途径,机器翻译能够快速翻译大量文本,具有便利高效的特点。
根据艾瑞PC Web指数,从2020年2月到2021年2月,百度翻译持续位列国内在线翻译平台的月度覆盖人数第一名。根据统计数据可得,百度翻译月平均覆盖人数约4000万人,最高可达4600万人,是目前国内使用人数最多的在线翻译平台。本文以百度翻译代表,考察机器翻译在日本文学方面的译文质量,指出不足之处并提出改进建议。
二、机器翻译在日本文学方面的质量实证考察
现代机器翻译应用机器学习和自然语言处理技术,通过学习大量数据语料不断改善。目前,机器翻译在书面文章类翻译正确率很高,会话类则较低。(郭亚军 徐芮,2020)。志贺直哉的心境小说《在城崎》全篇没有对话,为记叙和作者关于生死的议论。本文通过《在城崎》的百度翻译例文为例,分析机器翻译的不足之处,归纳错误类型并列出具有代表性的错误例句。
(一)名词误译
1.照搬汉字作为翻译
(1)原文:山女が沢山集まっている。
误译:聚集了很多山女。
确译:聚集着很多马苏大麻哈鱼。
「山女」指马苏大麻哈鱼,可译为鳟鱼或马苏大麻哈鱼。
(2)原文:植込みの八つ手の花が丁度咲きかけで……
误译:花丛里的八只花正在盛开……
确译:花丛里的八角金盘树的花刚刚盛开……
「八つ手」指八角金盘树。
此外,百度翻译译文中还出现了将「屋守」“壁虎”译为“屋守”;「雨樋」“檐漕”译为“雨樋”的误译。
2.名词识别错误
(1)原文:いもりだ。
误译:是阴天。
确译:是蝾螈。
(2)原文:いもりは力なく前へのめってしまった。
误译:蝙蝠无力地向前倾倒。
确译:蝾螈无力地向前倒下。
(3)原文:いもりと自分だけになったような気持ちがしていもりの身に自分がなってその気持ちを感じた。
误译:我有一种只剩自己一个人的感觉,在森林里自己也感受到了那种心情。
确译:似乎世间只剩下我和蝾螈,我感到自己变成了死去蝾螈的替身。
本句中「いもり」一词出现了两次,第一次百度翻译将其漏译,第二次误译成森林。
「いもり」指蝾螈,在文章其他出现了「いもり」的句子中,百度翻译正确地将其翻译为蝾螈,证明语料库中有「いもり」一词,但在上述四个误译句中,百度翻译没能将「いもり」完整识别进而翻译出来,而是错误识别成假名拼写相近的「くもり」(阴天)、「こうもり」(蝙蝠)、「もり」(森林)等词。
3.名词词义翻译错误
(1)原文:兎に角要心は肝心だからといわれて、それで来た。
误译:总之重要的是因为重要,所以来了。
确译:(医生说)总之重要的是要注意身体,所以来到了这里。
「要心」的意思是留心,注意。
机器翻译出现了将汉字直接作为译文或词义翻译错误,以及识别错误的情况。
(二)动词误译
1.动词词义翻译错误
(1)原文:それは大きな鼠を川へなげ込んだのを見ているのだ。
误译:那是在看大老鼠掉进河里了。
确译:那是在看被扔进河里的大老鼠。
「なげ込む」扔进,投入。
2.动词活用形翻译错误
(1)原文:仕舞に殺されて墓の下にいる、その静かさを……
误译:被杀在墓下的那种安静……
确译:最终被杀死后,在墓中长眠的安静……
(2)原文:自分は下へいってそれを暫く見上げていた。
误译:我往下看了一会儿那个。
确译:我走到下面,仰着头看了一会它。
句中的动词て形表示停頓和动作的先后顺序,翻译时应注意将动词活用形翻译准确。
(三)形容词、形容动词误译
(1)原文:フェータルな傷……
误译:淡雅的伤……
确译:致命的伤……
「フェータル」是外来语,致命的,命运的。
(四)拟声拟态词误译
(1)原文:カチッカチッと石垣に当って跳ね返った。
误译:喀嚓一声撞到石墙上反弹了起来。
确译:石头咯当咯当地撞到石墙上反弹了起来。
(2)原文:スポッ、スポッと石が水へ投げ込まれた。
推荐阅读:《上海翻译》(双月刊)创刊于1986年,由上海市科技翻译学会主办。