11月15日晚上6点,上外博士沙龙第31期静湖读书会在松江校区4339教室如期举办。分享人为许伟老师,主题为“机器翻译——重建巴别塔”。
许伟,工程师,长期从事计算机和翻译技术研究,专注于平行语料库建设、计算机辅助翻译技术及其应用研究,发表多篇学术论文,拥有十余年的塔多思(Trados)机辅翻译实践经验。
许老师从机器翻译(MachineTranslation)的定义入手,接着按照基本工作原理、翻译过程、使用方法引入机器翻译分类,如百度在线翻译就是工作原理基于实例的机器翻译,而工作原理基于统计的机器翻译是在语料库中提供给译者匹配、采用率最高的译法。
机器翻译的优点在于速度快、效率高、一致性好,然而现阶段机器翻译过程中关于准确性、可读性和情感的缺失也频有发生。许老师表示,随着语料库的不断积累扩大,翻译准确度会越来越高。机器翻译的发展趋势呈现混合型、智能型和云端型。对于文学作品的翻译尚不可能取代,但是对于普通译者来说,将面临很大的挑战。许多翻译公司在翻译普通文件时,更倾向于使用机器翻译。
主讲人接着引入此次读书会的重点:计算机辅助翻译 (Computer Aided Translation,CAT),不同于以往的机器翻译软件,不依赖于计算机的自动翻译,而是在人的参与下完成整个翻译过程。目前应用最广泛、影响力最大的是塔多思(SDL Trados),支持57种语言之间的双向互译,支持所有流行文档格式,为全球百强品牌中的78家提供支持,是目前世界上最好的专业翻译软件,已经成为专业翻译领域的标准。
不仅带同学们了解塔多思,许老师更是亲自演示了SDL Trados2011版本的基本用法。主要是如何建立翻译记忆库与术语库。翻译记忆库是以平行语料库的形式保存已经翻译好的文本,是真正提高效率的关键,可以实现原语言与目标语言的百分百匹配。许老师谈到,学习塔多思操作一般需要两天左右的培训。(文末附塔多思基本操作步骤)
塔多思拥有强大的翻译记忆功能,易于维护的术语库,具备一定的语分析能力,能帮助译者大大提高工作效率、提高质量。在科技技术如此发达的时代,许老师鼓励同学们加强自身硬实力,熟练掌握塔多思基本操作,擅于利用计算机辅助翻译以提高工作效率及个人竞争力。
接近讲座尾声时,主讲人回答同学们关于人工智能如何辅助口译的问题,无论机器口译还是笔译,关键技术都在于平行语料库和机器翻译。机器口译对语音识别过程技术要求高,最后通过朗读系统发声实现口译过程。
最后,许老师谈到了人工智能发展的前景,神经网络智能技术的发展将会提高人工智能翻译的性能。随着计算机辅助翻译在全球范围内的广泛应用和各种翻译软件的日益完善,计算机辅助翻译势必会成为未来翻译发展的主要趋势。这一次,巴别塔的重建将会克服不同语言形成的障碍。
第31期静湖读书会圆满结束。上外博士沙龙后续将为您带来更多精彩分享,欢迎您继续关注我们!
(文/上外博士沙龙冯晨)
附塔多思基本操作步骤:
1、建立翻译记忆库
(1)运行SDL Trados Studio 2011,点“翻译记忆库”->“新建”->“翻译记忆库”;
(2)输入记忆库名称,设置好路径,选择源语言和目标语言语种;
(3)字段和设置中按默认设置,点“下一步”;
(4)语言资源按默认设置,点“完成”。
(5)右键点击翻译记忆库名称,点“导入”->“添加文件”,浏览打开之前用WinAlign对齐后导出的*.tmx文件。 (注意:WinAlign中,需将“导出”设置为“翻译记忆库交换格式(TMX)”。)
2、建立术语库
(1)用Office Excel将术语准备成英汉对照表;
(2)运行SDL MultiTerm2011 Convert,点“下一步”-> “下一步”,选“OfficeExcel格式”,浏览打开*.xls文件,-> “下一步”,指定好索引字段的语种,点“下一步”-> “下一步” 即可转换为MTF.XML格式;
(3)运行SDL MultiTerm2011 Desktop,点“创建术语库”,在“术语库定义”中选“使用预定术语库模板”-> 在“索引字段” 中设置好语种,然后按默认完成设置;
(4)打开“目录”视图,在导航树的术语库名称下,选择“导入”,选择要使用的导入定义,从菜单中选择“目录”-> “处理”,导入之前转换的MTF.XML文件。
3、翻译操作
(1)运行SDL Trados Studio,点“新建”-> “项目”,“下一步”-> “下一步”,指定源语言和目标语言的语种,-> “下一步”,添加要翻译的文件,-> 指定翻译记忆库,->指定术语库,-> 点“下一步”直到完成;
(2)点“文件视图”,双击要翻译的文件名即开始翻译;