返回

机翻技术

搜索 导航
超值满减
可用性与系统开发
2022-09-08 09:21:51    etogether.net    网络    


通常实词是非常重要的,用户一般有能力使混乱的句法复原,而正确地翻译实词才是关键。特别是,使用MT系统的其中一个主要好处就是省去了大部分查询双语词典的令人生厌的工作。因此,专业的MT用户非常重视词典的规模和质量。这些用户常常通过购买特定领域的词典以提升其基本系统词典,这些领域词典是根据该领域的特点而设计的,包括医药、电子、金融、军事报道等。但是,定制词典,即使只是一个从特定领域文本语料库中抽取的词典,对该领域的特定用户来说也是非常接近他们所需的词典的。已经成立的翻译机构通常会投入大量精力来增加他们自己的系统词典。这些词典的结构比较简单,因为通常任何领域的专业词典都是无歧义的,还因为术语几乎总是没有句法特性的开放词类的单词,例如光子(photon)无论出现于什么上下文,都是光子。


很显然,如果MT系统的词典中不但包括单词,而且包含成语、固定短语甚至常见的从句和句子,则MT系统的性能会好得多。这类数据有时可以自动从语料库中抽取。而且,在某些情形下,如果能够在翻译的同时在线抽取而不是将结果存入词典,那就会更有价值,这就是基于实例的机器翻译的核心思想。


已经证实,用户满意度依赖于翻译质量以外的因素。与翻译质量相比,许多用户更关注其他因素,例如费用、速度、存储要求、直接嵌入他们所喜欢的编辑器的能力、保留SGML标记的能力等。能够存储和召回以前修正后的翻译的翻译记忆库(translation memory)也是一个用户很关注的问题。


语言的差异实质上是无尽的复杂性的源泉,的确,无论选择哪种整体架构,许多MT系统的开发工作都不得不淹没于细节的处理过程中。而且,因为一个正在工作的MT系统与任何大型软件系统一样,都是由大量的脆弱代码组成的,添加更多的知识并不总会有帮助。改善了一种现象或一个句子翻译中的缺陷,可能导致其他以前翻译正确的句子变得出错。


尽管如此,令人吃惊的是MT系统的性能仍然在不断地完善。一个已经证实的有价值的开发技术是重复开发,创建系统,在实际应用中评测系统和改善系统,并不断地重复进行。在这个过程中,MT系统会不断地适应某个领域、它的使用者的习惯,并输出用户需要的结果。


责任编辑:admin



[上一页][1] [2] 【欢迎大家踊跃评论】

上一篇:标注算法的一个具体例子
下一篇:中间语的思想:使用意义

微信公众号搜索“译员”关注我们,每天为您推送翻译理论和技巧,外语学习及翻译招聘信息。

  相关机器翻译技术文章




PC版首页 -关于我们 -联系我们