会员中心 |  会员注册  |  兼职信息发布    浏览手机版!    超值满减    人工翻译    英语IT服务 贫困儿童资助 | 留言板 | 设为首页 | 加入收藏  繁體中文
当前位置:首页 > 行业文章 > 笔译技术 > 正文

翻译记忆库技术

发布时间: 2021-09-27 09:21:27   作者:etogether.net   来源: 网络   浏览次数:



三、字数统计


字数统计是翻译过程中最具争议的问题之一,因为这直接关系到费用支付,现今在本地化行业中绝大多数翻译工作都是按字数支付报酬的,因此我们着重来看一下不同的TM工具是如何计算字数的。首先来看看Word。Word将任何字符或以空格分隔的任何单词及符号都算做单独的字。某些符号即使无需翻译,也被当做单独的字,如($,

%,&,/)在Word中是被当做4个字来计算的。此外,数字也被当做单独的字来计算。


SDLX则提供了两种计数方式,一种是完全等同于Word的方式,一种则是SDLX特有的方式,该方式将数字及一些特殊字符也作为字数计算,但它不将符号当做字数,比如项目符号或编号等,这些在Word中是被当做单独字数计算的。Translator's Workbench 只计算可翻译的文本,不包括任何数字及符号。下表列出了不同TM工具处理字数统计的对照表,以供参考。


3.jpg



四、文件格式


每个TM工具都会提供其所支持的文件格式的一览表以供用户参考。在一般情况下,最终用户都不必过于担心,因为大多数TM工具都能够处理大多数常见的文件格式。然而,如我们所知,本地化项目往往要处理许多不可预见的文件格式,同时不同格式的文件中的复杂度也是不可预见的。碰到这类情形时,就要看哪个工具提供商能够提供更灵活的接口,允许用户自行创建或者自定义过滤器及转换程序。


有些工具使用Word作为默认编辑器,比如Translator's Workbench和Wordfast,因此,只要被翻译的文档可以用Word打开,就无需进行任何转换或使用任何过滤器;如果Word无法很好地打开,或者该文档需要做进一步处理,则这些工具通常要么另行提供一种编辑器(比如Trados就另行提供 TagEditor来处理所有的标记语言如 html、xml等),要么对该文档进行转换之后再用Word打开(比如Trados提供的过滤器之一S-Tagger for FrameMaker就是专为将FrameMaker 文件转换为Word可以打开的RTF文件的),相应地,文档翻译完后还需要重新转换回去。


五、模糊匹配与匹配率


模糊匹配是所有TM工具都应用的一项技术,当所要翻译的文本片段与TM中的某个片段比较近似时,TM工具在预处理时会将其标识为模糊匹配(Fuzzy Match),同时TM工具还会通过某种算法来比较两个片段的相似程度,并给出一个百分比。比例越高,表明TM中该近似片段被利用的程度也就越高;比例为100%时,即称之为100%匹配,表明该译文是可以完全利用的。


由于各个TM工具所采用的算法各不相同,因此,即使是使用同一个TMX和同一段文本,其所得出的模糊匹配也往往是不尽相同的,下图简要地比较了各个工具对同一文本片段的分析结果,以供参考。


4.jpg



责任编辑:admin



微信公众号

[上一页][1] [2] 【欢迎大家踊跃评论】
  • 上一篇:软件本地化工程
  • 下一篇:翻译的选词用字


  • 《译聚网》倡导尊重与保护知识产权。如发现本站文章存在版权问题,烦请30天内提供版权疑问、身份证明、版权证明、联系方式等发邮件至info@qiqee.net,我们将及时沟通与处理。


我来说两句
评论列表
已有 0 条评论(查看更多评论)