- 签证留学 |
- 笔译 |
- 口译
- 求职 |
- 日/韩语 |
- 德语
三、字数统计
字数统计是翻译过程中最具争议的问题之一,因为这直接关系到费用支付,现今在本地化行业中绝大多数翻译工作都是按字数支付报酬的,因此我们着重来看一下不同的TM工具是如何计算字数的。首先来看看Word。Word将任何字符或以空格分隔的任何单词及符号都算做单独的字。某些符号即使无需翻译,也被当做单独的字,如($,
%,&,/)在Word中是被当做4个字来计算的。此外,数字也被当做单独的字来计算。
SDLX则提供了两种计数方式,一种是完全等同于Word的方式,一种则是SDLX特有的方式,该方式将数字及一些特殊字符也作为字数计算,但它不将符号当做字数,比如项目符号或编号等,这些在Word中是被当做单独字数计算的。Translator's Workbench 只计算可翻译的文本,不包括任何数字及符号。下表列出了不同TM工具处理字数统计的对照表,以供参考。
四、文件格式
每个TM工具都会提供其所支持的文件格式的一览表以供用户参考。在一般情况下,最终用户都不必过于担心,因为大多数TM工具都能够处理大多数常见的文件格式。然而,如我们所知,本地化项目往往要处理许多不可预见的文件格式,同时不同格式的文件中的复杂度也是不可预见的。碰到这类情形时,就要看哪个工具提供商能够提供更灵活的接口,允许用户自行创建或者自定义过滤器及转换程序。
有些工具使用Word作为默认编辑器,比如Translator's Workbench和Wordfast,因此,只要被翻译的文档可以用Word打开,就无需进行任何转换或使用任何过滤器;如果Word无法很好地打开,或者该文档需要做进一步处理,则这些工具通常要么另行提供一种编辑器(比如Trados就另行提供 TagEditor来处理所有的标记语言如 html、xml等),要么对该文档进行转换之后再用Word打开(比如Trados提供的过滤器之一S-Tagger for FrameMaker就是专为将FrameMaker 文件转换为Word可以打开的RTF文件的),相应地,文档翻译完后还需要重新转换回去。
五、模糊匹配与匹配率
模糊匹配是所有TM工具都应用的一项技术,当所要翻译的文本片段与TM中的某个片段比较近似时,TM工具在预处理时会将其标识为模糊匹配(Fuzzy Match),同时TM工具还会通过某种算法来比较两个片段的相似程度,并给出一个百分比。比例越高,表明TM中该近似片段被利用的程度也就越高;比例为100%时,即称之为100%匹配,表明该译文是可以完全利用的。
由于各个TM工具所采用的算法各不相同,因此,即使是使用同一个TMX和同一段文本,其所得出的模糊匹配也往往是不尽相同的,下图简要地比较了各个工具对同一文本片段的分析结果,以供参考。
责任编辑:admin