- 签证留学 |
- 笔译 |
- 口译
- 求职 |
- 日/韩语 |
- 德语
转换模型带来的一个问题是,每一对语言都需要一个截然不同的翻译规则集。对于应用于类似欧共体那样的多语言环境的翻译系统,这显然不是一种最理想的选择。
这提出了一种关于翻译本质的不同观点。转换模型把翻译看成是一个将输入句子的结构和单词转换为目标语的正确句子的处理过程。而另一种观点把翻译看成一个获取输入的意义,然后将该意义表达为目标语的处理过程。按照这种观点,一个MT系统可以不通过对比知识,而仅仅依赖于与语言的标准解释器和生成器一致的句法和语义规则来进行翻译。因此,所需的知识与MT系统能够处理的语言的数目只是成线性比例增长,而不是成平方次幂增长。
这种方案必须以存在意义表示或中间语(interlingua)为先决条件,这类中间语类似于意义表示,是一种与语言无关的范式。其核心思想是:采用中间语表示所有句子意味着无论该事件所依托的是哪种语言,该事件总还是以相同的方式进行着的“相同”的事件。采用该模型的翻译处理过程为:首先通过对输入实施语义分析,将语言X处理为中间语表示,接着由中间语生成语言Y。
在中间语表示中,常常采用的元素是题元角色的一个小的固定集合。当用于中间语时,这些题元角色被认为是所有语言通用的。图1给出了例句there was an old man gardening的可能的中间语表示,该表示是一个合一风格的特征结构。我们已经知道一个语义分析器可以产生如man和gardening之间带有的AGENT关系这样的结构。注意,中间语除了句法结构还需要这样的语义解释,因此它比转换模型需要更多的分析工作,转换模型仅需要句法剖析。但是,生成可以从中间语直接处理而不需要句法转换。
图1 there was an old man gardening的中间语表示
注意,在图1 中是以GARDENING作为EVENT特征的值的,也许有人会觉得这不是一个真正的中间语表示,而更像一个英语单词。这里存在一个关于中间语的概念和关系的正确分类的非常深刻的问题,即采用哪种本体知识体系(ontology)。当然,一个意义表示的设计者可以自由地选择标记集并确定它们的意义。但是,为MT选择本体知识体系不能有丝毫的轻率,因为它会对整个系统的体系结构产生约束。例如,题元角色的两种可能的分类,一种包括AGENT和FORCE,而另一种只包括AGENT。采用哪种分类会影响到系统对句子的翻译方式,例如将句子the quake broke glass翻译为日语,这里quake需要以de为标记,而不是通常的主语标记ga,因为地震不是有生命的。如果采用较小的只包括AGENT的分类来设计中间语,则这个句子的表示将为quake施加AGENT角色,而de与ga的问题将留给生成器。然而,如果采用扩展分类,则该表示将包括FORCE角色以及由语义分析器实施的做出该决策所必需的工作。