- 签证留学 |
- 笔译 |
- 口译
- 求职 |
- 日/韩语 |
- 德语
中间语思想的本质不但包括句法转换,还包括词汇转换。该思想是避免源语单词和目标语单词之间关系的明显描述,主张通过概念之间的映射(也就是说,本体知识体系中与语言无关的元素)来进行词汇转换。回忆早先讨论过的是否应该将man翻译为otoko, ningen 或ojisan等的问题,显然所涉及的大部分处理与翻译为日语的目标并没有关系。对于man,可以采用更一般化的概念,例如GENERIC-HUMAN和MALE-HUMAN。如果在中间语中采用这种概念,则大部分翻译处理都可以通过一般的语言处理技术和模块来实现,而从英语到日语的翻译任务所特有的处理将被消除或至少得以削减。
一些中间语以及一些其他的表示则更进一步,采用了词汇分解,也就是将单词分解为组成它们的成分的意义。在图1中可以看到这种形式,was映射为PAST和PROGRESSIVE,a映射为SINGULAR和INDEFINITE。实词的分解也是可能的:单词drink可以通过(INGEST, FLUID, BY-MOUTH)来表示。通过分解单词这种方式表示句子,似乎确实可以捕捉到意义的某些方面,而不仅仅是对与输入类似的英语单词标记的重排。而且,这种表示也可能用于基于推理的排歧。例如,有可能采用单词的意义来推断在句子the policeman saw the man with a telescope和the policeman shot the man with a telescope中介词短语修饰的对象。然而,除了在很小的领域,一般很难将这类推理应用于多个例子。通常在实践中并不采用这种高性能的基于中间语的技术。
掠过许多重要的细节,现在让我们来对比一下转换模型与中间语模型的不同。最关键的一点是中间语模型通过使剖析器/解释器和/或生成器多增加一点工作,消除了在对比知识方面的需求,如图2所示。
然而,采用中间语所涉及的这点额外工作并不总是能够非常容易地完成。这需要系统设计者对该领域的语义进行详尽的分析,并将其形式化于一个本体知识体系。尽管在子语言领域这还算比较容易处理,但是今天来看这更像一门艺术而不是科学。在某些情形下,例如在航空旅行、酒店预订、餐厅推荐等领域,这种语义可以主要通过一个数据库模型来加以捕捉。在这些领域数据库中的定义确定了可能的实体和关系,而MT系统设计者的任务主要在于如何使这些实体和关系映射到所涉及的两种语言的单词和结构。
中间语思想的另一个问题是,它的纯形式需要系统在所有时间都能彻底排除歧义。对于一个真正通用的中间语,这可能引起某些不必要的工作。例如,为了从日语翻译为汉语,该中间语必须包括一些概念,例如ELDER-BROTHER和YOUNGER-BROTHER。然而,采用这些相同的概念在从德语到英语的翻译过程中将需要一个剖析器实施一些不必要的排歧工作,并且进一步需要系统具有保留歧义(preserving ambiguity)的技术,以确保输出以与输入完全一致的方式保留了歧义或模糊。即使对 Sapir-Whorf思想持怀疑态度,采用通用意义表示所有语言的思想显然也不是没有问题的。
图2 转换和中间语模型之间关系的图形表示,这个表示通常归功于Vauqois
责任编辑:admin