返回

机翻技术

搜索 导航
超值满减
背景知识的表示及处理
2023-06-15 09:29:13    etogether.net    网络    


在任何知识表示系统中,都有两类重要的知识:(1)世界知识,(2)当前情境的特定知识。目前,我们已经探讨了一些一般性的世界知识,例如类型的层次体系、部分/整体的关系,等等。这包括世界的一般约束信息和语言中的一些术语的语义定义。通用知识主要描述的是某一类事物的信息,而不是描述某一特定个体的信息。例如,OWN1表示人和对象之间的一种联系,而不是指某个特定的人(比如John)拥有一辆特定的车。第二类知识,即某一个体的信息,在语言理解中也是很重要的,是我们称之为所理解句子的特定场景的主要组成部分。实际上,所有的知识表示系统或多或少都支持这两种层次的推理。


世界知识对于解决语言解释的很多问题是非常必要的,其中最重要的问题之一是歧义消解。例如,下面两个句子中介词短语附着的歧义消除完全依赖于读者对于 reading (阅读)和evolution(进化)所需时间的背景知识:


I read a story about evolution in ten minutes.

(我花十分钟读了一篇关于进化的文章。)


I read a story about evolution in the last million years.

(我读了一篇关于近一百万年来的进化的文章。)


当前情境的特定知识对很多问题都很重要。例如,确定名词短语的指代,以及根据在当前情境中是否有意义来进行词义排歧。


在非正式的场合,知识表示有时候可以指智能系统中知识和信念的表示。但是,因为我们将在后面对知识和信念这两个术语进行准确的定义,所以这里采用更中性的术语来介绍。知识表示包括命题库和一系列的推理技术。其中,命题库称为知识库,推理技术用于在给定当前知识库的前提下推导出新命题。当知识库中的原始命题正确时,如果只推导出正确的新命题,那么推理技术是可靠的。然而,后面我们将看到,不是所有有用的推理技术都是可靠的。


用于定义知识库中的命题的语言称为知识表示语言(KRL, knowledge representation language)。KRL可以与逻辑形式语言相同,但实际上,它们经常不相同。这两种语言是从不同的需求推导出来的。逻辑形式语言必须具有很强的表达能力,以便于简化语义解释过程并能够有效地消除歧义。而知识表示语言必须支持特定领域内的有效的和预测性的推理。换言之,知识表示语言要很容易定义命题集合和建立计算模型。其中,命题集合可以从特定知识库中推理得到,计算模型用来在合理的时间内完成推理过程。


例如,有关量词处理的情况。在逻辑形式语言中引入了很多量词,这些量词与英文中量词的不同含义相对应。这样,就可以实现更精确的消除技术,例如能够利用实际量词之间的细微差别(比如each和every)来消除量词辖域指定的歧义。而目前,大多数知识表示语言只有很少的量词,通常情况下只有一个量词——这个语言可以接受全称量词。这样,推理机制就很容易定义。通过保持两种语言独立性并在两种语言之间定义一种映射函数,可以同时拥有这两种语言的优势。当然,这一方法的成功与否取决于映射函数是否能够有效地定义。


要想得到一种最好的方法,同时能够满足强大表达能力的逻辑形式和高效的知识表示的需要,需要做更实质性的研究工作。在目前的知识条件下,分别维护一种逻辑形式和一种知识表示语言可能是最好的折中选择。


给定一个知识库中的所有公式,或者给定表示某个命题意义的所有公式,如果公式P一定为真,我们称这个知识库(或这个命题)蕴涵P。为了理解语言,需要得到的结论往往都不是这个句子的蕴涵,而是句子的隐含意义。隐含意义一般指可以从句子中推导出来的结论,但是在特定情况下可能被明确地否认。例如,句子“Jack owns two cars”蕴涵了Jack有一辆车(即,不能否认这个事实),但是,可以隐含Jack没有三辆车的意思。不过下文中,你也可以继续说:“In fact,he owns three cars”(实际上,他有三辆车)。知识表示系统必须能够支持这两种形式的推理。


责任编辑:admin




上一篇:机器翻译的推理技术
下一篇:意愿运算符与辖域解析

微信公众号搜索“译员”关注我们,每天为您推送翻译理论和技巧,外语学习及翻译招聘信息。

  相关机器翻译技术文章




PC版首页 -关于我们 -联系我们