返回

机翻技术

搜索 导航
超值满减
逻辑形式中的歧义表示
2023-05-10 09:23:27    etogether.net    网络    


用于计算机处理的表达形式还有另一个很重要的难题,即对歧义的处理。一个典型的句子有多个可能的句法结构,其中每一个都会有多种可能的逻辑形式。而且,句子中的词也有多个意义。简单地列举出所有可能的逻辑形式是行不通的。与之相反,应当用一种方法排除常见的歧义并在逻辑形式内部表示出来。而且,应当开发一种技术,能根据句子其他部分以及上下文提供的约束逐步解决这些歧义。很多研究者把这种歧义表示看做从逻辑形式中切分出的一层表示形式,通常称为准逻辑形式(quasi-logical form)。


框1.png

逻辑形式中的歧义可能多数源自大多数词都有多个意义这一原因。有些词义有不同的结构属性,因此可以根据前后句子的上下文排除掉。但很多时候词的不同意义有相同的结构约束。目前,表示这些意义的惟一方法就是为句子中的每种可能的词义组合分别构建其逻辑形

式。为了避免逻辑形式的数目激增,可以借用和处理句法结构中多个特征值相同的方法来处理。即,任何只能用一个原子语义的地方,都用候选原子语义的集合来表示。例如,名词ball 至少有两种意义:BALL1,比赛中使用的一个东西;BALL2,和跳舞有关的一种社交活动。因此,句子“Sue watched the ball”在脱离上下文时是有歧义的。然而,一个逻辑形式就可以表示这两种可能的意义:


1. (THE b1:({BALL1 BALL2| b1)(PAST(WATCH1 SUE1 b1 )))


上式是两种可能的逻辑形式的缩写形式,即:


2. (THE b1:(BALL1 b1)(PAST(WATCH1 SUE1 b1))),和

3. (THE b1:(BALL2 b1)(PAST(WATCH1 SUE1 b1)))


逻辑形式中最复杂的歧义形式之一就是量词和运算符的相对辖域的界定。我们看到像“Every boy loves a dog”这样的句子是有歧义的,因为它随量词辖域的不同而有两种解释。任何一种上下文无关的方法都无法解决这种问题,因此歧义必定会在句子的最终逻辑形式中表现出来。与其一一列举所有可能的辖域,并因此导致解释的数量随辖域指定结构的数量呈指数级增长,还不如在逻辑形式语言中引入其他缩写形式,从而将这些解释合并到一起。更明确地说些,缩写的逻辑形式根本就不包含辖域指定信息。相反,像广义量词这样的结

构应该像对于词那样进行句法分析,并出现在句法结构要求它们出现的位置上。用尖括号将其括起来,表明它们代表其辖域的缩写形式。例如,句子“Every boy loves a dog”的逻辑形式就可以用一个简单但有歧义的形式表示为:


(LOVES1 <EVERY b1(BOY1 b1) > <A d1(DOG1 dl)>)




[1] [2] [下一页] 【欢迎大家踊跃评论】

上一篇:言语行为与内嵌句
下一篇:词义与歧义

微信公众号搜索“译员”关注我们,每天为您推送翻译理论和技巧,外语学习及翻译招聘信息。

  相关机器翻译技术文章




PC版首页 -关于我们 -联系我们