返回

机翻技术

搜索 导航
超值满减
高效的歧义表示技术
2023-04-26 09:24:58    etogether.net    网络    


图3.png

图3 “saw the man in the house with a telescope”解释的chart 图


另外一种使用到的技术叫做压缩(packing),这种技术利用了可以在图3中看到的某种性质,即许多语法成分类型相同,涵盖的输入也一样。对于不带特征的句法分析器来说,每个成分只要是作为规则中的子成分,处理起来都是一样的。对于各种来自于同一输人而类型不

同的成分,压缩chant形式只存储其中的一个成分,找到的其余成分均分解到这个现有成分之中。图4给出了对同一个句子采用压缩技术生成的chat图,它只使用了15个非词汇节点。压缩可以高效地生成解释结果的表示形式,并且不会丢失信息。不过,对于那些带特征的语法,情况就复杂得多。具体来说,如果两种VP的解释涵盖相同的输入而特征值不同,那么,这两种解释就不能合并,因为它们在组合起来生成更大成分的时候,处理方式并不相同。可以对特征检测进行修改,只有当每个可能的成分均满足要求时,才允许它们成功合并。但是,chart图可能会过度生成解释结果,以至于最后不得不重新分析所有可能的解析结果,并进一步验证它们是否有效。


图4.png

图4“saw the man in the house with a telescope”解释的压缩chart 图


另一个减少解释结果的方法是对语法进行修改,使歧义都变成语义歧义,而不是句法歧义。例如,对于名词修饰名词的歧义消解,可以不用前面提到的规则5、规则6和规则7,它们都在名词修饰语上引入了二元结构。只须使用一条规则,该规则允许存在平面结构上的名词修饰语序列。在扩展的语法中,如果允许Kleene+操作①,下面这条规则就足够了:


N2 → N+


符号N+允许符号N一次或多次重复。如果没有“+”号,这一语法需要采取一系列的规则,直至达到某个允许的最大修饰语数目为止。这些规则有:


N2 → N

N2 → N N

N2 → N N N

N2 → N N N N


这样的语法看起来更加复杂,但分析起来效率更高,因为已经消除了结构上的歧义。举例来说,名词短语“pot holder adjustment screw”就只存在一种解释。


也有人提出采用类似的方法来解决附着歧义问题。我们不生成所有的解释,而是仅仅生成一种解释结果,即PP覆盖范围最广的解释,有时候,也称之为经典解释(canonical interpretation)。然后,需要设计语义解释器,以便能够附着句法分析树中较低层的PP,基于语义的约束似乎就可以正确地实现这个目标。


另外一种方法叫做D理论(D-theory)或者叫做描述理论方法(description-theory approach)。在D理论中,我们会修改句法分析器输出结果的意义。D理论定义了一套控制转移关系,即成分M控制成分C的前提是,C是M的直接子成分,或者是M子成分的子成分,依次类推。采用这个新术语,可以说传统句法分析器的输出是一个直接控制关系的集合,这些关系能定义出句法分析树。在D理论中,我们将输出结果看成是控制关系的集合。举例来说,在分析过程中,可以说VP1控制PP1,这意味着PP1可能是VP1的子成分,也允许它作为VP1子成分的子成分。因此,通过输出结果本质属性的改变,可以简单有效地刻画出很多种歧义形式。


责任编辑:admin



[上一页][1] [2] 【欢迎大家踊跃评论】

上一篇:浅层句法分析
下一篇:移进归约句法分析器

微信公众号搜索“译员”关注我们,每天为您推送翻译理论和技巧,外语学习及翻译招聘信息。

  相关机器翻译技术文章




PC版首页 -关于我们 -联系我们