机翻技术

搜索导航

高效的歧义表示技术

2023-04-26 09:24:58 etogether.net 网络次

图3.png

图3 “saw the man in the house with a telescope”解释的chart 图

另外一种使用到的技术叫做压缩(packing)，这种技术利用了可以在图3中看到的某种性质，即许多语法成分类型相同，涵盖的输入也一样。对于不带特征的句法分析器来说，每个成分只要是作为规则中的子成分，处理起来都是一样的。对于各种来自于同一输人而类型不

同的成分，压缩chant形式只存储其中的一个成分，找到的其余成分均分解到这个现有成分之中。图4给出了对同一个句子采用压缩技术生成的chat图，它只使用了15个非词汇节点。压缩可以高效地生成解释结果的表示形式，并且不会丢失信息。不过，对于那些带特征的语法，情况就复杂得多。具体来说，如果两种VP的解释涵盖相同的输入而特征值不同，那么，这两种解释就不能合并，因为它们在组合起来生成更大成分的时候，处理方式并不相同。可以对特征检测进行修改，只有当每个可能的成分均满足要求时，才允许它们成功合并。但是，chart图可能会过度生成解释结果，以至于最后不得不重新分析所有可能的解析结果，并进一步验证它们是否有效。

图4.png

图4“saw the man in the house with a telescope”解释的压缩chart 图

另一个减少解释结果的方法是对语法进行修改，使歧义都变成语义歧义，而不是句法歧义。例如，对于名词修饰名词的歧义消解，可以不用前面提到的规则5、规则6和规则7，它们都在名词修饰语上引入了二元结构。只须使用一条规则，该规则允许存在平面结构上的名词修饰语序列。在扩展的语法中，如果允许Kleene+操作①，下面这条规则就足够了：

N2 → N+

符号N+允许符号N一次或多次重复。如果没有“+”号，这一语法需要采取一系列的规则，直至达到某个允许的最大修饰语数目为止。这些规则有：

N2 → N

N2 → N N

N2 → N N N

N2 → N N N N

这样的语法看起来更加复杂，但分析起来效率更高，因为已经消除了结构上的歧义。举例来说，名词短语“pot holder adjustment screw”就只存在一种解释。

也有人提出采用类似的方法来解决附着歧义问题。我们不生成所有的解释，而是仅仅生成一种解释结果，即PP覆盖范围最广的解释，有时候，也称之为经典解释(canonical interpretation)。然后，需要设计语义解释器，以便能够附着句法分析树中较低层的PP，基于语义的约束似乎就可以正确地实现这个目标。

另外一种方法叫做D理论（D-theory）或者叫做描述理论方法（description-theory approach）。在D理论中，我们会修改句法分析器输出结果的意义。D理论定义了一套控制转移关系，即成分M控制成分C的前提是，C是M的直接子成分，或者是M子成分的子成分，依次类推。采用这个新术语，可以说传统句法分析器的输出是一个直接控制关系的集合，这些关系能定义出句法分析树。在D理论中，我们将输出结果看成是控制关系的集合。举例来说，在分析过程中，可以说VP1控制PP1，这意味着PP1可能是VP1的子成分，也允许它作为VP1子成分的子成分。因此，通过输出结果本质属性的改变，可以简单有效地刻画出很多种歧义形式。

责任编辑：admin

[上一页][1] [2] 【欢迎大家踊跃评论】

上一篇：浅层句法分析
下一篇：移进归约句法分析器

微信公众号搜索“译员”关注我们，每天为您推送翻译理论和技巧，外语学习及翻译招聘信息。

机翻技术

相关机器翻译技术文章