返回

机翻技术

搜索 导航
超值满减
语言特征体系与扩充语法
2023-04-13 09:22:54    etogether.net    网络    


需要注意的是,这也可以看成是一种句法分析树的表示方法,如图1所示。其中,子成分特征1和子成分特征2分别对应句法分析树中连接的两个子成分。


图1.png

图1将特征结构看做扩展的句法分析树


扩充语法规则采用特征结构描述,而不采用简单的词类。变量也可以作为特征值,这样规则的适用范围就会更广泛。例如,简单名词短语的一条规则可以表示如下:


(NP NUMBER ?n) →(ART NUMBER ?n) (N NUMBER ?n)


这就是说,NP成分可以包含两个子成分。其中,第一个子成分是ART,第二个是N,而这三个成分的NUMBER(数)特征必须相同。根据这条规则,前面所给的NP1成分是合法的。另一方面,下面这个成分:


*(NP 1(ART NUMBER s)

        2 (N NUMBER s))


就不符合这条规则,因为NP中没有NUMBER特征。另外,下面的这个成分:


*(NP NUMBER s

        1(ART NUMBER s)

        2 (N NUMBER p))


也是不可接受的,因为N成分的NUMBER特征和其他两个NUMBER特征不同。


变量对成分中歧义的表示也非常有用。比如,词语“fish”到底解读为单数还是复数,我们阅读的时候并不清楚。因此,词典通常会收录两个词条,它们的不同之处仅仅是NUMBER特征的值。换个方法,我们可以用变量来表示NUMBER的特征值,这样,只需要定义一个词条,即:


(N ROOT fish NUMBER ?n)


这种方法有效的原因是任何一个NUMBER的特征值都可以用于“fish”这个词。然而,在很多情况下,不是任何一个值都可行,而往往是一个可能的取值范围。为了处理这些问题,我们引人约束变量(constrained variable)。约束变量只能从一个指定的列表中取值,例如,变量?n{s p}指的是只能取值为s或者p的变量。写这些变量的时候,我们往往会把变量名全部去掉,仅仅列出所有可能的取值。基于这一点,词语“fish”可以表示为如下的成分:


(N ROOT fish NUMBER ?n{s p})

或者更简单地表示为:

(N ROOT fish NUMBER {s p})


图2.png


接下来,我们会面临一个很有趣的问题:扩充上下文无关文法能否表达出简单上下文无关文法无法表达的语言?问题的答案取决于我们究竟采取什么样的限制来约束特征值。如果特征值集合是个有限集,那么每个特征的组合总有可能创建新的成分类。因此,它在表达能力上与上下文无关文法等同。但是,如果特征值集合不存在任何限制,那么,这种语法具有超强的计算能力。但实际上,即使不对特征值集合加以明显的限制,这种能力也是没有用处的,而标准的句法分析算法则可以用来分析带特征的语法。


责任编辑:admin



[上一页][1] [2] 【欢迎大家踊跃评论】

上一篇:词语形态分析和词典
下一篇:有限状态模型与词语形态处理

微信公众号搜索“译员”关注我们,每天为您推送翻译理论和技巧,外语学习及翻译招聘信息。

  相关机器翻译技术文章




PC版首页 -关于我们 -联系我们