机翻技术

搜索导航

句法分析过程中进行辖域指定的方法

2023-06-03 10:07:06 etogether.net 网络次

现在，有很多不同的策略可用于判定辖域。例如，分析器按原来的方式运行，但我们写了一个新的解释程序，以无辖域的逻辑形式作为输入，并生成一个完整的指定了辖域的逻辑形式。那些直接使用逻辑形式的有效方法往往不考虑不同句法结构的影响。另一种方法是修改在语法中进行语义解释的方法，并要求分析器在分析句子的同时计算各种候选（或可能）的辖域。

我们对语法中的语义分析做一些改变，这样量词结构和SEM结构可以分别存到不同的特征里。例如，在老方法里诸如“the woman”这样的名词短语的SEM是<THE w1（WOMAN1 w1）>，在新方法里QS（表示量词Quantifiers）特征设定为<THE w1 (WOMAN1 w1)>，而SEM设为篇章变量w1。构造子成分的SEM形式的技术和以前一样，惟一要做的扩展是定义如何构造QS特征。一旦同一局部论域中所有的量词都收集到一起，就可以对其进行排序，并构造完整的指定了辖域的SEM形式。可以对分析器进行修改，每当构造了一个S或NP成分，就触发辖域判定算法。而这个方法将留给语法设计者更大的灵活性。我们定义一个新的二元特征SCOPEP-OS，只要它为+，分析器就触发程序，对量词进行排序。这个程序判断要将哪个量词提升到上一层横向上下文中，并对剩下的量词进行排序，然后将它们插入到SEM中。

例如，思考疑问句“When does each plane fly?”一开始，这个疑问句经过分析，构造出一个无辖域的表达式（忽略表示时间的时态运算符）：

(S SCOPEPOS+

QS (<WH t1 (TIME t1)> <EACH p1 (PLANE1 p1)>)

SEM (&(FLIES1 f1 p1) (AT-TIME f1 t1)))

因为这个表达式有SCOPEPOS特征，所以激活了量词辖域判定算法。最高层的S不需要提升量词，然后经过排序，生成的新成分之一可能是：

(S SCOPEPOS -

QS nil

SEM (EACH f1 : (PLANE1 p1)

(WH t1 : (TIME t1)

(&(FLIES1 f1 p1)(AT-TIME f1 t1)))))

如果存在几种可能的解释，辖域判定程序会构造出多个新的S成分并添加到chart里。

再举一例，思考对关系从句的处理，例如名词短语“The flights that each man took”。作为关系从句的内嵌句，其初始形式是：

(S SCOPEPOS+

QS (<EACH m1 MAN1>)

SEM (TAKES1 t1 m1 x))

其中，x是表示关系代词的变量。如果将关系从句视为绝对辖域孤岛，则只有一种可能的解释，即将量词插入到SEM中，生成成分：

(S SCOPEPOS -

QS nil

SEM (EACH m1 : (MAN1 m1) (TAKES1 t1 m1 x)))

如果量词可以提升，会得到另一个可能的成分，即：

(S SCOPEPOS-

QS (<EACH m1 MAN1>)

SEM (TAKES1 t1 m1 x))

[1] [2] [下一页] 【欢迎大家踊跃评论】

上一篇：计算互指约束
下一篇：对量词进行分类

微信公众号搜索“译员”关注我们，每天为您推送翻译理论和技巧，外语学习及翻译招聘信息。

机翻技术

相关机器翻译技术文章