返回

机翻技术

搜索 导航
超值满减
句法分析过程中进行辖域指定的方法
2023-06-03 10:07:06    etogether.net    网络    


现在,有很多不同的策略可用于判定辖域。例如,分析器按原来的方式运行,但我们写了一个新的解释程序,以无辖域的逻辑形式作为输入,并生成一个完整的指定了辖域的逻辑形式。那些直接使用逻辑形式的有效方法往往不考虑不同句法结构的影响。另一种方法是修改在语法中进行语义解释的方法,并要求分析器在分析句子的同时计算各种候选(或可能)的辖域。


我们对语法中的语义分析做一些改变,这样量词结构和SEM结构可以分别存到不同的特征里。例如,在老方法里诸如“the woman”这样的名词短语的SEM是<THE w1(WOMAN1 w1)>,在新方法里QS(表示量词Quantifiers)特征设定为<THE w1 (WOMAN1 w1)>,而SEM设为篇章变量w1。构造子成分的SEM形式的技术和以前一样,惟一要做的扩展是定义如何构造QS特征。一旦同一局部论域中所有的量词都收集到一起,就可以对其进行排序,并构造完整的指定了辖域的SEM形式。可以对分析器进行修改,每当构造了一个S或NP成分,就触发辖域判定算法。而这个方法将留给语法设计者更大的灵活性。我们定义一个新的二元特征SCOPEP-OS,只要它为+,分析器就触发程序,对量词进行排序。这个程序判断要将哪个量词提升到上一层横向上下文中,并对剩下的量词进行排序,然后将它们插入到SEM中。


例如,思考疑问句“When does each plane fly?”一开始,这个疑问句经过分析,构造出一个无辖域的表达式(忽略表示时间的时态运算符):


(S SCOPEPOS+

    QS (<WH t1 (TIME t1)> <EACH p1 (PLANE1 p1)>)

    SEM (&(FLIES1 f1 p1) (AT-TIME f1 t1)))


因为这个表达式有SCOPEPOS特征,所以激活了量词辖域判定算法。最高层的S不需要提升量词,然后经过排序,生成的新成分之一可能是:


(S SCOPEPOS -

    QS nil

    SEM (EACH f1 : (PLANE1 p1)

                 (WH t1 : (TIME t1)

                          (&(FLIES1 f1 p1)(AT-TIME f1 t1)))))


如果存在几种可能的解释,辖域判定程序会构造出多个新的S成分并添加到chart里。


再举一例,思考对关系从句的处理,例如名词短语“The flights that each man took”。作为关系从句的内嵌句,其初始形式是:


(S SCOPEPOS+

    QS (<EACH m1 MAN1>)

    SEM (TAKES1 t1 m1 x))


其中,x是表示关系代词的变量。如果将关系从句视为绝对辖域孤岛,则只有一种可能的解释,即将量词插入到SEM中,生成成分:


(S SCOPEPOS -

    QS nil

    SEM (EACH m1 : (MAN1 m1) (TAKES1 t1 m1 x)))


如果量词可以提升,会得到另一个可能的成分,即:


(S SCOPEPOS-

    QS (<EACH m1 MAN1>)

    SEM (TAKES1 t1 m1 x))




[1] [2] [下一页] 【欢迎大家踊跃评论】

上一篇:计算互指约束
下一篇:对量词进行分类

微信公众号搜索“译员”关注我们,每天为您推送翻译理论和技巧,外语学习及翻译招聘信息。

  相关机器翻译技术文章




PC版首页 -关于我们 -联系我们