返回

机翻技术

搜索 导航
超值满减
次范畴化的概念及应用
2022-07-25 09:25:47    etogether.net    网络    


这个条目使用了FIRST这个特征来表示动词后的第一个论元必须是一个NP,又使用SECOND这个特征来表示这个动词只要求一个论元。像leave 这样的动词(在leave Boston in the morning中)具有两个论元,它的条目如下:


Verb → leaves

<Verb HEAD AGREEMENT NUMBER>= SG

<Verb HEAD SUBCAT FIRST CAT> = NP

<Verb HEAD SUBCAT SECOND CAT> = PP

<Verb HEAD SUBCAT THIRD> = END


当然,使用这样的方法对一个表进行编码显得太奢侈了;我们也可以使用定义的类型(type)来定义一个类型表,这样会更清楚一些。

现在,单独的动词短语规则必须检查动词所要求的成分是不是都准确地出现了。下面是关于动词及物性的规则:


VP → Verb NP

<VP HEAD> = <Verb HEAD>

<VP HEAD SUBCAT FIRST CAT> = <NP CAT >      (11.15)

<VP HEAD SUBCAT SECOND>= END


在这个规则约束中的第二个约束说明,动词的SUBCAT表中的第一个成分必须与直接处于动词之后的成分的范畴相匹配。第三个约束说明这个动词短语规则只要求一个单独的论元。


前面的例子只代表了一些非常简单的动词的次范畴化结构。事实上,动词的次范畴化可表示为非常复杂的次范畴化框架(例如NP PP,NP NP或者NPS),并且这些框架可以成为很多不同的短语类型的组成部分。为了给英语的动词构造可能的次范畴化框架表,首先需要列出可以构成这些框架的可能的短语类型的表。图1是英语中构成动词次范畴化框架的一个可能的短语类型的简单的表。这个表是根据FrameNet课题(Johnson,1999;Baker et al.,1998)中的动词次范畴化框架修改而成的,表中包括诸如there和it这样的动词特殊主语的短语类型,以及宾语和补语的短语类型。


1.png

1a.png



图1 可以构成动词的潜在次范畴化框架的潜在短语类型集合。根据FrameNet的标记集修改而成(Johnson,1999;Baker et al.,1998)。样本句子的片断来自英国国家语料库(British National Corpus,简称BNC)




[上一页][1] [2] [3] [下一页] 【欢迎大家踊跃评论】

上一篇:合一的数据结构
下一篇:自然语言有限状态剖析方法

微信公众号搜索“译员”关注我们,每天为您推送翻译理论和技巧,外语学习及翻译招聘信息。

  相关机器翻译技术文章




PC版首页 -关于我们 -联系我们