会员中心 |  会员注册  |  兼职信息发布    浏览手机版!    精选9.9元!    人工翻译    英语IT服务 贫困儿童资助 | 留言板 | 设为首页 | 加入收藏  繁體中文
当前位置:首页 > 机翻技术 > 机器翻译 > 正文

次范畴化的概念及应用

发布时间: 2022-07-25 09:25:47   作者:etogether.net   来源: 网络   浏览次数:
摘要: 为了防止生成那些与动词和动词短语不匹配的不合语法的句子,我们不得不把动词的范畴分解成多个次范畴(subcategory)。


次范畴化(subcategorization)这个概念是指动词对于与它一起出现的论元模式的严格要求。为了防止生成那些与动词和动词短语不匹配的不合语法的句子,我们不得不把动词的范畴分解成多个次范畴(subcategory)。然后,应用这些更特殊的动词范畴来定义允许与它们共同出现的特殊动词短语。如下面的规则所示:


Verb-with-S-comp → think

VP → Verb-with-S-comp S


显而易见,这样的方法将导致我们所不期望的范畴的大量增长,而解决各种问题的办法却相差不大。为了避免范畴的大量增长,可以导入特征结构来区分各种不同的动词范畴。把一个称为SUBCAT的原子特征与适当的值和词典中的每个动词结合起来,就可以实现这个目标。例如,在词典中可以给及物动词serves指派如下的特征结构:


Verb → serves

<Verb HEAD AGREEMENT NUMBER> = SG

<Verb HEAD SUBCAT> = TRANS


这个特征SUBCAT说明,这个动词在动词短语中出现时,在语法上要求一个单独的名词短语作为它的论元。这样的约束还可以加上语法中所有动词短语规则的相应约束来进一步强化,这些约束如下:


VP → Verb

<VP HEAD> = <Verb HEAD>

<VP HEAD SUBCAT> = INTRANS


VP → Verb NP

<VP HEAD> =<Verb HEAD>


<VP HEAD SUBCAT>= TRANS


VP → Verb NP NP

<VP HEAD> =(Verb HEAD)

<VP HEAD SUBCAT> = DITRANS


在这些规则中的第一个合一约束,说明动词短语从它的动词组成成分中获得HEAD特征,而第二个约束说明,这个SUBCAT的值应该是什么。任何要求动词与一个不适合的动词短语一起使用的企图都是注定要失败的,因为这时VP的SUBCAT特征的值都不能与在第二个约束中给定的原子符号进行合一。注意,这种方法要求英语的50~100个动词短语中的每个都有一个特定的符号。


这个方法有点儿不透明,因为这些不可分析的SUBCAT符号,既不能对于动词期望采用的论元的数目直接进行编码,也不能对于动词期望采用的论元的类型直接进行编码。为了看清楚这一点,需要注意的是,不能以为只要简单地检查词典中的动词条目,就可以知道它的次范畴化框架是什么。


必须间接地使用SUBCAT特征的值,把它作为一个指针,指向在语法上能够接受该动词的动词短语规则。


一个比较漂亮的解决方法是更好地利用特征结构的表达能力,允许动词条目能够直接说明它们所要求的论元的顺序和范畴。下面关于serves的条目是使用这种方法的一个例子。在这个条目中,动词的次范畴特征用它的宾语和补语的一个表(list)来表示。


Verb → serves

<Verb HEAD AGREEMENT NUMBER> = SG

<Verb HEAD SUBCAT FIRST CAT>= NP

<Verb HEAD SUBCAT SECOND> = END



微信公众号

[1] [2] [3] [下一页] 【欢迎大家踊跃评论】
  • 上一篇:合一的数据结构
  • 下一篇:自然语言有限状态剖析方法


  • 《译聚网》倡导尊重与保护知识产权。如发现本站文章存在版权问题,烦请30天内提供版权疑问、身份证明、版权证明、联系方式等发邮件至info@qiqee.net,我们将及时沟通与处理。


我来说两句
评分: 1分 2分 3分 4分 5分
评论内容:
验证码:
【网友评论仅供其表达个人看法,并不表明本站同意其观点或证实其描述。】
评论列表
已有 0 条评论(查看更多评论)