会员中心 |  会员注册  |  兼职信息发布    浏览手机版!    超值满减    人工翻译    英语IT服务 贫困儿童资助 | 留言板 | 设为首页 | 加入收藏  繁體中文
当前位置:首页 > 机翻技术 > 机器翻译 > 正文

关于PCFG的问题

发布时间: 2022-07-31 09:35:53   作者:etogether.net   来源: 网络   浏览次数:


在这个句子中,介词短语into Afghanistan或者附着于more than 100,000 soldiers这个NP,或者附着于以sent为中心语的动词短语。在PCFG中,附着关系的选择归结为在下面两个规则之间的选择:一个规则是NP→NP PP(NP附着),一个规则是VP→VPPP(VP附着)。这两个规则的概率依赖于训练语料库;Hindle and Rooth(1999)报告,根据对AP新闻专线1300万单词的语料库统计,NP附着占67%,VP附着占33%;Collins(1999)报告,在混合了《华尔街日报》和《IBM计算机手册》的语料库中,NP附着占了52%。无论NP附着的优先性是52%还是67%,关键的是在PCFG中这个优先性是纯结构的,而且对于所有动词都是相同的。


但是,在例句(12.17)中,PP的正确附着却是在动词上,是VP附着。在这种情况下,因为动词send的次范畴需要表示“方向”,而“方向”正好通过介词into来表示。在Penn树库的Brown语料库和WSJ语料库关于动词的语料中,与主要动词send有关的介词into的所有歧义的PP附着全都附着于动词。在这种情况下,只有针对不同的动词建立不同的词汇依存关系(lexical dependency)的统计模型,才能正确地选择剖析的结果。


词汇依存关系是选择正确剖析的关键,这一点还表现在联合结构歧义(coordination ambiguity)的问题上。图1是来自Collins(1999)的一个例子,短语dogs in houses and cats有两个不同的剖析。由于dogs在语义上更容易与cats结合,而不与houses结合(并且也由于dogs不可能处于cats的体内),所以[dogs in[NP houses and cats]]在直觉上就是不自然的,因而不能选择为剖析结果。然而,图1中的两个剖析使用的PCFG规则完全相同,所以PCFG将给它们指派相同的概率。


1.png


图1联合结构歧义的一个例子。尽管左边的结构在直觉上是正确的,但是PCFG将给左右两个结构都指派相同的概率,因为两个结构使用的规则完全相同(Collins,1999)


总而言之,概率上下文无关语法作为句法的一个概率模型存在着一系列不足。



责任编辑:admin


微信公众号

[上一页][1] [2] 【欢迎大家踊跃评论】
  • 上一篇:“依存语法”的概念介绍
  • 下一篇:PCFG的概率CYK剖析


  • 《译聚网》倡导尊重与保护知识产权。如发现本站文章存在版权问题,烦请30天内提供版权疑问、身份证明、版权证明、联系方式等发邮件至info@qiqee.net,我们将及时沟通与处理。


我来说两句
评论列表
已有 0 条评论(查看更多评论)