会员中心 |  会员注册  |  兼职信息发布    浏览手机版!    超值满减    人工翻译    英语IT服务 贫困儿童资助 | 留言板 | 设为首页 | 加入收藏  繁體中文
当前位置:首页 > 机翻技术 > 机器翻译 > 正文

概率上下文无关语法

发布时间: 2022-07-29 09:26:27   作者:etogether.net   来源: 网络   浏览次数:



一个特定的剖析T的概率定义为在该剖析树中用来展开每个结点n的所有规则r的概率的乘积:


12.2.png


作为结果的概率P(T,S)既是剖析和句子的联合概率,又是剖析P(T) 的概率。怎样证实这个公式的正确性呢?


首先,根据联合概率的定义有:


P(T,S) = P(T) P(SIT)       (12.3)


但是,因为剖析包含了句子中的所有单词,所以P(SIT)等于1。因此有:


P(T,S) = P(T)P(S|T) = P(T)         (12.4)


图2中的每个剖析树的概率的计算,只要把在推导中使用的每个规则概率相乘就可以得到计算结果。侧如,图12.2(a)中左侧的剖析树(称为T)的概率以及图12.2(b)中右侧的剖析树(称为T,)的概率可以计算如下:


12.5.png


我们可以看出,在图12.2(b)中右侧的剖析树具有比较高的概率。如果歧义消解算法选择具有最大PCFG概率的剖析,那么这个剖析便可以通过这样的歧义消解算法选择正确结果。


可以看出,选择具有最大概率的剖析是进行歧义消解的正确方法。现在,让我们把这样的直觉加以形式化。歧义消解算法在句子S的剖析树集合(我们称之为τ(S))中选择对于这个句子S的最佳的树作为剖析结果。我们想得到的是对于给定的句子S的最佳剖析树T。


12.7.png


根据定义,概率P(TIS)可以改写为P(T,S)/P(S),这样可以得出:


12.8.png


因为我们要最大限度地考虑同一个句子可能有的一切剖析树,所以对于每个树,P(S)将是一个常数,我们可以删除它,得到:


12.9.png


还有,由于我们曾经说明P (T, S)= P(T),所以选择最佳剖析的最后的等式巧妙地简化为选择具有最大概率的剖析:


12.10.png


PCFG的另一个特性是它可以给构成句子的单词符号串指派一个概率。在语音识别、拼写检查和增强通信中,这个特性对于语言建模(language modeling)有重要意义。非歧义句子的概率等于P(T,S)=P(T),或者说这个概率恰好是该句子的单个剖析树的概率。歧义句子的概率等于该句子所有剖析树的概率之和:


12.11.png


PCFG对语言建模的另一个有用特征是它可以给句子中的子符号串指派一个概率。例如,Jelinek and Lafferty(1991)提出了能够有效计算一个句子前面部分(prefix)的概率的算法。这个概率也就是语法生成句子的初始子符号串为w1,w2…wi,的概率。Stolcke(1995)说明了怎样把标准的Earley算法提升到能够计算这些句子前面部分的概率,Jurafsky et al.(1995)描写了采用这种算法作为语言模型在语音识别中的应用。

在一个PCFG中,如果一种语言的所有句子的概率之和为1,就可以说这个PCFG是坚固的(consistent)。有些递归规则会引起语法变得不坚固,因为这时它对某些句子要进行无限循环的推导。例如,概率为1的规则S→S将会导致概率量的丧失,因为推导永远不会终止。关于坚固语法和非坚固语法的详细情况,可以参阅Booth and Thompson(1973)。


责任编辑:admin


微信公众号

[上一页][1] [2] 【欢迎大家踊跃评论】
  • 上一篇:PCFG的概率CYK剖析
  • 下一篇:类型与继承的应用


  • 《译聚网》倡导尊重与保护知识产权。如发现本站文章存在版权问题,烦请30天内提供版权疑问、身份证明、版权证明、联系方式等发邮件至info@qiqee.net,我们将及时沟通与处理。


我来说两句
评论列表
已有 0 条评论(查看更多评论)