- 签证留学 |
- 笔译 |
- 口译
- 求职 |
- 日/韩语 |
- 德语
一个特定的剖析T的概率定义为在该剖析树中用来展开每个结点n的所有规则r的概率的乘积:
作为结果的概率P(T,S)既是剖析和句子的联合概率,又是剖析P(T) 的概率。怎样证实这个公式的正确性呢?
首先,根据联合概率的定义有:
P(T,S) = P(T) P(SIT) (12.3)
但是,因为剖析包含了句子中的所有单词,所以P(SIT)等于1。因此有:
P(T,S) = P(T)P(S|T) = P(T) (12.4)
图2中的每个剖析树的概率的计算,只要把在推导中使用的每个规则概率相乘就可以得到计算结果。侧如,图12.2(a)中左侧的剖析树(称为T)的概率以及图12.2(b)中右侧的剖析树(称为T,)的概率可以计算如下:
我们可以看出,在图12.2(b)中右侧的剖析树具有比较高的概率。如果歧义消解算法选择具有最大PCFG概率的剖析,那么这个剖析便可以通过这样的歧义消解算法选择正确结果。
可以看出,选择具有最大概率的剖析是进行歧义消解的正确方法。现在,让我们把这样的直觉加以形式化。歧义消解算法在句子S的剖析树集合(我们称之为τ(S))中选择对于这个句子S的最佳的树作为剖析结果。我们想得到的是对于给定的句子S的最佳剖析树T。
根据定义,概率P(TIS)可以改写为P(T,S)/P(S),这样可以得出:
因为我们要最大限度地考虑同一个句子可能有的一切剖析树,所以对于每个树,P(S)将是一个常数,我们可以删除它,得到:
还有,由于我们曾经说明P (T, S)= P(T),所以选择最佳剖析的最后的等式巧妙地简化为选择具有最大概率的剖析:
PCFG的另一个特性是它可以给构成句子的单词符号串指派一个概率。在语音识别、拼写检查和增强通信中,这个特性对于语言建模(language modeling)有重要意义。非歧义句子的概率等于P(T,S)=P(T),或者说这个概率恰好是该句子的单个剖析树的概率。歧义句子的概率等于该句子所有剖析树的概率之和:
PCFG对语言建模的另一个有用特征是它可以给句子中的子符号串指派一个概率。例如,Jelinek and Lafferty(1991)提出了能够有效计算一个句子前面部分(prefix)的概率的算法。这个概率也就是语法生成句子的初始子符号串为w1,w2…wi,的概率。Stolcke(1995)说明了怎样把标准的Earley算法提升到能够计算这些句子前面部分的概率,Jurafsky et al.(1995)描写了采用这种算法作为语言模型在语音识别中的应用。
在一个PCFG中,如果一种语言的所有句子的概率之和为1,就可以说这个PCFG是坚固的(consistent)。有些递归规则会引起语法变得不坚固,因为这时它对某些句子要进行无限循环的推导。例如,概率为1的规则S→S将会导致概率量的丧失,因为推导永远不会终止。关于坚固语法和非坚固语法的详细情况,可以参阅Booth and Thompson(1973)。
责任编辑:admin