返回

机翻技术

搜索 导航
超值满减
最佳优先句法分析
2023-04-30 10:09:06    etogether.net    网络    


尽管最佳优先句法分析器并不考虑每个可能的语法成分,但是它仍然可以保证找到概率最大的解释。为了进一步说明,可以假定句法分析器找到了一个概率为pl的解释S1。在这里,概率得分的重要性质是一个成分的概率总是小于(或者等于)其任意子成分的概率。如果

还存在一个得分为p2的解释S2,并且p2比p1大,那么,构成它的所有子成分概率将为p2或者更高。这意味着在S1加入之前,所有的这些子成分都已经加人了chart图中。这也意味着构建S2的边是完整的,因此,S2会在待处理表中。既然S2的得分比S1高,那么句法分析器会优先考虑S2。


图2.png


尽管最佳优先句法分析的思想在概念上很简单,但是,在实践中试图应用这项技术时,仍然存在很多问题。其中一个问题就是如果使用乘积来综合计算得分,那么,随着输入越来越多,对成分的评分会迅速下降。这看起来好像没有问题,但是在实践中,如果语法巨大,则概率下降会非常快。因此,这里的搜索会非常类似于广度优先搜索,即首先生成所有长度为1的成分,然后生成所有长度为2的成分,依次类推。因此,快速找到最好结果的期望就无法实现了。为了处理这个问题,有些系统采用了一些不同的函数来计算语法成分的评分。比如,可以采用任意子成分概率与规则使用概率的最小值,即:


Score(C) = MIN(Score(C → C1,.…, Cn), Score(C1), …, Score(Cn))


这可以得到高于(或者等于)第一个方法的得分。但是,如果存在某个单一的子成分,其得分排名非常糟糕,那么,无论所有其他成分的得分排名如何,任何一个包含它的成分都会被排除。遗憾的是,在同前面一样的84个句子上进行测试时,使用MIN函数会导致准确率下降很多。其准确率只有39%,这比原始的搜索方法还要差一点。不过,其他一些研究者认为,这个方法在实践中性能要更好一些。或许也可以尝试其他的综合评分方法,比如取所有子成分的平均得分。


责任编辑:admin



[上一页][1] [2] 【欢迎大家踊跃评论】

上一篇:简单的上下文相关最佳优先句法分析器
下一篇:浅层句法分析

微信公众号搜索“译员”关注我们,每天为您推送翻译理论和技巧,外语学习及翻译招聘信息。

  相关机器翻译技术文章




PC版首页 -关于我们 -联系我们