返回

机翻技术

搜索 导航
超值满减
如何确定话语结构
2022-09-01 09:25:37    etogether.net    网络    



然后,我们引入公理(18.105),它表明如果在两个较小的片断之间能够确立连贯关系,那么它们就可以组成一个较大的片断。


18.105.png


注意,将公理扩展用于较长的话语时,需要对CoherenceRel(e)谓词增加第三个论元。该变量的值是e,和e所表达的信息的组合,它代表结果片断的主要声明。这里将假定从属关系(subordinating relation)(例如,说明)只与一个变量有关(在本例中指第一个句子,即结果),而并列关系(coordinating

relation)(例如,平行和时机)与两个变量的组合有关。在图18.10中,这些变量出现在每个关系旁边的括号里。


现在来解释一段连贯的文本W,就像例句(18.106)所表达的,我们必须简单地证明该文本是片断。


18.106.png


对于一个话语,这些规则将导出任何可能的二元分支的片断结构,只要该结构能够被片断之间连贯关系的确立所支持。在此,句子句法结构和话语结构的计算之间有一个区别。通常句子层的语法是很复杂的,牵扯到许多关于不同成分(名词短语、动词短语等)怎样才能彼此修饰以及以何种次序修饰的句法事实。与之相反,上面所提的“话语语法”就简单得多,仅牵扯两个规则:一个片断可以改写为两个较小的片断,以及一个句子就是一个片断。实际指派那个可能的结构依赖于如何确立该段落的连贯。


为什么要计算话语结构呢?因为不少应用都可以从中获益。例如,利用话语结构,摘要系统可以只选择话语中的中心句,而摒除次要的信息。当应用于例句(18.103)时,生成简单摘要的系统可能只会选择句子S1和S2,因为事件表示被传往顶层结点。生成更详细摘要的系统也可能会包括句子S3和S5。类似地,信息检索系统也可能对位于话语结构高层部分的句子所带有的信息给予比其他信息更大的权重,生成系统也需要话语结构知识,以生成连贯话语。


话语结构对于自然语言的子任务也是十分有用的,例如代词判定。代词表现出一种称为新近的优先关系,也就是它们更倾向于指向附近的所指对象。现在我们对新近有两种可能的定义:按照话语线性顺序的新近,或者根据话语层级结构的新近。实际上后一种定义已经被认为是正确的,尽管不可否认在所有例子中该事实并不都是完全清楚的。


责任编辑:admin



[上一页][1] [2] 【欢迎大家踊跃评论】

上一篇:语言生成导引
下一篇:基于推理的判定算法

微信公众号搜索“译员”关注我们,每天为您推送翻译理论和技巧,外语学习及翻译招聘信息。

  相关机器翻译技术文章




PC版首页 -关于我们 -联系我们