- 签证留学 |
- 笔译 |
- 口译
- 求职 |
- 日/韩语 |
- 德语
Hobbs算法并没有明确采用话语模型表示。Lappin和Leass算法中的确采用了话语模型,但是这种算法将显著性作为优先关系的加权组合。中心理论(Grosz et al,1995)(GJw)也明确采用了话语模型的表示,并引入了一个额外的主张:在话语中的任何给定点都有一个单独的实体被作为“中心”,该实体与被唤起的其他实体都有所不同。
在该话语模型中主要记录了两种表示。在以下的讲述中,以Un和Un+₁表示相邻的话段。话段Un的向后看中心(backward looking center),以Cb(Un)表示,代表在Un被解释后,话语中当前所关注的实体。话段Un的向前看中心(forward looking center),以Cf(Un)表示,形成一个包含Un中提及的实体的有序列表,列表中的所有实体都可以作为后面话段的Cb。实际上,Cb(Un+₁)被定义为Un+₁提及的列表Cf(Un)中级别最高的元素。话语中的首个话段的Cb是未定义的。至于Cf(Un)中实体排序的方式,出于简化的考虑,我们可以采用在Lappin和Leass算法中权重(的子集)所表示的语法角色层级,重述如下。
subject > existential predicate nominal > object >indirect object or oblique > demarcated adverbial PP
然而,与Lappin和Leass算法不同,对列表中的实体并没有附加一个权重值,仅仅是简单的相互之间的排序。作为简写,我们将最高级别的向前看中心称为C,即最优先的中心(preferred center)。
我们描述一个归功于Brennan et al.(1987)的基于中心的算法(今后称为BFP)。其他中心算法参见Walker et al.(1994);Kameyama(1986)和Strube and Hahn(1996)。在该算法中,代词的优先所指对象是通过相邻句子向前看中心和向后看中心之间的关系来计算的。话段对Un和Un+₁之间的句间关系是通过Cb(Un+₁),Cb(Un)和Cp(Un+₁)之间的关系来定义的,如图1所示。
图1 BFP算法中的转换
算法所用的规则如下:
● 规则1:如果Cf(Un)中的所有元素都是由话段Un+₁中的代词构成的,则Cb(Un+₁)也必须是一个代词。
● 规则2:转换状态是有优先顺序的。继续(Continue)优先于保持(Retain),保持优先于平滑转移(Smooth-Shift),平滑转移优先于粗糙转移(Rough-Shift)。
在定义了这些概念和规则以后,下面是算法的定义:
1. 为每个所指对象指派的可能集生成可能的Cb-Cf组合。
2. 通过约束,例如句法同指约束、选择限制、中心规则和约束等来过滤。
3. 通过转换的顺序给出排序。
如果没有违反规则1和其他的同指约束(性、数、句法、选择约束),那么获得指派的代词的所指对象是那些在规则2中产生最优先关系的所指对象。
让我们以例句(1)为例,重新编号为下面的例句(2),以说明算法的处理过程。
John saw a beautiful Acura Integra at the dealership. (U₁) (2)
He showed it to Bob. (U₂)
He bought it. (U₃)