返回

机翻技术

搜索 导航
超值满减
定义局部篇章上下文和篇章实体
2023-07-03 09:26:46    etogether.net    网络    


首先,我们分析局部上下文,包括先前句子的句法和语义结构,以及句子涉及的一些对象,这些对象可以是后来的代词和其他定指性名词短语的先行词。对于很多情况来说,局部上下文是很有帮助的。如,下面的句子可能包含代词的先行词:


1a. Jacki lost his walletj in his car.(Jack把钱包忘在汽车里了。)

1b. Hei looked for itj for several hours.(他找了它几个小时。)


另外,在下面的例子中,局部上下文定义了这样的结构,这些结构对解释采用动词短语省略的句子是非常有用的:

2a. Jack forgot his wallet.(Jack 忘了带钱包。)

2b. Sam did too.(Sam 也是。)


这些动词短语省略一般用来指上一个句子所描述的事件,如:

3a. Jack forgot his wallet.(Jack 忘了带钱包。)

3b. He looked for someone to borrow money from.(他找人借钱。)

3c. Sam did too.(Sam也是。)


在这个篇章中,句子3c不是指Sam忘记带钱包。


但是由于连词的存在,利用句子作为局部上下文的基本单元存在一些问题。比如,可以修改篇章3以便使句子3a和句子3b结合为一个句子,但是这并没有改变可能的解释:


4a. Jack forgot his wallet,so he looked for someone to borrow money from.

(Jack忘了带钱包,所以他找人借钱。)

4b. Sam did too.(Sam也是。)


很难把句子4b解释为Sam忘记了带钱包。与其相对,一个包含连词的句子支持两个并列成分之间的VP省略,比如:


5. Jack forgot his wallet,and Sam did too.(Jack忘了带钱包,Sam也是。)


一种更复杂的情况是,下面的例子涉及两个动词短语的并列。在这种情况下,由连词所连接的两个并列成分就可以作为一个整体,构成支持省略的上下文,比如:

6a. Jack forgot his wallet and lost his credit cards.(Jack忘记带钱包并且丢了信用卡。)

6b. Sam did too.(Sam 也是。)


这种情况下,句子6b是指Sam也忘记带钱包并且丢了信用卡。


基于上面的例子,一种很自然的想法是局部上下文来自于前面的主要子句而不是前面的那个句子。例如,因为连词“and”能够连接主要子句,所以句子5可以解释为,前面第一个连词为后面的句子提供了局部上下文。VP连词出现在惟一的主要子句中,所以6b的局部上下文是句子6a中的所有信息。从属子句作为主要子句的一部分,不能创建新的局部上下文,如下面的例子:


7a. Jack forgot his wallet when he went out to the movies.

7b. Sam did too.


句子7b可以解释为Sam丢了钱包(或当他去看电影时丢了钱包),但并不是说他去看电影。


局部上下文的一个很重要的方面是代词的可能先行词的列表,我们称之为篇章实体(DE,discourse entity)列表。篇章实体列表是定义在知识库中的常数的集合,这一集合表示最近的主要子句中涉及的,并且可以被下文中的代词所指代的对象。有时候,前面的句子并没有明确涉及一个篇章实体,只是隐含地介绍。考虑到这样的情况,我们将常常讨论一个句子所引发的对象,这里所指的对象包括明确提及的和隐含提及的。在后面的章节中,将讨论这两种情况。


当我们说一个代词有某一先行词时,实际上意味着这个代词和先行词是指同一个对象。值得注意的是,这个代词及其先行词可以指同一个对象X,即使说话者和听者双方都没有认定X为一个具体的对象。简单说来就是二者指同一个对象,但不关心具体对象是什么。考虑下面的篇章片段:


8a. John bought a cari yesterday.(John 昨天买了一辆车。)

8b. Iti was very expensive.(它很贵。)




[1] [2] [下一页] 【欢迎大家踊跃评论】

上一篇:一个基于历史记录列表的简单回指模型
下一篇:综合的知识表示方法

微信公众号搜索“译员”关注我们,每天为您推送翻译理论和技巧,外语学习及翻译招聘信息。

  相关机器翻译技术文章




PC版首页 -关于我们 -联系我们