会员中心 |  会员注册  |  兼职信息发布    浏览手机版!    精选9.9元!    人工翻译    英语IT服务 贫困儿童资助 | 留言板 | 设为首页 | 加入收藏  繁體中文
当前位置:首页 > 机翻技术 > 机器翻译 > 正文

计算复杂性和人的语言处理

发布时间: 2022-08-05 09:29:36   作者:etogether.net   来源: 网络   浏览次数:


我们能不能在解释这些嵌套结构的困难时,只说因为它们不合英语的语法呢?答案似乎是否定的。在例句(13.5ii)至例句(13.8ii)中的复杂句子所用的结构与在例句(13.5i)至例句(13.8i)中的比较容易的句子所用的结构是相同的。容易句子和复杂句子之间的差别似乎是根据嵌套的数目来调节的。然而,我们无法在语法中规定只允许N个嵌套而不允许N+1个嵌套。


进一步说,这些句子的复杂性看起来是一种语言处理中的现象;关于人的剖析机制的某些事实不能处理这种多重嵌套的现象。如果复杂性是一种“剖析”中的事实,而不是语法中的事实,那么,由于同样的原因,我们就可以期望在其他语言中的句子也具有这样的复杂性。这就是说,尽管其他语言有着不同的语法,但我们可以假定,人的剖析的体系结构是各种语言共享的,从一种语言到另一种语言是相同的。


这种类型的多重嵌套结构在其他语言中看起来也存在,而且处理起来同样很困难。例如,日语中允许一个简单的嵌套从句,再增加嵌套就会使句子变得难以处理(Cowper, 1976; Babyonyshev and Gibson, 1999)。


13.9.png


13.10.png


13.11.png


对于这些复杂性效应,已经提出了一些解释,其中很多是根据记忆来解释的。这种解释所依赖的直觉是:每个嵌套都要求一些记忆资源来存储。多层嵌套的句子或者要使用很多记忆资源,或者要形成多重的记忆跟踪,从而造成了不同记忆之间的混淆。其结果就使得这样的句子处理起来非常困难。


例如,Yngve(1960)提出,人的剖析是基于一个容量有限的栈(stack)进行的。这种基于栈的剖析把不完全的短语结构规则存储到栈中;如果多重的不完全短语在这个栈中嵌套起来,那么栈就要对每个不完全的规则进行登录。Yngve认为,这种不完全的短语结构规则越多,人的剖析器就需要把它们存储到栈中,因此句子也就越复杂。根据Yngve的直觉,这种栈的有限性意味着英语事实上是正则语言,而不是上下文无关语言,其原因在于:如果上下文无关语法的栈的容量是有限的,那么,它就可以用有限自动机来模拟。


作为这种模型的一种扩充,(Miller and Chomsky,1963)提出,自嵌入结构(self-embedded)是特别困难的。在自嵌入结构中,一个句法范畴A被嵌入到另一个A中,而周围被其他单词包围(X和Y):


3.png


这样的结构处理起来会非常困难,因为基于栈的剖析可能会把栈中规则的两个副本混淆起来。自嵌入的问题可以自然地用基于激活(activation-based)的模型来模拟,这种模型对于一个特定的规则只有一个副本。



微信公众号

[上一页][1] [2] [3] [下一页] 【欢迎大家踊跃评论】
我来说两句
评分: 1分 2分 3分 4分 5分
评论内容:
验证码:
【网友评论仅供其表达个人看法,并不表明本站同意其观点或证实其描述。】
评论列表
已有 0 条评论(查看更多评论)