会员中心 |  会员注册  |  兼职信息发布    浏览手机版!    超值满减    人工翻译    英语IT服务 贫困儿童资助 | 留言板 | 设为首页 | 加入收藏  繁體中文
当前位置:首页 > 机翻技术 > 机器翻译 > 正文

上下文无关规则和树——模拟语言成分结构

发布时间: 2022-07-22 09:25:22   作者:etogether.net   来源: 网络   浏览次数:


在PP内,NP不一定总是表示方位的。PP也经常用来表示时间和日期。PP中还可以使用其他非常复杂的名词。下面给出了ATIS语料库中的10个例子:


to Seattle                      on these flights

in Minneapolis              about the ground transportation in Chicago

on Wednesday              of the round trip flight on United Airlines

in the evening              of the AP fifty seven flight

on the ninth of July      with a stopover in Nashville


图2给出了词表的一个样本,图9.3总结了我们前面研究过的规则。我们把这个语法称为Lo。


注意,我们可以使用表示或者的符号“|”来表示非终极符号的不同展开方式。


我们可以使用这个语法来生成ATIS中的句子。从S开始,把它展开为NP VP,然后随机地展开NP(例如,把NP展开为I),随机地展开VP(例如,把VP展开为Verb NP),一直到生成符号串I prefer a morning flight为止。图9.4是一个剖析树,表示句子I prefer a morning flight的整个推

导过程。


2.png



3.png



4.png



有时用更简洁的形式来表示剖析树会更方便,这种简洁形式称为“括号表示”(bracketed notation),这种表示法实质上是树的LISP表示法。图4中的剖析树的括号表示如下:


[s [Np [Pro I]] [vp [v prefer][NP [Det a] [Nom [N morning [Nom [N flight]]]]]



一个诸如L0的CFG定义了一个形式语言,其是符号串的集合。如果由一个语法推导出的句子处于由该语法定义的形式语言中,这个句子就是合语法的(grammatical)。如果不能被某一给定的形式语法推导出的句子不处于由该语法定义的形式语言中,这个句子就是不合语法的(ungrammatical)。对于所有的形式语言的句子来说,要描述它们是处于形式语言“之内”或是“之外”,其界限是很难划分清楚的,但形式语法还是描述自然语言实际工作情况的一种最简单的模型。在语言学中,使用形式语言来模拟自然语言的语法称为“生成语法”(generative grammar),因为语言是通过由语法“生成”的一切可能的句子的集合来确定的。


一个上下文无关语法有四个参数 [在技术上称为“四元组”(4-tuple)]:


1. 非终极符号的集合(或者“变量”)N

2. 终极符号的集合Σ(与N不相交)

3. 生成式的集合P,每个生成式的形式为A→a,其中A是非终极符号,a是由符号串的无限集(ΣUN)*中的符号构成的符号串

4. 一个指定的初始符号S


语言通过推导的概念来定义。如果通过一系列的规则应用,一个符号串可以被重写为另一个符号串,我们就说这个符号串推导出另一个符号串。根据Hopcroft and Ullman(1979),可以更加形式地说,如果A→β是P中的一个产生式,a和y是(ΣUN)*中任意的符号串,我们就说aAγ直接推导出aβγ,或者aAy⇒aβγ。推导可以由直接推导概括出来。设a1,a2,a3…,am是(ΣUN)*中的符号串,m≥1,使得


 9.8.png


则a,推导出am,或者式1.png

这样,我们可以把由语法G生成的语言LG形式地定义为由指定的初始符号S推导出的终极符号构成的符号串的集合。


9.9.png



把单词的符号串映射到剖析树的问题称为“剖析”(parse)。



责任编辑:admin


微信公众号

[上一页][1] [2] 【欢迎大家踊跃评论】
  • 上一篇:FSA剖析就是搜索
  • 下一篇:英语语言的熵


  • 《译聚网》倡导尊重与保护知识产权。如发现本站文章存在版权问题,烦请30天内提供版权疑问、身份证明、版权证明、联系方式等发邮件至info@qiqee.net,我们将及时沟通与处理。


我来说两句
评论列表
已有 0 条评论(查看更多评论)