- 签证留学 |
- 笔译 |
- 口译
- 求职 |
- 日/韩语 |
- 德语
在PP内,NP不一定总是表示方位的。PP也经常用来表示时间和日期。PP中还可以使用其他非常复杂的名词。下面给出了ATIS语料库中的10个例子:
to Seattle on these flights
in Minneapolis about the ground transportation in Chicago
on Wednesday of the round trip flight on United Airlines
in the evening of the AP fifty seven flight
on the ninth of July with a stopover in Nashville
图2给出了词表的一个样本,图9.3总结了我们前面研究过的规则。我们把这个语法称为Lo。
注意,我们可以使用表示或者的符号“|”来表示非终极符号的不同展开方式。
我们可以使用这个语法来生成ATIS中的句子。从S开始,把它展开为NP VP,然后随机地展开NP(例如,把NP展开为I),随机地展开VP(例如,把VP展开为Verb NP),一直到生成符号串I prefer a morning flight为止。图9.4是一个剖析树,表示句子I prefer a morning flight的整个推
导过程。
有时用更简洁的形式来表示剖析树会更方便,这种简洁形式称为“括号表示”(bracketed notation),这种表示法实质上是树的LISP表示法。图4中的剖析树的括号表示如下:
[s [Np [Pro I]] [vp [v prefer][NP [Det a] [Nom [N morning [Nom [N flight]]]]]
一个诸如L0的CFG定义了一个形式语言,其是符号串的集合。如果由一个语法推导出的句子处于由该语法定义的形式语言中,这个句子就是合语法的(grammatical)。如果不能被某一给定的形式语法推导出的句子不处于由该语法定义的形式语言中,这个句子就是不合语法的(ungrammatical)。对于所有的形式语言的句子来说,要描述它们是处于形式语言“之内”或是“之外”,其界限是很难划分清楚的,但形式语法还是描述自然语言实际工作情况的一种最简单的模型。在语言学中,使用形式语言来模拟自然语言的语法称为“生成语法”(generative grammar),因为语言是通过由语法“生成”的一切可能的句子的集合来确定的。
一个上下文无关语法有四个参数 [在技术上称为“四元组”(4-tuple)]:
1. 非终极符号的集合(或者“变量”)N
2. 终极符号的集合Σ(与N不相交)
3. 生成式的集合P,每个生成式的形式为A→a,其中A是非终极符号,a是由符号串的无限集(ΣUN)*中的符号构成的符号串
4. 一个指定的初始符号S
语言通过推导的概念来定义。如果通过一系列的规则应用,一个符号串可以被重写为另一个符号串,我们就说这个符号串推导出另一个符号串。根据Hopcroft and Ullman(1979),可以更加形式地说,如果A→β是P中的一个产生式,a和y是(ΣUN)*中任意的符号串,我们就说aAγ直接推导出aβγ,或者aAy⇒aβγ。推导可以由直接推导概括出来。设a1,a2,a3…,am是(ΣUN)*中的符号串,m≥1,使得
则a,推导出am,或者。
这样,我们可以把由语法G生成的语言LG形式地定义为由指定的初始符号S推导出的终极符号构成的符号串的集合。
把单词的符号串映射到剖析树的问题称为“剖析”(parse)。
责任编辑:admin