要提出一种语义学和语义解释理论,首先需要提出一种结构模型,就像我们在研究句法时做的那样。对句法,我们首先引入了基本句法类的概念,然后提出一些方法用以解决将简单的类合并形成更大的结构的问题。对于语义,将遵循同样的策略。读者也许会认为基本语义单元是词或词素,但这样做将因为歧义的存在而面临太多的困难。例如,一部典型的词典中,动词“go”有40个以上的词条并不鲜见。其中,每个词条对应于这个词的一个不同意义。词典对于特定词义常常给出其同义词。对于“go”,可以找到多种同义词,例如“ move”,“depart”,“pass”,“vanish”,“reach”,“extend”和“set out”。其中,很多词都标识出动词“go”的不同意义。当然,如果这些词真是“go”的某个意义的同义词,那么这些动词本身也拥有同样的意义。例如,“go”的一个意义就和“depart”的一个意义相同。
如果每个词都有一个或多个意义,那么即便有些词的意义相同,你还是会面临非常多的意义选择。幸运的是,这些意义可以组织到不同的类别集合里,而依据这些类我们将对整个客观世界进行划分。这一组对象类经过形式化表示之后称为本体(ontology)。为了处理自然语言,我们需要比形式逻辑著作中常见的定义更宽泛的本体。对象的分类长期以来就是一件吸引众多人关注的工作,早在亚里士多德(公元前384~前322)的著作中就已经提到了相关内容。亚里士多德提出的几大类包括物质(实体)、数量(例如数字)、性质(例如鲜红色)、关系、地点、时间、位置、状态、行为和影响。对这个列表,还可以添加一些其他的类,比如事件、思想、概念和计划。其中,最重要的两个类是行为和事件。事件是在客观世界中发生的事情,它在很多语义理论中都很重要,因为它提供一种结构,可以把句子的解释组织起来。行为是行为主体所做的事情,会引发某个事件。就像本体中的所有对象一样,行为和事件都可由代词指代,例如以下篇章片段:
We lifted the box. It was hard work.(我们抬起了箱子。这是一项艰巨的工作。)
这里,代词“it”指抬箱子这个行为(“lifting the box”)。情境是另一个很重要的类。正如前面所指出的那样,情境指某些情况的特定集合,可以认为它包含了事件的概念。在很多情况下,情境就像是某个地点某个时间的客观世界的缩影。例如,句子“We laughed and sang at the football game”(我们在足球赛时又笑又唱)描述在特定时间和特定地点发生的一组活动,可以用“the football game”这个情境加以描述。
毫无疑问,歧义在语义解释阶段依然是很严重的问题。如果一个词映射为一个以上的意义,我们就称这个词有语义歧义(semantically ambiguous)。但是这个问题比乍看上去要复杂,因为需要一种方法来判断哪些才是可用的意义。例如,直观上“kid”这个词是有歧义的,它既可以指小山羊,也可以指儿童。但我们又怎么知道它没有一个意义能同时包含这两种解释?另一方面,虽然我们知道马(horse)实际上可以分为母马(mave)、马驹(colt)、赛马(trotter),等等,但“horse”这个词却似乎没有歧义。那为何每次用这个词而我们又不能分辨它指的是母马还是马驹的时候,它仍然不算有歧义呢?为了使语义歧义的定义更准确,人们曾经进行了一些语言学测试。其中一个较为成功的测试利用了一个性质,即特定的句法结构通常指的是同一个对象类。例如,句子“I have two kids and George has three”可能是说我和乔治都是放养山羊的农夫,也可能是说我们都有孩子,但不可能是两者的组合(我养山羊而乔治有孩子)。另一方面,即便我有的是马驹而乔治有的是母马,你也可以说“I have one horse and George has two”(我有一匹马,而乔治有两匹)。因此,这个测试提供了一个方法来检测我们对词义的直观知识。词“kid”是有歧义的,因为它有两个意义,BABY-GOAT1和BABY-HUMAN1;而“horse”是没有歧义的,虽然它也同时有MARE1和COLT1等意义。相反,它的一个意义HORSE1同时包含这两个意义。这说明了很重要的一点,即某些意义更为明确。这种性质常常称为“模糊性”(vagueness)。
HORSE1这个意义在某种程度上是模糊的,因为它没有区分母马和马驹。当然,如果考虑到MARE1这个意义没有指明是大母马还是小母马,那它也是模糊的。事实上,所有的意义都有一定程度的模糊性,因为它们总是可以表达得更为明确。