- 签证留学 |
- 笔译 |
- 口译
- 求职 |
- 日/韩语 |
- 德语
概念词典是自然语言处理所需的另一个重要的知识源。一方面,句法分析和语义分析阶段需要概念词典提供语义信息和映射规则;另一方面,概念词典还能独立地提供概念层次信息,依据层次信息来判断两个词之间的概念一致性。
概念词典的基本单位是概念。所谓概念被认为是一些相近实例的聚集,它必须能够表达这些实例的公共特征【2.5】。一般说来,概念包括以下三种信息:
(1) 上层概念(概括性)。
(2) 下层概念(专门性)。
(3) 所有实例的公共特征或限制(选择性限制)。
其中,(1)、(2)是结构方面的信息;(3)是语义方面的信息,所谓的选择性限制是指不同概念之间的语义依赖关系【2.6】。按照内容的不同,可以把概念分成三类:对象类概念(Object)、事件类概念(Event)和特征类概念(Property)。对象类概念表明事件类概念的执行者、对象、处所、方位等,包括人、具体事物、抽象事物,以及时间和空间。事件类概念表明对象的动作、精神活动、活动、状态和对象之间的联系。特征类概念用以表明对象类概念和事件类概念的特征与性质。
不同种类概念的选择性限制也各不相同。其中,对象类概念的选择性限制主要是语义特征,一共分成四类:
(1)Constitute —— 构成,例如:重量,材料,部件,等等;
(2)Form —— 形态,例如:尺寸,形状,颜色,位置,等等;
(3)Telic —— 功能,例如:作用,目标,等等;
(4)Agentive —— 施事,例如:创建者,人造物,天然物,等等。
事件类概念的主要限制是格角色关系和结构映射规则。格角色是对象类概念和事件类概念之间的相互关系。格角色关系一共有二十多种【2.7】,其中较常用的如下:
(1)Agentive —— 施事格,表示由动词所确定的动作能觉察到的,有生命的动作发生者。
(2)Instrumental ——工具格,表示对动词确定的动作或状态而言,作为某种辅助因素而牵涉到的,无生命的力量或客体。
(3)Dative —— 与格,表示由动词确定的动作或状态所影响的有生物。
(4) Neutral —— 中性格,表示由动词确定的动作或状态所形成的客体或有生物,或者做为动词意义一部分的客体或有生物。
(5)Locative —— 处所格,表示由动词确定的动作或状态的处所或空间方向。
事件类概念的格角色分为三类:必选格、任选格和禁选格。例如,概念*hit(击打),有三个主要的格,其中,中性格为必选格,工具格和施事格为任选格。
特征类概念包含两种语义信息:Domain(定义域)和Range(值域)。Domain表示这个特征类概念所能修饰的对象类或事件类概念。Range表示这个特征所能取的值。
框架(Frame)结构是概念的一种常用表示形式【2.5】。所谓框架,是由槽(Slot)、侧面(Facet)、视点(view)和填充值(Filier)组成的抽象数据结构。每个框架可包含任意数量的槽;每个槽可包含任意数量的侧面;每个侧面可包含任意数量的视点:每个视点可包含任意数量的填充值。框架结构的形式如下【2.8】【2.9】:
(框架(槽(侧面(视点 填充值*)*)*)*)。