- 签证留学 |
- 笔译 |
- 口译
- 求职 |
- 日/韩语 |
- 德语
歧义处理的复杂性,不仅在于歧义字段本身的多样性,还在于歧义字段的影响范围和消除歧义所需的知识的多样性。根据歧义字段的影响范围,可把歧义字段分为三种,即词汇级歧义、句子级歧义和语境级歧义。
1. 词汇级歧义
一个歧义字段,虽然可能有两种切分方式,但其中的一种切分形式在一般条件下是不会出现的。部分交集型歧义字段属于这种情况。例如:“太平淡”只能切分为“太 平淡”,“天下午”只能切分为“天 下午”(昨天下午他来了)。
2. 句子级歧义
一个歧义字段,在不同的句子中有不同的切分方式,但在具体的句子中只有一种切分形式是正确的。大多数多义组合歧义字段和部分交集型歧义字段属于这种情况。例如:
“马上”:他从马上下来;他马上就到。
“将来”:他将来上海;将来他要到上海工作。
“日本报”:1月20日本报刊出了一条消息;日本报刊出了一条消息。
3. 语境级歧义
一个歧义字段,在相同的句子中也可有不同的切分方式,具体选择何种切分方式必须根据上下文才能确定。这种最复杂的情况,包括少数多义组合歧义字段和交集型歧义字段。例如:
“学生会”:学生会写文章。
“乒乓球拍卖”:乒乓球拍卖完了。
由此可见,解决歧义切分问题,需要多方面的知识,包括词汇信息、句法信息、语义信息和上下文信息。事实上,即使是词汇级的歧义现象,往往也必须用上句法信息,甚至语义信息才能消除。例如:“白天鹅”的错误切分形式“白天 鹅”,作为名词和名词的组合,也能构成一个合乎语法规则的名词性词组,只有使用语义限制条件,才能判断为错误形式。至于更复杂的歧义现象,还需要更多的信息。
责任编辑:admin