会员中心 |  会员注册  |  兼职信息发布    浏览手机版!    精选9.9元!    人工翻译    英语IT服务 贫困儿童资助 | 留言板 | 设为首页 | 加入收藏  繁體中文
当前位置:首页 > 机翻技术 > 识别技术 > 正文

切分歧义处理知识

发布时间: 2022-12-14 09:15:27   作者:etogether.net   来源: 网络   浏览次数:
摘要: 根据歧义字段的影响范围,可把歧义字段分为三种,即词汇级歧义、句子级歧义和语境级歧义。


歧义处理的复杂性,不仅在于歧义字段本身的多样性,还在于歧义字段的影响范围和消除歧义所需的知识的多样性。根据歧义字段的影响范围,可把歧义字段分为三种,即词汇级歧义、句子级歧义和语境级歧义。


1. 词汇级歧义

一个歧义字段,虽然可能有两种切分方式,但其中的一种切分形式在一般条件下是不会出现的。部分交集型歧义字段属于这种情况。例如:“太平淡”只能切分为“太  平淡”,“天下午”只能切分为“天  下午”(昨天下午他来了)。


2. 句子级歧义

一个歧义字段,在不同的句子中有不同的切分方式,但在具体的句子中只有一种切分形式是正确的。大多数多义组合歧义字段和部分交集型歧义字段属于这种情况。例如:

“马上”:他从马上下来;他马上就到。

“将来”:他将来上海;将来他要到上海工作。

“日本报”:1月20日本报刊出了一条消息;日本报刊出了一条消息。


3. 语境级歧义

一个歧义字段,在相同的句子中也可有不同的切分方式,具体选择何种切分方式必须根据上下文才能确定。这种最复杂的情况,包括少数多义组合歧义字段和交集型歧义字段。例如:


“学生会”:学生会写文章。

“乒乓球拍卖”:乒乓球拍卖完了。


由此可见,解决歧义切分问题,需要多方面的知识,包括词汇信息、句法信息、语义信息和上下文信息。事实上,即使是词汇级的歧义现象,往往也必须用上句法信息,甚至语义信息才能消除。例如:“白天鹅”的错误切分形式“白天  鹅”,作为名词和名词的组合,也能构成一个合乎语法规则的名词性词组,只有使用语义限制条件,才能判断为错误形式。至于更复杂的歧义现象,还需要更多的信息。


责任编辑:admin


微信公众号

  • 上一篇:复旦分词系统介绍
  • 下一篇:机械分词方法


  • 《译聚网》倡导尊重与保护知识产权。如发现本站文章存在版权问题,烦请30天内提供版权疑问、身份证明、版权证明、联系方式等发邮件至info@qiqee.net,我们将及时沟通与处理。


我来说两句
评分: 1分 2分 3分 4分 5分
评论内容:
验证码:
【网友评论仅供其表达个人看法,并不表明本站同意其观点或证实其描述。】
评论列表
已有 0 条评论(查看更多评论)