会员中心 |  会员注册  |  兼职信息发布    浏览手机版!    超值满减    人工翻译    英语IT服务 贫困儿童资助 | 留言板 | 设为首页 | 加入收藏  繁體中文
当前位置:首页 > 机翻技术 > 机器翻译 > 正文

语言生成导引

发布时间: 2022-09-02 09:21:00   作者:etogether.net   来源: 网络   浏览次数:
摘要: 在实现这个映射时,生成采用的许多语言学问题,但方向相反,使得它的方法与NLU的那些方法有两个重要的不同。


自然语言生成(Natural Language Generation,简称NLG)是指从非语言输入构造自然语言输出的处理。该处理的目的可以看成与自然语言理解(Natural Language Understanding,简称NLU)的目的相反,NLG是从意义到文本的映射,而NLU是从文本到意义的映射。在实现这个映射时,生成采用的许多语言学问题,但方向相反,使得它的方法与NLU的那些方法有两个重要的不同。


首先,用于生成处理的输入的性质根据应用的不同会有很大变化。尽管用于NLU系统的语言学输入可能会因文本类型的不同而有所变化,但是所有这些文本都是在一种相对统一的语法规则支配下的。生成系统则不是这样。每个生成系统面对的是带有不同输入规范的不同应用。一个系统可能是数值表的复杂集的解释,而其他系统可能是用面向对象的软件工程模型的结构组成的。因此,生成系统必须能够抽取驱动生成处理所需的信息。


其次,尽管NLU和NLG都必须能够表示一系列应用领域所需的词汇和语法形式,但是它们对这些表示的使用方式是不同的。NLU以假设管理(hypothesis management)处理为特征,在语言学输入被顺序扫描的同时,系统考虑可供选择的解释。在NLU中最受关注的是歧义的、不确定的以及非良构输入,而这些不是生成研究所关注的,因为它们通常并不出现。NLG系统的非语言学的表示输入往往是较少歧义的、指定的和良构的输入。相反,在NLG中最为关注的是选择(choice)。生成系统必须做出下面的选择:


● 内容选择

基于特定交际目的的系统决策,系统必须从完全指定的可能输入中选择正确的内容。例如,我们注意到例句(1)包括的一些内容并不适合于所有读者。如果目的是表明该环境已建立,而读者是一名软件工程师,则我们可能只选用最后一个句子来表达。


Congratulations, you've just compiled and run a simple C program (1)

which means that your environment is configured properly.


● 词汇选择

系统必须选择能最恰当地表达特定概念的词汇项。例如,在例句(1)中,必须在单词configured和其他可能形式(包括set up)之间进行选择。


● 句子结构

-集结

系统必须将选择的内容分配给短语、从句和句子长度的词块。在例句(1)中,将compiling和running合并为一个短语。


-所指表达

系统必须确定如何指向所讨论的客体。在例句(1)中如何指向program的决策不是无关紧要的。


● 话语结构

NLG系统经常处理多个句子的话语,它必须具有一个连贯且可分辨的结构。例句(20.1)就包含两个命题,显然其中一个是另一个的根据。


这些选择问题,与将单词的线性序列组成文本的实际问题一起,构成了NLG领域的核心。尽管这是一个相对年轻的领域,但已经有许多针对该核心的研究工作。


责任编辑:admin


微信公众号

  • 上一篇:生成的体系结构
  • 下一篇:如何确定话语结构


  • 《译聚网》倡导尊重与保护知识产权。如发现本站文章存在版权问题,烦请30天内提供版权疑问、身份证明、版权证明、联系方式等发邮件至info@qiqee.net,我们将及时沟通与处理。


我来说两句
评论列表
已有 0 条评论(查看更多评论)