会员中心 |  会员注册  |  兼职信息发布    浏览手机版!    精选9.9元!    人工翻译    英语IT服务 贫困儿童资助 | 留言板 | 设为首页 | 加入收藏  繁體中文
当前位置:首页 > 机翻技术 > 识别技术 > 正文

文本 - 语音转换中的韵律

发布时间: 2022-06-29 09:18:56   作者:etogether.net   来源: 网络   浏览次数:
摘要: 句子的韵律结构是指某些词似乎自然地结合在一起,而某些词似乎有明显的间隔或者彼此分开。


从符合正词法的文本到语音的转录过程只是描述了在实际生成语音的文本-语音转换系统TTS中输入的主要部分的产生过程。输入的另一个重要部分是韵律(prosody)。韵律这个术语一般用于表示句子发音中没有用从词典中推导出的语音序列来描写的那些方面。韵律是在比语音更长的语言单位上起作用的,因此,韵律的研究有时又称为超音段现象(suprasegmental phenomena)的研究。


1. 韵律的音系学性质

韵律有三个主要的音系学性质:突显度(prominence)、结构(structure)和调(tune)。


前面曾经讨论过突显度,突显度是用于覆盖重音和重读的一个广义的术语。突显度是音节的一个性质,而且它的描述通常都是相对的,只是说明一个音节比另一个音节显得更突出。发音词典要标出词重音,例如table的重音在第一个音节,而machine的重音在第二个音节。诸如there, the和a这样的虚词,通常是完全不重读的。当若干个词结合在一起时,它们的重音模式也会结合起来,在更大的组合体中形成一个更大的重音模型。重音结合时要遵从一些规则。例如,诸如new truck(新卡车)这样的形容词-名词组合,其重音在右侧的词(new *truck),而诸如*tree surgeon(树木医生)这样的名词-名词组合,其重音则在左侧。不过,一般地说,这样的规则都有例外,所以重音的预测就是一个非常复杂的问题。例如,名词-名词组合*apple cake(苹果蛋糕)的重音在第一个单词,而名词-名词组合apple *pie(苹果馅饼)的重音则在第二个单词(Liberman and Sproat,1992; Sproat,1994,1998a)。还有,韵基(rhythm)的作用可以使重读音节稍微有所扩展,例如,city *hall(市政厅)和*parking lot(停车区)结合成*city hall *parking lot(Liberman and Prince,1977)。最后,重音的位置受到话语因素的强烈影响,例如,新词语或做焦点的词语经常重读。


句子的韵律结构是指某些词似乎自然地结合在一起,而某些词似乎有明显的间隔或者彼此分开。通常用韵律短语(prosodic phrasing)来描述韵律结构。具有同样的韵律短语结构的一段话语应该具有同样的句法结构。例如,句子“I wanted to go to London, but could only get tickets for France”似乎包含两个主要的韵律短语,它们的边界就在逗号处。这些较大的韵律单位通常使用的术语有:语调短语(intonational phrase或IP) (Beckman and Pierrehumbert,1986)、语调单位(intonation unit) (Du Bois et al.,1983)、调单位(tone unit)(Crystal,1969)。另外,在第一个短语中,似乎还有更小的韵律短语边界 [通常称为中间短语(intermediate phrase)] 分割单词:“I wanted I to go l to London”。


韵律短语和次短语的精确定义以及它们与诸如子句和名词短语之类的句法短语及语义短语之间的关系,过去一直是而且现在仍然是很多争论的主要内容(Chomsky and Halle,1968; Langendoen,1975; Streeter, 1978; Hirschberg and Pierrehumbert, 1986; Selkirk, 1986; Nespor and Vogel, 1986; Croft, 1995; Ladd,1996; Ford and Thompson,1996; Ford et al.,1996)。尽管这个问题十分复杂,学者们还是提出了一些算法,试图把输入文本的句子自动分割为一些语调短语。例如,Wang and Hirschberg(1992), Ostendorf and Veilleux(1994), Tayler and Black(1998)以及其他一些学者曾经根据周围单词的词类特征、在当前单词和下一个单词中语段的长度特征、从语段的开始算起或从语段的结尾算起的潜在边界的距离特征,以及周围的单词是否有重音等特征,建立统计模型来预测语调短语的边界。



微信公众号

[1] [2] [下一页] 【欢迎大家踊跃评论】
我来说两句
评分: 1分 2分 3分 4分 5分
评论内容:
验证码:
【网友评论仅供其表达个人看法,并不表明本站同意其观点或证实其描述。】
评论列表
已有 0 条评论(查看更多评论)