- 签证留学 |
- 笔译 |
- 口译
- 求职 |
- 日/韩语 |
- 德语
经常会出现两个不同的单词,其拼写形式相同而发音不同(它们称为同形词[homograph])。例如,动词wind(“You need to wind this up more neatly”)的发音为[waɪnd],而名词wind(“blow, blow,thou winter wind”)的发音为[wind]。这个问题在TTS的应用中是非常关键的(因为在一定的上下文中,系统必须判断究竟应该读这两个不同的发音中的哪一个),不过,在当前的语音识别系统中,由于某些原因一般会忽略同形词的问题。书面印刷的发音词典对于不同的词类都要给出不同的发音,CELEX在这方面做得很好,因为CELEX的发音词典是为ASR设计的。在
Pronlex和CMU的发音词典中,对于wind给出了两种不同的发音,但没有说明什么词类用什么样的发音。
发音词典中通常没有收录很多专有名词。在很多实际应用中这是一个很严重的问题。Liberman and Church(1992)曾经报告过,在3300万词的AP新闻语料库中,有21%的词是专有名词。接着,Liberman和Church公布了一个专有名词的词表,包含1987年从Donnelly市场组织收集的150万个专有名词(覆盖了美国的7200万个家庭)。但是,在CELEX(它是根据传统词典编纂的)发音词典的52477个原形词中,只有1000个专有名词。与之对比的是Pronlex, Pronlex包含两万个专有名词,这只是150万个词中的一小部分。只有很少的词典给出Dr. 这样的词条的发音,Liberman and Church (1992) 指出,Dr. 的发音可以为doctor或drive,2/3的发音可以为two thirds,February third或 two slash three。
现有的发音词典还没有很好的模型来处理虚词(and,l,a和of等)的发音。这是因为这些虚词的发音变化的语音上下文环境很复杂。一般在发音词典中只包含某些最基本的形式(例如the的发音为[ði]),再使用其他算法根据上下文推出它的发音变体。
TTS和ASR发音词典的一个最重要的区别在于,TTS的发音词典不需要表示方言的变体;例如,在非常精确的ASR的发音词典中,需要表示either和tomato的不同发音,而在TTS的发音词典中,只要选择不同发音中的一个发音就可以了。
责任编辑:admin