以语音传递信息的手腕并不是什么新东西。它是我们几千年来一向运用的交换要领。而且,从一台计算机那边接收到电话也并不是什么新发明。许多语音手艺到如今已大行其道了,从传真机、自动拨号器到集成语音复兴体系(IVR)。电话当然是它最广泛的运用。
传统的语音体系运用预先录制好的样本、辞书和音夙来建立我们所听到的声响。但是,运用这类预先录制的手腕有许多题目。个中最广泛的题目之一就是缺乏连贯性和变化。假如只要一种录制好的语音版本,个中每一个单词或许声响都只要一个样本,那末很难让计算机发出和一般陈说语句差别腔调的疑问句。一样困难的是让计算机晓得什么时刻该用某种腔调或许该用何种腔调发音。
为了协助处理语音合成题目,W3C为语音合成标记言语(Speech Synthesis Markup Language)建立了一种新的事情草稿。这类新的XML词汇表可以使语音浏览器开发人员可以掌握一个语音合成器的建立要领。比方,开发者可以将敕令包含进音量中,并在合成语音形式的时刻运用它。
SSML范例基于Sun公司初期的一项名为jspeeck Markup Language(JSML)的研讨事情。JSML则是基于java Speech API Markup Language。如今SSML是W3C语音研讨事情组的事情稿。
SSML言语的基本目的是一个文本到语音(Text-To-Speech简称TTS)的处理器。一个TTS引擎取得一个文本的鸠合并将它转换为语音。如今已有了几种TTS运用程序了,比方电话语音合成复兴体系,以及为瞽者设想的更高等的体系等等。特定文本鸠合的发音自身固有的不肯定性是现有TTS体系的所面对的重要困难之一。其他广泛一点的题目集合在单词简写(如HTML)、拼写和发音差别的单词(如subpoena)等词类的发音上。
SSML言语的基本元素指定了文本的花样。比方针对HTML,SSML言语供应了一种段落元素而且走得更远。由于它还供应了句子元素。经由过程像指定段落一样指定句子的地点,包含肇端地点和停止地点,TTS引擎就可以更准确的生成语音。
除了基本的花样,SSML还供应了功用来指定怎样发某个预定的词语或许词语鸠合。这个功用由“say-as”元夙来完成。它是SSML中一个异常有效的组件。它能让你指定一个模板,这个模板形貌怎样发音某个单词或许单词鸠合。经由过程“say-as”,我们可认为缩写的单词指定怎样发音,也可认为拼写与发音差别的单词指定发音。我们还可以列出数字和日期之间的区分。“say-as”元素包含了对email地点、钱银和电话号码等的支撑。
我们也可以对文本供应一种语音学上的表达体式格局。比方,我们可以经由过程这类手腕来指出美式英语和英式英语对potato单词发音的差别。
SSML言语的几个高等属性可以协助我们让TTS体系生成更人性化的声响。我们可以运用“voice”元素指定男声、女声或许中性的声响,而且还可以指定声响所属的岁数。我们可以运用这个元夙来指定从4岁的男孩到75岁的老妇之间的任何声响。
我们还可以运用“emphasis”元素围绕那些须要强调或许比较次要的文本。我们还可以运用“break”元素通知体系语音在某处应当停息。
SSML言语第一流地特征之一体如今它地“PRosody”元素上。经由过程它我们可以以某种指定地体式格局生成某个肯定的文本鸠合的语音。我们可以指定声响的腔调、局限、语速(单词每分钟)。我们以至可以经由过程运用“contour”元素指定更细节的东西。“contour”元素把腔折衷语速集成在了一同。经由过程指定一个文本鸠合的“contour”元素值,我们可以更准确的定义怎样生成语音。
以上就是XML在语音合成中的运用的内容,更多相干内容请关注ki4网(www.ki4.cn)!