教育资源为主的文档平台

当前位置: 查字典文档网> 所有文档分类> > > 改进的HMM系统在英语语音合成中的研究_张雪英

改进的HMM系统在英语语音合成中的研究_张雪英

上传者:蒋红斌
|
上传时间:2017-06-02
|
次下载

改进的HMM系统在英语语音合成中的研究_张雪英

  第43卷 第1期2012年1月

   

  太原理工大学学报

  OURNALOFTAIYUAN UNIVERSITYOFTECHNOLOGYJ

   

  ol.43No.1V

  an.2012 J

  

  ()90000743220120101641文章编号:---

  改进的HMM系统在英语语音合成中的研究

  张雪英,陈 洁,孙 颖

  )(太原0太原理工大学信息工程学院,30024

  摘 要:根据英语语言所具有的一些特性对HMM模型进行改进,设计出适合英语语音合成的上下文属性集以及用于模型聚类的问题集,提高了其建模和训练效果。此外,借助HTK和以基频和声道谱参数为训练参数,最终实现此英语语音合成系统。从所合成语句Festival等工具,的效果来看,合成语音整体稳定流畅,而且节奏感比较强。

  关键词:语音信号处理;可训练语音合成;英语合成HMM;中图分类号:TP39 文献标识码:A

  语音合成的目的是建立一个有讲话能力的计算

  机系统,以实现真正意义上的人机交互。基于大语

  1]

  是近年来语音合成中的主流料库的拼接合成方法[

  下文相关因素,对声道谱、基频和时长进行建模。本系统利用HTK进行训练。在合成部分,首先对输

  入的文本进行文本分析后,转化为与文本相

  改进的HMM系统在英语语音合成中的研究_张雪英1

  关的标

  方法。其基本原理是根据输入文本分析得到的信息,从预先录制和标注好的语音库中挑选合适的单元,然后拼接得到最终的合成语音。虽然大语料库拼接合成系统保持了原始发音人的音质,但也存在不少缺陷,比如:合成语音的效果不够稳定,音库构建周期太长以及合成系统的可扩展性较差等,这些缺陷明显限制了它在多样化语音合成方面的应用。

  2]

  (的可因此,近年来基于隐马尔可夫模型[HMM)

  训练语音合成方法被提出并逐渐得到应用。基于HMM的语音合成系统对语音参数进行

  建模,然后利用音库数据进行自动训练,并最终形成

  3]

  。与现在大语料库拼接合成一个相应的合成系统[

  相比,其优势就在于可以在短时间内,基本不需要人工干预的情况下自动构建一个新的系统,而且整个训练过程基本上是不依赖于发音人、发音风格以及情感等因素。笔者研究了基于HMM的可训练语

  音合成方法,并将其原理应用到英语合成中。

  图1 基于HMM语音合成流程

  注序列,通过在此基础上,利用上下文相关HMM,

  []

  从而确定了各音素的合S4-5构建句子HMM,HT

  6]

  合成出语音。成参数,最后通过参数合成器[

  1 基于HMM的可训练语音合成系统

  概述

  图1是基于HMM的语音合成系统的基本框图,它包括训练和合成两个部分。在训练部分,首先,从语料库中提取谱参数和基频参数,然后利用上

  2 英语语音标注

  模型训练前有一个重要的部分就是对上下文属

  7]

  ,即根性集和用于决策树聚类的问题集进行设计[

  据先验知识来选择一些对声学参数(能量、基频和时长)有一定影响的上下文属性,并设计相应的问题

  收稿日期:00011962--

  );)山西省国际科技合作项目(山西省自然科学基金(0-12011081047201001102 基金项目:

  ),(女,河北行唐县人,张雪英(教授,博导,主要从事语音信号处理研究,964-)el13015475372T1 作者简介:

  等:改进的HMM系统在英语语音合成中的研究 第1期 张雪英,

  17

  集,以用于上下文相关模型。上下文属性与决策树设计的好坏会直接影响到最后合成语音的效果。因本文对英语的发音及语法特点进行了深入的研此,

  究,设计了与之对应的上下文属性集和问题集。2.1 音节

  音节是读音的基本单位,任何单词的读音,都是分解为一个个音节朗读。在英语中元音特别响亮,一个元音可构成一个音节,一个元音和一个或几个辅音不响亮,不辅音音素结合也可以构成一个音节;

  ,能构成音节。但英语辅音字母中有4个辅音[m]],[],[][是响音,它们和辅音音素结合,也可构nnlg

  成音节。它们构成的音节往往出现在词尾,一般是非重读音节。

  英语单词有一个音节的,两个音节的,多个音节的。只有一个音节的词叫单音节词,如:有take拿;两个音节的词叫双音节词,如t包含三个a'ble桌子;如p音节或三个音节以上的词叫多音节词,o'ula'ption人口,conrat'ula'tion祝贺。g

  2.2 音节划分的方法

  英语中,元音是构成音节的主体,辅音是音节的分界线,相应的音节划分的规则如下:

  )两辅音之间不管有多少个元音,一般都是一1

  个音节。如:bed床,bet打赌,seat坐位,beat毒打,beaut极好的,beau'ty美。

  )两元音字母之间有一个辅音字母时,辅音字2母归后一音节。如:stu'dent学生,la'bour劳动。)有两个辅音字母时,前一个辅音字母归前一3

  另一个归后一音节。如:音节,let'ter信,win'ter冬天。

  )不能拆分的字母组合按字母组合划分音节。4如:fa'ther父亲,tea'cher教师。2.3 音节重读规则

  音节按是否重读可以分为重读音节和非重读音节。重读音节是指在双音节或多音节词中的一个发音特别响亮的音节。欲使合成的语音能更好地被人耳所识别,进行音节划分时就必须考虑音节的重读

  ]89-

  。问题[

  音节重读。

  )含有-、、重读4tionsionssion等字母组合时,--

  音节为该字母组合前与之紧挨着的那个音节。

  3 HMM可训练合成系统应用于英语

  合成的改进设计

  3.1 语音标注

  欲实现文本到语音的转换,必须对文本进行语音标注。首先需将文本内容按句断开;然后对每一句中的具有独立意义的词进行分隔;分隔出来的独立词再按音节进行划分,进行音节划分时一定要注意重读音节的位置;最后针对每一个音节进行音素切割,判断每个音节内所包含的音素。3.2 上下文相关语法

  上下文相关语法记录各声学模型合成单元的特征及其与相邻合成单元之间的联系。在训练阶段,建立决策树时应用此语法中所记录的各个信息与问进行资料分群;在合成阶段,则可从题集进行对比,

  决策树中取得适当的参数,产生平顺的合成语音。)式(是针对英文语音合成系统设计的上下文相关1语法的格式,其中各个符号的定义见表1。

  ^13+4=5@7pp2-pppp6-p/A:a1-a2-a3

  /B:bbbbbbbbbb1-2-3@b4-5&6-7#8-9$10-11!

  bbbbb|12-13;14-1516

  /C:ccc1+2+3/D:dd1-2

  /E:eeeeeee1+2@e3+4&5+6#7+8/F:1-f2f/G:1-g2g

  /H:hhhhh|1=2@3=45/I:ii1-2

  /J:1+2-3jjj

  表1 上下文相关语法中各标号的含义

  标号

  含义上上个音素上个音素当前音素下个音素下下个音素当前音素的属性上个音节的属性当前音节的属性

  标号

  含义下个音节的属性上个词的属性当前词的属性下个词的属性上个短语的属性当前短语的属性下个短语的属性整个语句的属性

  ()1

  p1p2p3p4p5pp6-7aa1-3bb1-16

  cc1-3dd1-2ee1-8ff1-2gg1-2hh1-5ii1-2jj1-3

  英语中,判断音节重读的规则如下:

  )单音节词多是重读音节。1

  )双音节词的第一个音节通常是重读音节,但2

  是:含有abedereinex-,-,-,-,-,-等前缀的双音节词往往是在第二个音节重读。

  但3)多音节词通常在倒数第三个音节重读,

  ,,是:词尾有-在其前一个lctionsion等后缀的词,--

  3.3 决策树问题集

  决策树问题集记载了一系列资料分群规则,使能依据问题集进行资得合成系统在建立决策树时,

  等:改进的HMM系统在英语语音合成中的研究 第1期 张雪英,

  []]():张连海,吴保民.基于HMM的英语文语转化系统[3J.信息工程大学学报,2008,913135. 冯志红,-

  [],,,4enHeiaTakashiNoseYamaishi.TheHMM-basedseechsnthesissstem(HTS)version2.0[C]rocofISCA Z∥Pggpyy

  ,,BonnGermanGerman2007:2224. -yy

  []’[5X,ACERO A.RecentimrovementsonMicrosoftstrainabletexttoseechsstem-whistlerC]rocofIC HUANG-- ∥P-ppy

  ASS,1997:959963.-

  []中国科学技术大学,6D].合肥:2010. 吴义坚.基于隐马尔科夫模型的语音合成技术研究[

  []陈祖荫.模式识别:理论、方法和应用[北京:地震出版社,7M].1989:2344. 王碧泉,-

  []]():8J.中文信息学报,2007,53122124. 朱维彬.支持重音合成的汉语语音合成系统[-

  []]():韩纪庆.自然风格语言的汉语重音自动判别研究[9J.声学学报,2006,13203205. 邵艳波,-19

  []康世胤.一种适合HMM汉语语音合成的建模单元挑选算法[10C] 段全盛,∥第十届全国人机语音通讯学术会议论文集,

  2009:8788.-

  StudforEnlishSnthesiswithImrovedHMMSnthesisSstems ygypyy 

  ,,ZHANGXueCHENJieSUNYinin -gyg

  (Collee DeartmentoInormation EnineerinTUT,Taiuan030024,China) gpffgg,y 

  :roblemsAbstractSeechsnthesisisoneoftheketorealizehumanachineinteraction. -m pyyp 

  ,TheHMM-basedseechsnthesiscouldconstructasnthesisssteminsuchashorteriodso pyyyp

  toachievetheofdiverseseechsnthesis.InthistheHMM-basedtrainableasuroseaer pypppp

  snthesiswasaliedforEnlishalication.ThecontextualfeaturesandcorresondinseechpyppgpppguestionsetfortreebasedHMMclusterinweredesinedbconsiderinthecharacteristicsof -qggyg 

  ,wEnlish,toimrovetheeffectofHMM modelinandtrainin.Inadditioniththehelof gpggp

  ,andFestivaltheEnlishseechsnthesissstem wasfinallachievedtakinthefundaHTK -gpyyyg

  mentalfreuencandthesoundchannelarameterasthetraininaramenters.Fromtheevalua-qypgp

  ,tionresultsofthefinalsstem,thesnthesizedvoiceturnedouttobeclearandfluentandthe yy

  rhthm wasstron. yg

  :;HMM();KewordsseechsinalrocessinHiddenMarkovModelstrainableseechsn-pgpgpyy 

  ;thesisEnlishsnthesis gy

  (编辑:贾丽红)

版权声明:此文档由查字典文档网用户提供,如用于商业用途请与作者联系,查字典文档网保持最终解释权!

下载文档

热门试卷

2016年四川省内江市中考化学试卷
广西钦州市高新区2017届高三11月月考政治试卷
浙江省湖州市2016-2017学年高一上学期期中考试政治试卷
浙江省湖州市2016-2017学年高二上学期期中考试政治试卷
辽宁省铁岭市协作体2017届高三上学期第三次联考政治试卷
广西钦州市钦州港区2016-2017学年高二11月月考政治试卷
广西钦州市钦州港区2017届高三11月月考政治试卷
广西钦州市钦州港区2016-2017学年高一11月月考政治试卷
广西钦州市高新区2016-2017学年高二11月月考政治试卷
广西钦州市高新区2016-2017学年高一11月月考政治试卷
山东省滨州市三校2017届第一学期阶段测试初三英语试题
四川省成都七中2017届高三一诊模拟考试文科综合试卷
2017届普通高等学校招生全国统一考试模拟试题(附答案)
重庆市永川中学高2017级上期12月月考语文试题
江西宜春三中2017届高三第一学期第二次月考文科综合试题
内蒙古赤峰二中2017届高三上学期第三次月考英语试题
2017年六年级(上)数学期末考试卷
2017人教版小学英语三年级上期末笔试题
江苏省常州西藏民族中学2016-2017学年九年级思想品德第一学期第二次阶段测试试卷
重庆市九龙坡区七校2016-2017学年上期八年级素质测查(二)语文学科试题卷
江苏省无锡市钱桥中学2016年12月八年级语文阶段性测试卷
江苏省无锡市钱桥中学2016-2017学年七年级英语12月阶段检测试卷
山东省邹城市第八中学2016-2017学年八年级12月物理第4章试题(无答案)
【人教版】河北省2015-2016学年度九年级上期末语文试题卷(附答案)
四川省简阳市阳安中学2016年12月高二月考英语试卷
四川省成都龙泉中学高三上学期2016年12月月考试题文科综合能力测试
安徽省滁州中学2016—2017学年度第一学期12月月考​高三英语试卷
山东省武城县第二中学2016.12高一年级上学期第二次月考历史试题(必修一第四、五单元)
福建省四地六校联考2016-2017学年上学期第三次月考高三化学试卷
甘肃省武威第二十三中学2016—2017学年度八年级第一学期12月月考生物试卷

网友关注

教师考试语文备考试题之现代文阅读专项练习题(4)
湖南特岗教师招聘考试《英语》试题卷考情分析
辽宁特岗教师面试之英语学科试讲指导
湖北农村义务教师招聘《初中生物》考情分析
教师考试语文备考试题之现代文阅读专项练习题(2)
山西特岗教师招聘《初中数学》考情分析及备考指导
吉林特岗数学学科考情分析及备考指导
语文学科专业知识之现代文阅读技巧
教师考试语文备考试题之现代文阅读专项练习题(1)
2016年5月14日湖北农村义务教师《初中思想品德》考情分析
2016年5月14日湖北农村义务教师《初中地理》考情分析
特岗教师地理学科备考-主要的自然灾害及其防治
吉林特岗教师招聘《中学生物》第Ⅱ卷专业卷考情分析
英语阅读技巧和方法总结
Excel公式中引用地址方式简介
教师考试语文备考试题之现代文阅读专项练习题(3)
云南省语文特岗教师招聘笔试考情分析
吉林省特岗教师考试考情分析《中学生物》第Ⅱ卷
山西特岗教师招聘历史学科考情分析
2016年5月14日湖北农村义务教师《初中历史》考情分析
山西特岗教师招聘《中学生物》考情分析
湖北农村义务教师招聘《小学美术》考情分析
黑龙江省哈尔滨市中学特岗教师招聘考情解读
黑龙江特岗教师教学设计考点指导
湖北农村义务教师招聘《初中美术》考情分析
2016年5月14日云南特岗教师招聘《中学语文》考情分析
2016年5月22日宁夏事业单位教师岗、特岗教师《教育综合基础理论+中学音乐》考情分析
2017年新疆维吾尔自治区面向社会公开招聘初中教师笔试说明
特岗教师招考音乐学科备考——古典音乐
2017年普通高等学校招生全国统一考试大纲

网友关注视频

北师大版小学数学四年级下册第15课小数乘小数一
第五单元 民族艺术的瑰宝_16. 形形色色的民族乐器_第一课时(岭南版六年级上册)_T1406126
三年级英语单词记忆下册(沪教版)第一二单元复习
苏科版八年级数学下册7.2《统计图的选用》
冀教版小学数学二年级下册1
人教版二年级下册数学
8 随形想象_第一课时(二等奖)(沪教版二年级上册)_T3786594
【部编】人教版语文七年级下册《过松源晨炊漆公店(其五)》优质课教学视频+PPT课件+教案,辽宁省
冀教版英语三年级下册第二课
北师大版数学四年级下册3.4包装
冀教版小学数学二年级下册第二单元《有余数除法的竖式计算》
19 爱护鸟类_第一课时(二等奖)(桂美版二年级下册)_T3763925
冀教版小学数学二年级下册第二单元《租船问题》
冀教版小学数学二年级下册第二单元《有余数除法的简单应用》
8.对剪花样_第一课时(二等奖)(冀美版二年级上册)_T515402
沪教版牛津小学英语(深圳用) 四年级下册 Unit 8
第五单元 民族艺术的瑰宝_16. 形形色色的民族乐器_第一课时(岭南版六年级上册)_T3751175
冀教版小学数学二年级下册第二周第2课时《我们的测量》宝丰街小学庞志荣
二年级下册数学第一课
【部编】人教版语文七年级下册《泊秦淮》优质课教学视频+PPT课件+教案,天津市
【部编】人教版语文七年级下册《老山界》优质课教学视频+PPT课件+教案,安徽省
沪教版八年级下册数学练习册21.3(2)分式方程P15
沪教版牛津小学英语(深圳用) 四年级下册 Unit 3
8.练习八_第一课时(特等奖)(苏教版三年级上册)_T142692
青岛版教材五年级下册第四单元(走进军营——方向与位置)用数对确定位置(一等奖)
二次函数求实际问题中的最值_第一课时(特等奖)(冀教版九年级下册)_T144339
第五单元 民族艺术的瑰宝_15. 多姿多彩的民族服饰_第二课时(市一等奖)(岭南版六年级上册)_T129830
第8课 对称剪纸_第一课时(二等奖)(沪书画版二年级上册)_T3784187
沪教版八年级下册数学练习册20.4(2)一次函数的应用2P8
沪教版牛津小学英语(深圳用) 五年级下册 Unit 10