汉语语音合成
汉语语音合成封面图

汉语语音合成

吕士楠, 初敏, 许洁萍, 贺琳, 著

出版社:科学出版社

年代:2011

定价:78.0

书籍简介:

本书包括基础篇和专题篇两大部分。基础篇详细介绍语音合成技术的发展历程和与语音合成关系密切的声学语音学知识,尤其是课题组围绕语音合成技术作出的各方面的研究和所填补的汉语语音学知识的空白。结合我们在开发汉语语音合成器中积累的经验,对各种合成器的工作原理和基本结构及其应用进行系统的阐述。此外,还介绍在语音合成系统中广泛运用的相关机器学习算法。专题篇结合近十年来国内外技术发展的热点和方向,总结我们的研究工作经验,对韵律分析与建模、数据驱动的语音合成方法、语音合成数据库的构件技术、文语转换系统的评估方法等进行专题讨论和评述,并对研究和发展方向提出建议和展望。

书籍目录:

序一

序二

前言

基础篇

第1章 语音合成技术史的叙述

1.1 机械式语音合成器

1.1.1 Kempelen的讲话机

1.1.2 Euphonia讲话机

1.2 电子式语音合成器

1.2.1 VODER

1.2.2 模式播放器

1.2.3 共振峰合成器

1.3 基于计算机的语音合成

1.3.1 数字式共振峰语音合成技术

1.3.2 波形拼接合成技术

1.4 汉语语音合成的发展

1.4.1 汉语合成研究的先驱

1.4.2 国内汉语合成技术的研究

1.5 总结

参考文献

附录 合成语音样品

第2章 声学语音学

2.1 声学基础

2.1.1 空气中的声波

2.1.2 波动方程

2.1.3 声音在管子中的传播

2.2 言语交际过程

2.2.1 语音的产生

2.2.2 语音的感知

2.3 语音的声学特征

2.3.1 语音的时间维及频率维表示

2.3.2 频谱分析

2.3.3 语图和语音的频谱分析方法

2.3.4 元音的频谱

2.3.5 辅音的频谱

2.3.6 音轨

2.4 汉语普通话的音位系统

2.4.1 汉语普通话的辅音系统

2.4.2 汉语普通话的元音系统

2.4.3 汉语传统的声韵调系统

2.5 总结

参考文献

第3章 韵律

3.1 语调模型

3.1.1 “调核”理论和INTSINT语调模型

3.1.2 Pierrehumbert有限状态网络模型

3.1.3 Tilt语调模型

3.1.4 Pujisaki模型

3.1.5 PENTA模型

3.2 汉语普通话韵律的基本单元

3.2.1 词调

3.2.2 短语语调

3.3 句调和篇章韵律

3.3.1 语篇语调

3.3.2 朗读风格的影响

3.4 总结

参考文献

第4章 汉语文语转换系统

4.1 合成语音自然度的研究

4.1.1 合成语音自然度实验

4.1.2 音联对自然度的影响

4.1.3 汉语语句重音的声学表现

4.2 汉语共振峰合成系统

4.2.1 系统框图

4.2.2 合成单元

4.2.3 语言学处理

4.2.4 韵律设计

4.2.5 声学处理

4.3 基音同步波形叠加合成

4.3.1 PSOI+A算法

4.3.2 汉语的韵律——播音风格言语的声学分析

4.3.3 KX.PSOLA汉语文语转换系统的韵律模型

4.3.4 高清晰度高自然度KX-PSOLA汉语文语转换系统

4.3.5 《联想佳音》

4.4 总结

参考文献

专题篇

第5章 普通话的节律和重音的实验研究

5.1 基于大规模语料库的韵律研究

5.1.1 语料库的设计原则

5.1.2 语料库的后期加工

5.1.3 语料库的实体

5.2 普通话的节律组织

5.2.1 节律组织中的自由度

5.2.2 节律组织规则

5.3 普通话的重音标注、分类及分配

5.3.1 重音的知觉强度标注

5.3.2 重音强度的三级标注

5.3.3 语义重音与节奏重音

5.3.4 重音的分布与韵律边界

5.3.5 总结

参考文献

第6章 基于大规模语料库的波形拼接合成

6.1 韵律控制策略

6.1.1 全控制策略

6.1.2 半控制策略

6.1.3 软控制策略

6.2 基于韵律软控制策略的TTS系统的结构

6.3 单元选择和波形拼接的策略和方法

6.3.1 音节关联的上下文矢量

6.3.2 上下文矢量的距离

6.4 建立语音特征覆盖完备的言语数据库

6.4.1 音库覆盖率与规模

6.4.2 言语数据波形的采集和标注

6.4.3 标注精度对合成自然度的影响

6.4.4 基于上下文相关边界模型的自动切分方法

6.4.5 音段波形的直接拼接合成

6.4.6 小结

6.5 木兰-汉英双语TTS系统

6.5.1 木兰的结构

6.5.2 统一的文本标准化模块

6.5.3 语言检测和分发模块及单元提取模块

6.5.4 言语数据库

6.5.5 小结

6.6 更多应用

6.6.1 个性化TTS系统

6.6.2 领域自适应TTS

6.6.3 互联网个性化语音服务

6.7 总结

参考文献

第7章 波形拼接合成语料库生成技术

7.1 录音脚本的设计

7.1.1 音段特征覆盖

7.1.2 韵律特征覆盖

7.2 发音人的挑选

7.2.1 发音人性别的选择

7.2.2 发音人年龄的限制

7.2.3 发音人籍贯的选择

7.2.4 音色的要求

7.2.5 专业水平的考查

7.2.6 发音人的工作时间保证

7.2.7 候选发音人人数的考虑

7.2.8 候选人的发音评估

7.3 音库录制

7.3.1 录音室

7.3.2 录音设备

7.3.3 录音程序

7.4 数字录音材料的处理

7.4.1 复审

7.4.2 标音

7.5 总结

参考文献

第8章 语音合成系统的质量评估

8.1 语音输出系统质量评估方法

8.1.1 音节清晰度测试

8.1.2 词和句的可懂度测试

8.1.3 语句和篇单的整体性能测试

8.1.4 评测的原则

8.2 汉语语音合成质量评估

8.2.1 1994年“863”汉语语音合成系统评测

8.2.2 1995年汉语语音合成系统评价方法

8.3 国家语言文字工作委员会汉语语音合成系统评测

8.3.1 2004年汉语语音合成系统评价方法

8.3.2 2004年的评测结果和分析

8.4 MOS和PC评估方法的比较

8.4.1 测试文本和测试条件

8.4.2 MOS评估

8.4.3 PC测试

8.4.4 MOS和PC评测比较结果

8.5 汉语合成语音评测新方法探索

8.6 总结

参考文献

附录 2004年评估测试语料

第9章 展望

9.1 STRAIGHT分析合成技术

9.2 基于HMM的语音合成

9.2.1 系统的框图

9.2.2 训练集及参数提取

9.2.3 HMM模型化

9.2.4 基于上下文聚类的决策树

9.2.5 言语合成

9.3 从概念到语音的合成

9.3.1 SOLE系统

9.3.2 SOCS系统

9.4 多语种合成系统

9.5 口语翻译系统

9.6 总结

参考文献

后记

内容摘要:

《汉语语音合成——原理和技术》以独特的视角审视语音合成技术的意义,把包括语音识别和语音合成的人机对话系统看作人类文明发展史上的重要里程碑。该书介绍了语音合成的历史和汉语语音合成发展历程;对作为语音合成基础的声学语音学知识,如言语声的产生、声音在声道中转播、声道的共鸣以及言语声的感知等做了系统的阐述,特别强调了合成语音的韵律控制。作者在综述吴宗济、沈炯等同行的研究成果的基础上,重点围绕汉语的韵律特征及其对合成语音自然度的影响,开展了深入的研究,弥补了汉语韵律知识方面若干空白,独立构建了汉语合成的韵律模型。本书由吕士楠等著。《汉语语音合成——原理和技术》介绍语音合成的原理和针对汉语的各项合成技术,以及应用的范例。全书分基础篇和专题篇两大部分。基础篇介绍语音合成技术的发展历程和作为语音合成技术基础的声学语音学知识,尤其是作者获得的相关研究成果(填补了汉语语音学知识中的某些空白),并对各种合成器的工作原理和基本结构进行系统的阐述。专题篇结合近十年来国内外技术发展的热点和方向,讨论韵律分析与建模、数据驱动的语音合成方法、语音合成数据库的构建技术、文语转换系统的评估方法、语音合成技术的应用等。 《汉语语音合成——原理和技术》面向从事语言声学、语音通信技术,特别是语音合成的科学工作者、工程技术人员、大学教师、研究生和高年级的大学生,可作为他们研究、开发、进修的参考书。本书由吕士楠等著。

书籍规格:

书籍详细信息
书名汉语语音合成站内查询相似图书
丛书名现代声学科学与技术丛书
9787030329202
如需购买下载《汉语语音合成》pdf扫描版电子书或查询更多相关信息,请直接复制isbn,搜索即可全网搜索该ISBN
出版地北京出版单位科学出版社
版次1版印次1
定价(元)78.0语种简体中文
尺寸24 × 17装帧精装
页数 360 印数

书籍信息归属:

汉语语音合成是科学出版社于2011.12出版的中图分类号为 H11 的主题关于 汉语-语音合成 的书籍。