出版社:北京大学出版社
年代:2008
定价:25.0
本书是利用目前国际上研究语言发声中最先进和复杂的技术,对语言的常用发声类型和汉语普通话声调的发声类型变化进行的研究,是一部基础研究性的专著,其研究成果主要可用于语言学研究,嗓音生理和病理研究及嗓音声学研究。书中所用的研究样本主要采集于东京大学医学院言语生理系,部分采集于香港大学言语听觉系,图像和声学信号分析系统主要建于香港城市大学电子工程系语言工程实验室。除了上述单位的资金支持外,本项研究还部分得到了自然科学基金项目“汉语普通话嗓音声学研究”的资助。完成初稿后曾请香港中文大学王士元教授、台湾中央研究院郑景全教授、东京大学新美成二教授和爱尔兰大学Paul flecher教授的审阅。
ForewordPrefaceAcknowledgementChapter 1 Introduction 1.1 Aim of This Book 1.2 Study of Vocal Vibration through High-Speed Motion Picture 1.3 Anatomy of Larynx 1.4 Contents of This BookChapter 2 Image Processing and Parameter Extraction 2.1 Image Processing 2.1.1 Parameters of HSDI System and File Formats 2.1.2 Subjects and Samples 2.1.3 Image Contrast Adjustment, Rotation and Cropping 2.1.4 Glottal Area Detection 2.1.5 Image Shift Adjustment
ForewordPrefaceAcknowledgementChapter 1 Introduction 1.1 Aim of This Book 1.2 Study of Vocal Vibration through High-Speed Motion Picture 1.3 Anatomy of Larynx 1.4 Contents of This BookChapter 2 Image Processing and Parameter Extraction 2.1 Image Processing 2.1.1 Parameters of HSDI System and File Formats 2.1.2 Subjects and Samples 2.1.3 Image Contrast Adjustment, Rotation and Cropping 2.1.4 Glottal Area Detection 2.1.5 Image Shift Adjustment 2.2 Parameter Extraction 2.2.1 Types of Dynamic Glottis 2.2.2 Modes of Parameter Extraction 2.2.3 Parameter Extraction 2.3 Accuracy of Signal Processing and Detection of Phonation TypesChapter 3 Modal Voices 3.1 Modal Voice 3.1.1 Case 1 (niimi601) 3.1.2 Case 2 (kaku01) 3.1.3 Case 3 (konn01) 3.1.4 Case 4 (kyu05) 3.1.5 Case 5 (tou02) 3.1.6 Case 6 (kudo01) 3.1.7 Case 7 (mats01) 3.1.8 Case 8 Processed in Leakage Mode (kimu01) 3.1.9 Case 8 Processed in Open Mode (kimu01) 3.2 Modal Voice with High and Low Pitches 3.2.1 Case 9 (konn02) 3.2.2 Case 10 Processed in Leakage Mode (kaku02) 3.2.3 Case 10 Processed in Open Mode (kaku02) 3.2.4 Case 11 Processed in Leakage Mode (kimu02) 3.2.5 Case 11 Processed in Open Mode (kimu02) 3.2.6 Case 12 (mats02) 3.2.7 Case 13 (yana03) 3.2.8 Case 14 (kaku04) 3.2.9 Case 15 (yana02) 3.2.10 Case 16 (iwamo03) 3.3 Properties of Modal Voices 3.3.1 Properties of Modal Voice 3.3.2 Properties of Modal Voices with High and Low PitchesChapter 4 Special Voices 4.1 Falsetto and Vocal Fry 4.1.1 Case 17 (niim04) 4.1.2 Case 18 (kudo02) 4.1.3 Case 19 (kaku03) 4.1.4 Case 20 (mats03) 4.1.5 Case 21 (kimu03) ……Chapter 5 Voices with Gliding Pitch and in Tones of MandarinChapter 6 Nature of GlottisChapter 7 Statistical AnalysisChapter 8 Model of Dynamic GlottisChapter 9 Synthesis of Glottal SourceChapter 10 Conclusions and Suggestions for Further ResearchList of FigureList of TableAbbreviationBibliography
人类言语的产生、演化和形成主要基于类人猿到人类的演化过程中发音器官的进化,它包括人类直立行走以后声道的弯曲和喉头发声器官的形成,而喉头的形成和发展奠定了现代人类言语声源的重要基础。现代言语声学理论认为,言语的产生主要包括嗓音声源和声道共鸣两个部分,语音.学称为“发声”和“调音”。其中,嗓音声源在生理上对应于声带的振动方式。因此,对声带振动和动态声门类型的研究直接涉及到人类自然言语交际、言语工程、言语病理、司法语音、嗓音声乐等言语领域的基础理论问题。 在我国的宋代,人们已经对嗓音声源有了深刻的认识,沈括在他的著作《梦溪笔谈》第十三卷中就记录了当时人们对言语嗓音声源的认识、人造喉的制造和在法庭上的应用。然而,从语音学研究的发展历程上看,人们对语音的科学研究主要在语音的调音方面,而对语言的发声研究很少。随着人们对世界各地语言研究的深入,不同的发声类型被发现,特别是中国境内的民族语言中发现了许多不同的发声类型。但声带的隐蔽性使人们很难直接观察声带的振动方式,从而难以精确描述和研究嗓音的不同发声类型,这在很大程度上阻碍了语言发声类型的研究。计算机和高速数字成像技术的发展,使得人们直到近年来才有可能精确研究声带的振动方式和相对应的嗓音声学性质。 本书就是利用目前国际上研究语言发声中最先进和复杂的高速数字成像技术和语音信号处理技术,对语言的常用发声类型和汉语普通话声调的发声类型进行的研究。研究的样本采集于东京大学医学院,所有样本的采样频率为每秒钟4500帧。图像和语音信号处理系统建立于香港城市大学电子工程系。本书分为六个部分,十个章节。 第一部分由第一章“引言”组成,主要介绍了国际上高速数字成像嗓音研究的形成和发展过程以及基于高速数字成像的语言发声类型研究背景。同时.介绍了本书的目的和读本书所必备的喉部生理解剖知识。 第二部分由第二章“图像处理和参数提取”组成,主要介绍了高速数字成像系统和图像处理及参数提取平台,它包括高速数字成像系统的系统参数、文件格式、图像处理中的旋转、选择、声门面积检测和录像帧间漂移的校正等。同时讨论了动态声门的类型、参数提取方法、统计参数的定义、24个参数的提取算法和用于建模的10项参数的算法和定义。最后讨论了声门图像处理的精度和发声类型的测定。 第三部分由第三章至第五章组成,主要分析研究了常见的语言发声类型和汉语普通话声调的发声类型及声带振动模式。第三章“正常嗓音”主要研究了标准正常嗓音、低音调嗓音和高音调嗓音声带的振动方式、振动特性和与声带振动方式相关的声学性质。第四章“特殊嗓音”研究了特殊嗓音的振动方式、振动特性和声学性质。具体包括假声、气泡音、气嗓音、双音调嗓音和吸气音声带的振动方式、振动特性和相关的声学性质。其中特别讨论了最高音调的假声和最低音调的气泡音的特殊性质以及声带不对称振动的方式、特性和声学结果。第五章“变调嗓音和汉语普通话四声的嗓音”研究和讨论了变调嗓音和汉语普通话四声的发声类型。其中特别讨论了汉语普通话四声的声带振动方式、振动特性和嗓音模式。这是目前唯一有关汉语普通话四声声带振动的高速数字成像资料和研究成果。 第四部分由第六章和第七章组成,主要介绍了动态声门特性的量化分析和特性研究。第六章“声门的性质”主要研究了声门的性质,包括新发现的七种声门脉)中类型和新定义的八种声带振动周期类型。同时还研究了声门面积和声门气流的关系,并建立了声门面积和声门气流之间的关系函数。第七章“统计分析”主要对数据进行了统计分析,包括对数据进行了相关分析和聚类分析,同时也对发声类型进行了相关分析和聚类分析。 第五部分由第八章“动态声门模型”组成,主要研究了基于高速数字成像的动态声门生理模型。其中主要研究和介绍了目前世界上最重要的八种嗓音声学模型,重点介绍了方特等人LF模型。在此基础上讨论了建立生理模型的不同层次、静态声门模型的建模和声门控制函数的建模。最终讨论和介绍了动态声门的生理模型。 第六部分由第九章和第十章组成。主要介绍了基于高速数字成像的嗓音生理参数合成和声带振动的科学研究前景。第九章“嗓音声源的合成”主要讨论嗓音声源的生理合成,其中包括不同声门脉冲的合成、不同声门生理参数的合成和不同发声类型的生理合成,并全面介绍了声门的生理合成方法。第十章“结论和进一步研究的建议”主要总结了全书研究所有的结论、讨论了这一技术对该领域的贡献并探究了基于高速数字成像研究动态声门的未来前景。 本书采用最新的科学技术,从声带生理振动和声学发声类型两个方面研究了言语声源产生的基本原理,是一本研究声带振动和嗓音发声类型基本原理的研究性专著,其成果主要可用于语音学、语言学、生理语音学、言语声学、病理语音学、嗓音声学、声乐学等相关领域。同时还可以当作以上各个领域的教学参考。
作者简介: Mr. Kong Jiangping obtained his bachelor degree of 'English Language and Literature' at Zhengzhou University in 1981, his master degree of 'Linguistics and Phonetics' at the Graduate School of Chinese Academy of Social Sciences in 1988, and his PhD degree of 'Language Engineering' at the Department of Electronic Engineering, City University of Hong Kong in 2001. From 2003, he worked as a professor of phonetics at the Department of Chinese Language and Literature, Peking University. His research interests cover phonation types of languages, models of speech voice quality and oral cultural phenomenon in China. His book On Language Phonation (in Chinese) was published in 2001.