基于人工神经网络的机器翻译

基于人工神经网络的机器翻译

许罗迈, 著

出版社:科学出版社

年代:2007

定价:26.0

书籍简介:

本书对机器翻译的各种理论、技术、和产品作了较为详尽的综述,分析了基于符号系统的机器翻译技术和基于语料库统计的机器翻译技术的优缺点。书中进一步回顾了人工神经网络技术在自然语言处理领域的研究状况。从大量的文献分析来看,截至2006年,人工神经网络技术还未被用于机器翻译系统全过程的开发中。本书借鉴了基于语料库统计的机器翻译研究成果,把机器翻译分为翻译模式和语言模式两种处理过程。书中分析了以往利用人工神经网络进行自然语言处理的缺点,提出用分布式神经网络体系解决翻译模式的训练,较好地解决了单一网络学习能力有限的问题,对神经网络语言处理技术提出了新的思路,有望在其它自然语言处理领域带来新的突破,有一定的学术意义。本书在应用神经网络处理语言模式方面,也提出了新的解决方案,改变了以往神经网络以复杂句法、语义特征为训练对象的普遍做法,采用词性标注为训练对象,以自创的一套词语移动符号为训练目标的神经网络处理方法,并且开发了一种算法,调整目标语词序,达到获得可以接受的译文的效果。这是一种独特的处理方法。虽然作者指出这种方法未能得到预期的结果,但是如果能够如作者提出的把分布式神经网络体系也用于语言模式的训练,这种独特的方法成败与否还未可知。本书提出的分布式神经网络体系在学习翻译模式的过程中需要的训练数据只有一、两千词,与基于语料库统计的机器翻译方法相比,因为后者需要大量(数十万乃至数百万词)的双语语料,这种方法的效率显然较高。书中说明,普通的双语人员就可以胜任新型的加工数据的工作,不需要受过语言学专业训练的人员,这也在一定程度上降低了机器翻译系统开发工作难度,是一种值得注意的特点。

书籍目录:

Preface

Acknowledgements

Chapter One Prologue

Chapter Two MT state of the art

2.1 MT as symbolic systems

2.2 Practical MT

2.3 Alternative technique of MT

2.3.1 Theoretical foundation

2.3.2 Translation model

2.3.3 Language model

2.4 Discussion

Chapter Three Connectionist solutions

3.1 NLP models

3.2 Representation

3.3 Phonological processing

3.4 Learning verb past tense

3.5 Part of speech tagging

3.6 Chinese collocation learning

3.7 Syntactic parsing

3.7.1 Learning active/passive transformation

3.7.2 Confluent preorder parsing

3.7.3 Parsing with fiat structures

3.7.4 Parsing embedded clauses

3.7.5 Parsing with deeper structures

3.8 Discourse analysis

3.8.1 Story gestalt and text understanding

3.8.2 Processing stories with scriptural knowledge

3.9 Machine translation

3.10 Conclusion

Chapter Four NeuroTrans design considerations

4.1 Scalability and extensibility

4.2 Transfer or inter lingual

4.3 Hybrid or fully connectionist

4.4 The use of linguistic knowledge

4.5 Translation as a two stage process

4.6 Selection of network models

4.7 Connectionist implementation

4.8 Connectionist representation issues

4.9 Conclusion

Chapter Five A neural lexicon model

5.1 Language data

5.2 Knowledge representation

5.2.1 Symbolic approach

5.2.2 The statistical approach

5.2.3 Connectionist approach

5.2.4 NeuroTrans input/output representation

5.2.5 NeuroTrans lexicon representation

5.3 Implementing the neural lexicon

5.3.1 Words in context

5.3.2 Context with weights

5.3.3 Details of algorithm

5.3.4 The Neural Lexicon Builder

5.4 Training

5.4.1 Sample preparation

5.4.2 Training results

5.4.3 Generalization test

5.5 Discussion

5.5.1 Adequacy

5.5.2 Scalability and Extensibility

5.5.3 Efficiency

5.5.4 Weaknesses

Chapter Six Implementing the language model

6.1 Overview

6.2 Design

6.2.1 Redefining the generation problem

6.2.2 Defining jumble activity

6.2.3 Language model structure

6.3 Implementation

6.3.1 Network structure Sampling Training and results

6.3.2 Generalization test

6.4 Discussion

6.4.1 Insufficient data

6.4.2 Information richness

6.4.3 Insufficient contextual information

6.4.4 Distributed language model

Chapter Seven Conclusion

Chapter Eight References

Index

内容摘要:

《基于人工神经网络的机器翻译》基于语料库统计的机器翻译模式把机器翻译分为翻译模式和语言模式两种处理过程,作者尝试把人工神经网络技术应用于两种模式的处理,使之应用于机器翻译的全过程,是一项创造性工作,作者采用神经元自学习的方法,从少量实例开始,系统通过自学习建立机器词库和对应的译文,本研究实验证明对于确定的领域,该系统可以输出相当通顺的目的语,这种用分布式神经网络体系解决翻译模式的训练,较好地解决了单一网络学习能力有限的问题,对神经网络语言处理技术开发了新思路,有相当意义。
作者在应用神经网络处理语言模式方面,也提出了新的解决方案,改变了以往神经网络以复杂句法、语义特征为训练对象的普遍做法,采用词性标注为训练对象,以自创的一套词语移动符号基为训练目标的神经网络处理方法,是一种独特的处理方法,虽然作者指出这种方法未能得到预期的结果,但是如果能够如作者提出的把分布式神经网络体系也用于语言模式的训练,这种独特的方法成败与否还未可知。

书籍规格:

书籍详细信息
书名基于人工神经网络的机器翻译站内查询相似图书
9787030189813
如需购买下载《基于人工神经网络的机器翻译》pdf扫描版电子书或查询更多相关信息,请直接复制isbn,搜索即可全网搜索该ISBN
出版地北京出版单位科学出版社
版次1版印次1
定价(元)26.0语种英文
尺寸21装帧平装
页数印数

书籍信息归属:

基于人工神经网络的机器翻译是科学出版社于2007.出版的中图分类号为 TP183 的主题关于 人工神经元网络-机器翻译-研究-英文 的书籍。