统计自然语言处理

统计自然语言处理

宗成庆, 编著

出版社:清华大学出版社

年代:2007

定价:70.0

书籍简介:

本书介绍统计自然语言处理的基本概念,理论方法和研究进展等。

作者介绍:

宗成庆,1998年3月毕业于中国科学院计算技术研究所,获博士学位。1998年5月至2000年4月在中国科学院自动化研究所模式识别国家重点实验室从事博士后研究,博士后出站以后留在模式识别国家重点实验室工作至今。曾于1999年和2001年两次在日本国际电气通信基础技术研究所(ATR)做客座研究员,2004年在法国格勒诺布尔(Grenoble)信息与应用数学研究院(IMAG)做短期高访,现为模式识别国家重点实验室副主任、研究员、博士生导师。 近几年来,他主要从事自然语言处理的理论与方法、机器翻译、人机对话系统等技术的研究和教学工作,作为项目负责人承担国家自然科学基金项目、国家“863”项目、国家支撑计划项目和国际合作项目等10余项,在Machine Translation,IEEE TASLP,ACM TALIP等国内外重要学术刊物和会议上发表论文60作篇,获多项国家发明专利。现任国际信息联合会(IFIP)人机交互技术委员会委员,亚洲自然语言处理联合会(AFNLP)执行理事,中国人工智能学会理事及自然语言处理专业委员会副主任,中国中文信息学会理事,中国科学院研究生院兼职教授,清华大学中国语言文学系讲座教授,山东大学兼职教授和北京邮电大学兼职教授,以及多个国际、国内学术期刊的编委,若干国际、国内学术会议的程序委员会主席、委员等职务。

书籍目录:

第1章 绪论

1.1 基本概念

1.1.1 语言学与语音学

1.1.2 自然语言处理

1.1.3 关于“理解”的标准

1.2 自然语言处理研究的内容和面临的困难

1.2.1 自然语言处理研究的内容

1.2.2 自然语言处理涉及的几个层次

1.2.3 自然语言处理面临的困难

1.3 自然语言处理的基本方法及其发展

1.3.1 自然语言处理的基本方法

1.3.2 自然语言处理的发展

1.4 自然语言处理的研究现状

第2章 预备知识

2.1 概率论基本概念

2.1.1 概率

2.1.2 最大似然估计

2.1.3 条件概率

2.1.4 贝叶斯法则

2.1.5 随机变量

2.1.6 二项式分布

2.1.7 联合概率分布和条件概率分布

2.1.8 贝叶斯决策理论

2.1.9 期望和方差

2.2 信息论基本概念

2.2.1 熵

2.2.2 联合熵和条件熵

2.2.3 互信息

2.2.4 相对熵

2.2.5 交叉熵

2.2.6 困惑度

2.2.7 噪声信道模型

2.3 支持向量机

2.3.1 线性分类

2.3.2 线性不可分

2.3.3 构造核函数

第3章 形式语言与自动机

3.1 基本概念

3.1.1 图

3.1.2 树

3.1.3 字符串

3.2 形式语言

3.2.1 概述

3.2.2 形式语法的定义

3.2.3 形式语法的类型

3.2.4 CFG识别句子的派生树表示

3.3 自动机理论

3.3.1 有限自动机

3.3.2 正则文法与自动机的关系

3.3.3 上下文无关文法与下推自动机

3.3.4 图灵机

3.3.5 线性界限自动机

3.4 自动机在自然语言处理中的应用

3.4.1 单词拼写检查

3.4.2 单词形态分析

3.4.3 词性消歧

第4章 语料库与词汇知识库

4.1 语料库技术

4.1.1 概述

4.1.2 语料库语言学的发展

4.1.3 语料库的类型

4.1.4 典型语料库介绍

4.1.5 汉语语料库建设中的问题

4.2 词汇知识库

……

第5章 语言模型

第6章 隐马尔可夫模型

第7章 汉语自动分词与词性标注

第8章 句法分析

第9章 语义消歧

第10章 统计机器翻译

第11章 语音翻译

第12章 文本分类

第13章 信息检索与问答系统

第14章 自动文摘与信息抽取

第15章 口语信息处理与人机对话系统

附录 项目作业

名词术语索引

参考文献

内容摘要:

本书全面介绍了统计自然语言处理的基本概念、理论方法和最新研究进展,内容包括形式语言与自动机及其在自然语言处理中的应用、语言模型、隐马尔可夫模型、语料库技术、汉语自动分词与词性标注、句法分析、词义消歧、统计机器翻译、语音翻译、文本分类、信息检索与问答系统、自动文摘和信息抽取、口语信息处理与人机对话系统等,既有对基础知识和理论模型的介绍,也有对相关问题的研究背景、实现方法和技术现状的详细阐述。本书可作为高等院校计算机、信息技术等相关专业的高年级本科生或研究生的教材或参考书,也可供从事自然语言处理、数据挖掘和人工智能等研究的相关人员参考。

编辑推荐:

《中文信息处理丛书·统计自然语言处理》可作为高等院校计算机、信息技术等相关专业的高年级本科生或研究生的教材或参考书,也可供从事自然语言处理、数据挖掘和人工智能等研究的相关人员参考。

书籍规格:

书籍详细信息
书名统计自然语言处理站内查询相似图书
丛书名中文信息处理丛书
9787302165989
如需购买下载《统计自然语言处理》pdf扫描版电子书或查询更多相关信息,请直接复制isbn,搜索即可全网搜索该ISBN
出版地北京出版单位清华大学出版社
版次1版印次1
定价(元)70.0语种简体中文
尺寸26装帧平装
页数印数 3000

书籍信息归属:

统计自然语言处理是清华大学出版社于2007.12出版的中图分类号为 TP391 的主题关于 统计方法-应用-自然语言处理 的书籍。