出版社:清华大学出版社
年代:2014
定价:40.0
计算语言学是一门涉及语言学、计算机科学和数学等多门学科的交叉学科,覆盖面很广,本书侧重最经典的工作,阐述计算语言学的基本理论和方法。主要介绍现代词汇理论、句法理论和语义理论,词法、句法和语义阶段重要的分析算法。介绍计算语言学的主要应用领域—信息检索、自动分类和机器翻译的基本原理和最新进展。
第1章计算语言学简介
1.1计算语言学
1.1.1计算语言学概念
1.1.2计算语言学与计算机科学
1.1.3计算语言学与语言学
1.1.4计算语言学与数理语言学
1.1.5计算语言学与自然语言
1.2计算语言学主要研究的内容
1.3计算语言学理论的主要用途
1.3.1机器翻译
1.3.2语音自动识别和自动生成
1.3.3自动文摘
1.3.4自动校对
1.3.5自然语言理解
1.3.6信息自动检索
1.3.7自动问答
1.3.8自动分类
1.3.9信息抽取
1.4计算语言学研究的基本方法
1.4.1理性主义和经验主义
1.4.2理性主义和经验主义的区别
1.5计算语言学的发展历程
1.6本章小结
第2章机器词典
2.1《现代汉语语法信息词典》
2.2《同义词词林》
2.3Wordnet
2.4Framenet
2.5《知网》
2.6本章小结
第3章词法分析
3.1汉语的自动分词
3.1.1词与自动分词
3.1.2汉语自动分词的重要性
3.1.3汉语自动分词方法
3.1.4汉语切分歧义及其处理
3.1.5未登录词的处理
3.1.6汉语分词的难点
3.1.7汉语分词评测
3.2屈折语的词法分析
3.2.1屈折语的词法分析
3.2.2屈折语的词法分析技术
3.2.3词法分析的原因
3.2.4词法分析的程度
3.3日语分词
3.3.1日语词语特征
3.3.2日语分词的常用方法
3.3.3日语切词和词性标注
3.3.4日语开源切分和标注器
3.4本章小结
第4章词性标注
4.1词性标注概述
4.2词性标注集
4.3词性标注的研究方法
4.3.1规则方法
4.3.2统计方法进行词性标注
4.3.3统计与规则相结合的方法
4.3.4基于转换的错误驱动学习
4.4本章小结
第5章形式语言理论与自动机
5.1形式语言理论
5.1.1形式语法
5.1.2形式语法组成
5.1.3形式语法的定义
5.1.4形式语法的特点
5.1.5研究形式语法的必要性
5.1.6语法的类型
5.2自动机理论
5.2.1图灵机
5.2.2线性有界自动机
5.2.3有限自动机
5.2.4下推自动机
5.3乔姆斯基层级和自然语言
5.3.1文法、自动机和语言的关系
5.3.2哪一种语法最宜于用来生成自然语言的句子
5.4本章小结
第6章现代句法理论
6.1转换生成语法
6.1.1经典理论
6.1.2乔姆斯基的标准理论
6.1.3扩充式标准理论
6.2广义的短语结构语法
6.2.1引言
6.2.2句法规则
6.2.3特征制约系统
6.2.4语义解释系统
6.3树粘接语法
6.4中心词驱动的短语结构语法
6.5功能合一文法
6.5.1复杂特征集
6.5.2合一运算
6.6词汇功能文法
6.6.1引言
6.6.2基本成分
6.6.3词库部分
6.6.4LFG的两个语法层次结构
6.6.5功能合格条件
6.6.6词汇功能语法特点
6.7范畴语法
6.8依存语法
6.9链语法(Link Grammar)
6.10本章小结
第7章句法分析
7.1句法分析概念
7.1.1分析策略
7.1.2句法分析
7.2有限状态转移网络、递归转移网络和扩充转移网络
7.2.1有限状态转移网络
7.2.2递归转移网络
7.2.3扩充转移网络
7.3自顶向下剖析
7.4厄尔利算法
7.5LR分析算法
7.5.1LR(0)算法
7.5.2LR(1)算法
7.5.3对LR(k)算法的评价
7.6富田胜算法
7.7自底向上的线图算法
7.8自底向上与自顶向下相结合的线图分析算法
7.9CYK算法
7.10本章进一步讨论
7.11本章小结
第8章语义理论与语义分析
8.1格语法
8.1.1格的含义
8.1.2格语法
8.1.3词汇部分
8.1.4转换部分
8.1.5使用格语法进行语义分析:格框架约束分析技术
8.1.6格语法描写汉语的局限性
8.2语义网络文法
8.2.1语义网络的概念
8.2.2语义网络的概念关系
8.2.3事件的语义网络表示
8.2.4事物间语义关系
8.2.5用语义网络进行推理
8.2.6用语义网络来翻译
8.2.7基于语义网络的汉语处理
8.3义素分析法
8.4优选语义学
8.4.1语义元素
8.4.2语义公式
8.4.3语义模式
8.4.4使用优选理论翻译英法句子的处理过程
8.4.5优选语义学主要特点
8.5蒙塔格语法
8.5.1引言
8.5.2MG句法部分
8.5.3MG翻译部分
8.5.4MG语义部分
8.6本章进一步讨论
第9章统计语言学
9.1概率统计与信息论基础
9.2语料库发展与加工技术
9.2.1语料库的发展与加工
9.2.2语料库的作用
9.3概率语法
9.3.1n元语法
9.3.2隐马尔可夫模型及其应用
9.3.3概率上下文无关语法及其应用
9.4双语语料库中的对齐技术
9.4.1基于长度的句子对齐
9.4.2基于词汇的句子对齐
9.5支持向量机
9.6最大熵模型
9.7参数平滑算法
9.8本章小结
第10章机器翻译
10.1机器翻译的概念
10.2机器翻译方法
10.2.1直接翻译法(第一代机器翻译系统)
10.2.2基于转换的方法
10.2.3基于中间语言方法
10.2.4统计机器翻译
10.2.5基于实例方法
10.3机器翻译难点
10.4机器翻译系统采取的其他策略
10.5机器翻译发展原因
10.6机器翻译的应用
10.7机器翻译自动评测方法
10.8本章小结
......
计算语言学是一门涉及语言学、计算机科学和数学等多门学科的交叉学科,覆盖面广。本书侧重最经典的工作,阐述计算语言学的基本理论和方法,主要介绍现代句法理论和语义理论,词法、句法和语义阶段重要的分析算法、统计语言学和机器翻译。本书结构完整,层次分明,条理清楚;既便于教学,又便于自学。可作为中文、外语、计算机等专业高年级本科生和研究生教材,也可供从事自然语言处理或信息处理的研究者参考。