术语相似度计算方法研究

术语相似度计算方法研究

徐健, 著

出版社:中山大学出版社

年代:2012

定价:38.0

书籍简介:

对术语相似度的研究,为多种知识发现和自然语言处理任务的开展创造了条件。本书在全面介绍当前各种典型术语相似度计算思路的基础上,针对应用中实际存在的问题,提出或改进了基于语词、语境以及网络资源的相似度指标计算方法,并设计实现了多种相似度指标高效集成计算模型,有效提高了术语相似度计算的综合性能。

书籍目录:

第1章 绪论

1.1 术语相似度计算研究缘起

1.2 研究的目的及意义

1.2.1 研究目的

1.2.2 研究意义

1.3 相关概念界定

1.3.1 术语

1.3.2 术语语义相似度

1.4 研究思路与方法

1.4.1 研究思路

1.4.2 研究方法

1.5 本书内容组织结构

第2章 术语相似度计算研究概述

2.1 术语相似度计算相关研究

2.1.1 术语相似性测度研究

2.1.2 基于语词构成特征的术语相似度算法研究

2.1.3 基于句法特征的术语相似度算法研究

2.1.4 基于语境特征的术语相似度算法研究

2.1.5 基于语词知识体系的术语相似度算法研究

2.1.6 基于网络知识资源的术语相似度算法研究

2.1.7 术语相似度指标集成算法研究

2.1.8 术语语义相似度计算应用研究

2.2 术语相似度计算技术路线评述

2.2.1 典型算法计算思路的特点

2.2.2 典型算法计算思路的不足

2.3 术语相似度计算改进思路

2.3.1 计算方法的改进

2.3.2 集成模型的改进

2.4 小结

第3章 术语主词软匹配相似度算法研究

3.1 SSHW算法的提出

3.2 SSHW算法思想及算法设计

3.2.1 SSHW算法思想

3.2.2 SSHW算法设计

3.3 SSHW算法实现

3.4 SSHW算法评测

3.4.1 实验目的

3.4.2 实验数据

3.4.3 实验过程

3.4.4 数据分析

3.4.5 实验结论

3.5 小结

第4章 Hearst句法模板相似度改进算法研究

4.1 Hearst句法模板相似度算法改进思路

4.2 算法设计

4.2.1 算法设计思路

4.2.2 算法表达

4.3 算法实现

4.3.1 句法模板构建

4.3.2 计算过程

4.4 算法评测

4.4.1 实验目的

4.4.2 实验数据

4.4.3 实验过程

4.4.4 数据分析

4.4.5 实验结论

4.5 小结

第5章 语境依赖关系模式相似度算法研究

5.1 DRCP算法的提出

5.2 DRCP算法思想及算法设计

5.2.1 DRCP算法思想

5.2.2 DRCP算法设计

5.3 DRCP算法实现

5.4 DRCP算法评测

5.4.1 实验目的

5.4.2 实验数据

5.4.3 实验过程

5.4.4 数据分析

5.4.5 实验结论

5.5 小结

第6章 领域限定网络检索相似度算法研究

6.1 Web-PMI算法的改进思路

6.2 算法改进设计

6.2.1 基于领域特征的检索式构造

6.2.2 基于命中数的术语相似度计算

6.3 算法实现

6.3.1 算法结构

6.3.2 搜索引擎的选择

6.4 算法评测

6.4.1 实验目的

6.4.2 实验数据

6.4.3 实验过程

6.4.4 数据分析

6.4.5 实验结论

6.5 小结

第7章 基于机器学习的术语相似度集成计算模型

7.1 集成计算模型的提出

7.2 集成计算设计

7.2.1 学习阶段模型设计

7.2.2 计算阶段框架设计

7.3 集成计算实现

7.3.1 相似度网络初始化

7.3.2 相似度网络的检索和推导机制

7.3.3 语词相似度计算

7.3.4 句法相似度计算

7.3.5 语境相似度计算

7.3.6 搜索引擎相似度计算

7.3.7 相似度指标的SVM集成

7.4 集成计算评测

7.4.1 实验目的

7.4.2 实验数据

7.4.3 实验过程

7.4.4 数据分析

7.4.5 实验结论

7.5 小结

第8章 结束语

参考文献

内容摘要:

《术语相似度计算方法研究》由徐健所著,本书在全面介绍当前各种典型术语相似度计算思路的基础上,针对应用中实际存在的问题,提出或改进了基于语词、基于语境以及基于网络资源的术语相似度指标计算方法,设计和实现了多种相似度指标高效集成计算模型,有效地提高了术语相似度计算的综合性能,可作为自然语言处理、知识发现等相关方向的教学、科研人员研究的参考资料。《术语相似度计算方法研究》由徐健所著,对术语相似度计算方法的研究,为多种知识发现和自然语言处理任务的开展创造了条件。尽管术语相似度计算相关研究已经或正在探索基于各种特征或知识资源开展术语相似关系挖掘任务的思路和技术方法,但是在相似度指标的计算以及高效集成多种术语相似度指标方面仍存在较多问题。本书在全面介绍当前各种典型术语相似度计算思路的基础上,针对应用中实际存在的问题,提出或改进了基于语词、基于语境以及基于网络资源的术语相似度指标计算方法,设计和实现了多种相似度指标高效集成计算模型,有效地提高了术语相似度计算的综合性能。 《术语相似度计算方法研究》可作为自然语言处理、知识发现等相关方向的教学、科研人员研究的参考资料。【作者简介】徐健(1977一),男,中山大学资讯管理学院讲师,情报学博士。2000年在西安交通大学获学士学位,2003年在中山大学获硕士学位,2010年在中国科学院获情报学博士学位。2003年7月在中山大学硕士毕业后留校任教至今。主要研究方向为:①智能信息处理;②网络信息挖掘;③术语相似度计算及应用技术。已发表研究论文30篇。目前主持1项教育部人文社会科学研究项目“从科技文献中挖掘术语相似性及其在知识发现中的应用”,1项国家社会科学基金项目“用户评论情感分析及其在竞争情报服务中的应用研究”,并参与多项国家、省部级科研项目工作。

书籍规格:

书籍详细信息
书名术语相似度计算方法研究站内查询相似图书
9787306043078
《术语相似度计算方法研究》pdf扫描版电子书已有网友提供下载资源链接
出版地广州出版单位中山大学出版社
版次1版印次1
定价(元)38.0语种简体中文
尺寸26 × 18装帧平装
页数 282 印数

书籍信息归属:

术语相似度计算方法研究是中山大学出版社于2012.10出版的中图分类号为 TP391.1 的主题关于 自然语言处理-研究 的书籍。