词语计算与应用
词语计算与应用封面图

词语计算与应用

刘华, 编著

出版社:暨南大学出版社

年代:2010

定价:20.0

书籍简介:

本书结合词汇学和计算语言学方法,利用词汇理论和数据挖掘,在新词语自动发现、词语领域分类聚类、基于词语常用度和词语聚类的辅助汉语教学、基于词语主题度计算的文本内容综合标引等方面,进行了一些尝试。

作者介绍:

刘华,男,1975年生,暨南大学副教授。2005年毕业于北京语言大学中文信息处理专业,师从张普教授,获博士学位,主攻自动标引、计算语言学和计算语言学辅助汉语教学。近五年来,在核心期刊发表论文二十余篇,多篇被EI索引;目前,主持国家级课题一项,省部级课题多项。

书籍目录:

1 领域新词语快速获取

1.1 新词语识别和聚类综述

1.2 基于分类网页链接分析的领域新词语发现

1.3 分类新词语分析

1.3.1 词语抽取的准确率与排错处理

1.3.2 抽取词语的新词率

1.3.3 新词语在切分中的作用

1.3.4 新词语的强文本表示功能

小结

参考文献

2 词语分类和词语聚类

2.1 词语分类和词语聚类综述

2.2 基于分类特征提取的词语分类

2.2.1 定义说明

2.2.2 特征提取方法分析

2.2.3 词语表与训练语料介绍

2.2.4 算法实现

2.2.5 实验结果分析

2.2.6 实验结果举例

2.3 基于大规模分类语料库关键词标引的词语聚类

2.3.1 超大规模分类语料库和词语表说明

2.3.2 利用关键词标引确定种子词语

2.3.3 在大规模分类语料库中聚类词语

2.3.4 聚类词语集成

2.3.5 算法实现

2.3.6 实验结果和分析

小结

参考文献

3 词语计算与辅助汉语教学

3.1 计算机辅助汉语教学综述

3.2 辅助汉语教学的语料库建设

3.3 词语搭配自动获取

3.4 词汇常用度计算

3.5 例句难易度计算

3.6 基于语料库的对外汉语教学用分类词表的研制

3.6.1 分类词表的特点和任务描述

3.6.2 分类词表的研制原理

3.6.3 分类词表的研制流程

3.6.4 几点说明

3.7 面向对外汉语教学的话题聚类研究

3.7.1 报刊阅读与话题课

3.7.2 话题与话题词簇

3.7.3 报刊阅读课现状分析与目标描述

3.7.4 系统实现及结果分析

小结

参考文献

4 词语主题度计算与自动标引

4.1 词语主题度数学模拟

4.1.1 词语主题度计算的理论基础

4.1.2 词语主题度数学模拟

4.2 基于词语主题度的标引知识自动获取

4.2.2 专家标引的网页关键词获取

4.2.2 关键词主题度计算

4.3 基于词语主题度的文献综合自动标引

4.3.1 文献综合自动标引概述

4.3.2 文献综合自动标引总体流程

4.3.3 关键词文档权重计算

4.3.4 关键词自动标引实现

4.3.5 自动文摘实现

4.3.6 基于关键短语的立体文本分类模型

4.4 文献情报自动标引系统介绍

4.4.1 系统概述

4.4.2 面向的行业类型

4.4.3 功能模块

小结

参考文献

附录1 网络新闻用层级分类体系

附录2 15大类分类词语表

附录3 244个层级小类分类词语

附录4 聚类种子词语

附录5 聚类词语

附录6 HSK(商务)词语表

后记

内容摘要:

《词语计算与应用》共有四章,除了附录、后记外,核心内容词语的计算与应用,主要包括“领域新词语快速获取”、“词语分类和词语聚类”、“词语计算与辅助汉语教学”、“词语主题度计算与自动标引”几个方面,这些也都是目前理工科(包括图书馆的情报检索)关注的热门课题,属于人文学科与理工学科交叉的边缘领域。语言信息处理、自然语言理解、人工智能、机器翻译等都是这一边缘领域的学科或课题。理工专业人士研究此类项目时,要补充人文专业知识(如语言学);人文专业人士研究此类项目,要补充理工专业知识(如计算机科学、数理科学)。相对而言,补充人文专业知识较容易,补充理工专业知识则较困难。也就是说,搞计算语言学,文科出身者比理工科出身者面临的压力大。通常,理工科的人写的计算语言学的论著,满篇术语公式,文科读者觉得犹如读“天书”,但是刘华博士的《词语计算与应用》并非如此。因为是文科出身的人写给文科出身的人读的书,作为一个“过来人”,他能设身处地为读者着想,每个术语都有诠释,甚至每个公式都有解读,文科的人读来并不觉得过于深奥晦涩。

书籍规格:

书籍详细信息
书名词语计算与应用站内查询相似图书
9787811354881
如需购买下载《词语计算与应用》pdf扫描版电子书或查询更多相关信息,请直接复制isbn,搜索即可全网搜索该ISBN
出版地广州出版单位暨南大学出版社
版次1版印次1
定价(元)20.0语种简体中文
尺寸26 × 16装帧平装
页数印数

书籍信息归属:

词语计算与应用是暨南大学出版社于2010.4出版的中图分类号为 H136 的主题关于 汉语-词语-言语统计-研究 的书籍。