通过句法位置提取中文关键词的实验研究

通过句法位置提取中文关键词的实验研究

王家钺, 著

出版社:苏州大学出版社

年代:2011

定价:20.0

书籍简介:

本书详尽描述了自然语言处理尤其是信息检索的各种主要方法,并对信息检索领域“相关性”这一核心概念做了非常充分的回顾与文献综述,在此基础上提出了基于句法位置提取关键词的初步设想。

作者介绍:

王家钺,广西师范大学外国语学院英语语言文学系主任、博士、副教授、硕士研究生导师。从事应用语言学、语料库语言学、计算机辅助翻译等领域的研究。在《外语界》《现代外语》等刊物上发表论文多篇,主持省厅级课题2项。

书籍目录:

Chapter 1 Introduction

1.2 Discussions on KE methods

Chapter 2 Information retrieval: the ultimate goal

2.1 Introduction

2.3.1 Free text string searching

2.4.1 The Vector Space Model

2.4.2 Probabilistic approaches

2.4.3 Document classification and clustering

2.5 Linguistic approaches to IR

2.5.1 Problems with statistical methods

2.5.2 Non-statistical methods

2.7 Nominal phrases

2.7.1 Significance

2.7.2 Phrase detection and extraction

2.7.3 Base NPs

2.8 Summary

Chapter 3 Web search and relevance: trigger and rationale

3.1 Web search: a good landing for IR discussions

3.2 The "hypertext challenge"?

3.3 Search engines: performance and problems

3.4 IR and relevance

3.5 Relevance studies

3.5.1 Anatomy of the concept

3.5.2 Relevance assessment variation

3.5.3 System-oriented relevance ,

3.5.4 User-oriented relevance

3.5.5 System-oriented definitions of relevance

3.6 Discussion and re-definition

Chapter 4 Keyword extraction: methodology and practices

4.1 KE: a good aid for IR

4.2 What is "topic"?

4.3 KE review

4.3.1 Text segmentation and topic extraction

……

Chapter 5 Experiments

Chapter 6 Conclusions and further research

Bibliography

Appendices

内容摘要:

《独秀外国语言文学博士文库:通过句法位置提取中文关键词的实验研究》详尽描述了自然语言处理尤其是信息检索的各种主要方法,并对信息检索领域“相关性”这一核心概念进行了回顾与综述,在此基础上提出了基于句法位置提取关键词的初步设想,通过小型问卷调查证明了基本名物性短语的重要性。在实验部分,作者以从某技术型网站搜集的小型文本库为实验对象,首先证明了不同文本位置以及不同句法层级上产生关键词的可能性有显著差异。随后使用向量空间模型(VSM)提取其关键词,然后对文本库中的基本名物性短语的句法位置进行手工标注,通过这些位置提取关键词,再将二者进行对比。实验表明,通过句法位置提取的关键词与通过VSM提取的关键词没有显著差异。最后作者对这些实验结果进行了讨论。

书籍规格:

书籍详细信息
书名通过句法位置提取中文关键词的实验研究站内查询相似图书
丛书名独秀外国语言文学博士文库
9787811378214
《通过句法位置提取中文关键词的实验研究》pdf扫描版电子书已有网友提供下载资源链接
出版地苏州出版单位苏州大学出版社
版次1版印次1
定价(元)20.0语种简体中文
尺寸21 × 15装帧平装
页数印数

书籍信息归属:

通过句法位置提取中文关键词的实验研究是苏州大学出版社于2011.10出版的中图分类号为 TP391 的主题关于 自然语言处理 的书籍。