出版社:河南科学技术出版社
年代:2009
定价:25.0
本书系统介绍了中文信息处理中的词语、组块(短语)、句子和文本四个不同粒度的相似度计算方法与技术实现。全书主要内容共分三大部分:第一部分(第1章、第2章)介绍了相似度计算的重要意义、研究进展以及在计算过程中经常使用的基础性资源(包括采用的词法分析程序、词典和语料库电子资源);第二部分(第3~6章)是本书的重点章节,从词语、组块、句子一直到文档级别,逐层讲述了相似度计算的特点及方法;第三部分(第7章、第8章)则介绍了相似度计算在自然语言接口、FAQ问答中的两种典型应用。本书层次分明,实用性强,既有深入的理论分析,又附带相关的技术实现,具有参考借鉴和直接应用双重意义。本书可以作为高等院校计算机科学与技术、情报学、信息管理与信息系统等专业的研究生或高年级本科生的教学参考书和技术资料,对广大从事自动问答、Web挖掘、知识工程等研究和应用开发的技术人员也有极高的参考价值。