Lucene+Nutch搜索引擎开发

Lucene+Nutch搜索引擎开发

王学松, 编著

出版社:人民邮电出版社

年代:2008

定价:59.0

书籍简介:

搜索引擎是目前互联网最流行的三大应用之一。Lucene开源系统使搜索引擎的普及应用成为可能。本书以Lucene构建搜索引擎的开发过程为主线,由浅入深,循序渐进,为读者展示如何使用Lucene开发自己的搜索引擎系统。全书内容包括搜索引擎概述和原理、Lucene部署安装、Nutch网络蜘蛛与数据获取、:Lucene索引建立、Lucene检索与查询、搜索结果排序、文档分析与中文分词、格式化文本分析、分布式搜索与缓存。为便于读者理解搜索引擎快速开发过程,本书最后几章进行了应用实例讲解,包括Nutch构建专题搜索、Lucene构建企业级搜索实例以及相关的整体工程性能测试。本书适合对搜索引擎开发有兴趣的读者,包括搜索引擎开发的初学者、高校信息专业学生、从事搜索开发的程序设计人员详细阅读,以及希望了解搜索技术的编程爱好者、熟悉Java语言各类开发人员、广大Web网站开发人员了解相关技术。

书籍目录:

第1篇入门篇

第1章搜索引擎概述

1.1什么是搜索引擎

1.1.1搜索引擎与信息检索

1.1.2搜索引擎的概念

1.1.3搜索引擎的使用

1.1.4搜索引擎发展历史

1.2搜索引擎分类

1.2.1按照工作方式分类

1.2.2按照领域范围分类

1.2.3信息类型分类

1.3主流搜索引擎

1.3.1全球著名搜索引擎

1.3.2中文搜索引擎的发展历史

1.3.3著名中文搜索引擎

1.3.4其他细化搜索引擎

1.4搜索引擎评价原则

1.4.1评价指标体系

1.4.2其他评测因素

1.5搜索引擎相关资源

1.5.1搜索引擎开源项目

1.5.2搜索引擎研究网站

1.5.3搜索论坛和厂商黑板报

1.6系统运行环境准备

1.6.1Java环境安装设置

1.6.2Tomcat服务器安装

1.6.3Eclipse开发环境准备

1.7未来搜索技术前瞻

1.7.1现状存在问题

1.7.2未来发展趋势

1.8小结

第2章搜索引擎原理探秘

……

第3章开源搜索引擎入门

第2篇内核揭秘篇

第4章搜索引擎数据获取

第5章搜索引擎信息索引

第6章搜索引擎查询处理

第7章搜索引擎结果排序

第8章文档分析器与中文分词

第9章搜索引擎文本分析

第10章分布式搜索与缓存

第3篇实战篇

第11章Nutch专题搜索引擎实例

第12章Lucene实现企业搜索实例

内容摘要:

  本书以实例代码的形式介绍了使用Lucene构建搜索引擎的基本架构,力求让读者通过阅读本书,掌握使用Lucene开发搜索引擎的基本知识并具备一定的项目实践能力。本书体系完整,内容新颖;注重实效,工程实用;通俗易懂,条理清晰;图例丰富,步骤详尽。适合对搜索引擎开发有兴趣的读者阅读,包括搜索引擎开发的初学者、高等院校、信息专业学生、从事搜索开发的程序设计人员等。  本书以Lucene构建搜索引擎的开发过程为主线,由浅入深,循序渐进,为读者展示如何使用Lucene开发自己的搜索引擎系统。全书内容包括搜索引擎概述和原理、Lucene部署安装、Nutch网络蜘蛛与数据获取、Lucene索引建立、Lucene检索与查询、搜索结果排序、文档分析器与中文分词、格式化文本分析、分布式搜索与缓存等。为便于读者理解搜索引擎快速开发过程,本书最后几章进行了应用实例的讲解,包括Nutch构建专题搜索、Lucene构建企业级搜索实例以及相关的整体工程性能测试。  本书适合对搜索引擎开发有兴趣的读者阅读,包括搜索引擎开发的初学者、高等院校、信息专业学生、从事搜索开发的程序设计人员等。

书籍规格:

书籍详细信息
书名Lucene+Nutch搜索引擎开发站内查询相似图书
9787115182166
如需购买下载《Lucene+Nutch搜索引擎开发》pdf扫描版电子书或查询更多相关信息,请直接复制isbn,搜索即可全网搜索该ISBN
出版地北京出版单位人民邮电出版社
版次1版印次1
定价(元)59.0语种简体中文
尺寸26装帧平装
页数 206 印数

书籍信息归属:

Lucene+Nutch搜索引擎开发是人民邮电出版社于2008.07出版的中图分类号为 TP393.4 的主题关于 因特网-程序设计 的书籍。