出版社:电子工业出版社
年代:2014
定价:65.0
本书基于ElasticSearch的0.2版本,覆盖了ElasticSearch各种功能和命令的应用,全面、详细地介绍了开源、分布式、RESTful,具有全文检索功能的搜索引擎ElasticSearch。本书着重介绍了ElasticSearch的基本功能和用法,包括ElasticSearch的安装和配置、REST API的使用方法,以及怎样使用Query DSL语句进行查询、过滤、排序等。
第1章 ElasticSearch集群入门 1.1 什么是ElasticSearch 1.1.1 索引 1.1.2 文档 1.1.3 文档类型 1.1.4 节点和集群 1.1.5 分片 1.1.6 副本 1.2 安装和配置ElasticSearch集群 1.3 目录结构 1.4 配置ElasticSearch 1.5 运行ElasticSearch 1.6 关闭ElasticSearch 1.7 作为系统服务运行ElasticSearch 1.8 基于REST API的数据操作 1.8.1 什么是REST 1.8.2 在ElasticSearch中存储数据 1.8.3 创建新文档 1.8.4 检索文档 1.8.5 更新文档 1.8.6 删除文档 1.9 手工创建索引与配置映射 1.9.1 索引 1.9.2 文档类型 1.9.3 索引操作 1.9.4 模式映射 1.10 动态映射和模板 1.10.1 类型确定机制 1.10.2 动态映射 1.10.3 模板 1.11 路由选择的重要性 1.11.1 如何进行索引 1.11.2 搜索是如何工作的 1.11.3 路由选择 1.11.4 routing参数 1.11.5 _routing字段 1.12 索引别名及其用途 1.12.1 别名的定义 1.12.2 创建别名 1.12.3 修改别名 1.12.4 两种命令的组合 1.12.5 获得所有的别名 1.12.6 过滤别名 1.12.7 别名和路由选择 1.13 本章小结 第2章 搜索数据 2.1 查询和索引的过程 2.2 本章案例使用的映射 2.3 查询ElasticSearch 2.3.1 简单查询 2.3.2 分页和结果规模 2.3.3 返回版本号 2.3.4 限制结果分数 2.3.5 指定返回字段 2.3.6 使用script_fields 2.3.7 选择合适的搜索类型(高级选项) 2.3.8 指定搜索执行的位置(高级选项) 2.4 基本查询 2.4.1 term查询 2.4.2 terms查询 2.4.3 match查询 2.4.4 multi_match查询 2.4.5 query_string查询 2.4.6 field查询 2.4.7 ids查询 2.4.8 prefix查询 2.4.9 fuzzy_like_this查询 2.4.10 fuzzy_like_this_field查询 2.4.11 fuzzy查询 2.4.12 match_all查询 2.4.13 wildcard查询 2.4.14 more_like_this查询 2.4.15 more_like_this_field查询 2.4.16 range查询 2.4.17 查询重写 2.5 过滤查询结果 2.5.1 使用过滤器 2.5.2 range过滤器 2.5.3 exists过滤器 2.5.4 missing过滤器 2.5.5 script过滤器 2.5.6 type过滤器 2.5.7 limit过滤器 2.5.8 ids过滤器 2.5.9 其他功能 2.5.10 bool、and、or和not过滤器 2.5.11 过滤器的命名 2.5.12 过滤器的缓存 2.6 复合查询 2.6.1 bool查询 2.6.2 boosting查询 2.6.3 constant_score查询 2.6.4 indices查询 2.6.5 custom_filters_score查询 2.6.6 custom_boost_factor查询 2.6.7 custom_score查询 2.7 数据排序 2.7.1 默认排序 2.7.2 选择用于排序的字段 2.7.3 指定缺失字段的行为 2.7.4 动态标准 2.7.5 排序归类和不同国家的字符 2.8 使用脚本 2.8.1 脚本中可用的对象 2.8.2 MVEL 2.8.3 其他语言 2.8.4 脚本库 2.8.5 本地代码 2.9 本章小结 第3章 扩展结构与搜索 3.1 索引非平面数据 3.1.1 数据 3.1.2 对象 3.1.3 数组 3.1.4 映射 3.1.5 开启还是关闭动态映射 3.1.6 向ElasticSearch发送映射文件 3.2 利用额外的内部信息扩展索引结构 3.2.1 标识符字段 3.2.2 _type字段 3.2.3 _all字段 3.2.4 _source字段 3.2.5 _boost字段 3.2.6 _index字段 3.2.7 _size字段 3.2.8 _timestamp字段 3.2.9 _ttl字段 3.3 高亮 3.3.1 高亮功能入门 3.3.2 字段配置 3.3.3 底层实现 3.3.4 配置HTML标签 3.3.5 控制高亮片段 3.3.6 全局与局部设置 3.3.7 仅显示匹配字段 3.4 自动补全 3.4.1 prefix查询 3.4.2 edgeNGram 3.4.3 统计 3.5 处理文件 3.6 地理信息 3.6.1 为空间搜索准备映射 3.6.2 示例数据 3.6.3 示例查询 3.6.4 geo_bounding_box过滤器 3.6.5 限定距离 3.7 本章小结 第4章 搜索优化 4.1 为什么文档被检索到 4.1.1 理解字段分析过程 4.1.2 解释查询 4.2 用加权查询影响得分 4.2.1 什么是权值(boost) 4.2.2 在查询中使用权值 4.2.3 修改打分 4.3 什么时候索引时加权有意义 4.3.1 在输入数据中定义字段加权 4.3.2 在输入数据中对文档加权 4.3.3 在映射中定义加权 4.4 具有相同含义的词 4.4.1 同义词(synonym)过滤器 4.4.2 定义同义词规则 4.4.3 查询时或索引时同义词扩展 4.5 搜索不同语言的内容 4.5.1 为什么我们需要对语言区分处理 4.5.2 如何处理多种语言 4.5.3 检测文档的语言 4.5.4 示例文档 4.5.5 映射 4.5.6 查询 4.6 使用跨度查询 4.6.1 什么是跨度 4.6.2 span_term查询 4.6.3 span_first查询 4.6.4 span_near查询 4.6.5 span_or查询 4.6.6 span_not查询 4.6.7 性能考虑 4.7 本章小结 第5章 组合索引、分析和搜索 5.1 索引树形结构 5.2 利用更新API修改索引结构 5.2.1 映射 5.2.2 添加一个新字段 5.2.3 修改字段 5.3 使用嵌套对象 5.4 使用父子关系 5.4.1 映射和索引 5.4.2 查询 5.4.3 父子关系和过滤 5.4.4 性能考虑 5.5 从其他系统获取数据:river 5.5.1 我们需要什么和river是什么 5.5.2 安装和配置river 5.6 批量索引以加快索引过程 5.6.1 如何准备数据 5.6.2 索引数据 5.6.3 是否有可能更快 5.7 本章小结 第6章 搜索之外 6.1 统计 6.1.1 文档结构 6.1.2 返回结果 6.1.3 query统计 6.1.4 filter统计 6.1.5 terms统计 6.1.6 range统计 6.1.7 histogram统计 6.1.8 statistical统计 6.1.9 terms_stats统计 6.1.10 geo_distance统计 6.1.11 过滤统计结果 6.1.12 统计计算范围 6.1.13 统计计算的内存考虑 6.2 相似(More Like This) 6.2.1 示例数据 6.2.2 发现相似文档 6.3 反查 6.3.1 准备反查器 6.3.2 深入学习 6.4 本章小结 第7章 管理集群 7.1 监控集群状态与健康状况 7.1.1 集群健康API 7.1.2 索引统计API 7.1.3 状态API 7.1.4 节点信息API 7.1.5 节点状态API ……第8章 问题处理
ElasticSearch是一个基于ApacheLucene构建的开源搜索服务器。它提供了一个可扩展的搜索解决方案,内置支持近实时搜索和多租户。 本书将教你如何构建一个快速、灵活、可扩展的搜索解决方案,通过建立自定义集群进入ElasticSearch的世界。通过学习数据索引和分析,你将掌握ElasticSearch的强大功能,包括如何搜索数据、如何扩大搜索范围,以及如何进行集群管理。 从建立自己的ElasticSearch集群开始,然后进行搜索并扩展搜索参数,你就可以创建一个完全自定义的搜索解决方案。在此基础上,你将进一步地学习ElasticSearch的查询API,以及如何使用强大的过滤和统计功能。在ElasticSearch旅程最后总结的一些章节,帮助读者控制和调整集群,学习分片分配、网关模式配置等知识。 本书是为希望利用ElasticSearch创建一个快速、灵活的搜索解决方案的开发者而撰写的。如果你正试图学习ElasticSearch或者希望变得更加精通,本书也同样适合。开始学习本书时你不需要知道关于ElasticSearch的任何知识,但知道一些数据库和查询的基本知识是必需的。 你将从本书学到 配置和创建一个ElasticSearch索引 使用ElasticSearch查询DSL进行各种查询 在不损失性能的情况下高效和精确地使用过滤器 实现自动补全功能 高亮数据和地理信息搜索以得到更好的结果 理解ElasticSearch如何返回结果及如何验证这些结果 使用统计和相似功能从搜索中获得更多,并提升客户的搜索体验 使用ElasticSearchAPI和第三方监控方案监控集群状态与集群健康状况本书基于ElasticSearch的0.2版本,覆盖了ElasticSearch各种功能和命令的应用,全面、详细地介绍了开源、分布式、RESTful,具有全文检索功能的搜索引擎ElasticSearch。 本书前两章着重介绍了ElasticSearch的基本功能和用法,包括ElasticSearch的安装和配置、REST API的使用方法,以及怎样使用Query DSL语句进行查询、过滤、排序等。接下来的4章是对ElasticSearch基本功能的扩展,主要介绍了如何使用统计功能来计算查询返回结果的聚集数据、如何实现自动补全功能、如何使用ElasticSearch的空间数据处理能力,以及如何使用预期搜索功能等。第7章介绍了ElasticSearch管理API的能力,如控制分片部署位置、操纵集群等功能。在第8章将学习到如何处理使用ElasticSearch过程中可能遇到的常见问题。 本书内容丰富、全面,基本概念的讲解细致、深入浅出。各种功能和命令的介绍,都配以实践操作和详细的代码。【作者简介】Rafa Ku 是一位天生的团队领导者和软件开发者。他现在在Sematext Group公司做顾问和软件工程师,专注于开源技术,如Apache Lucene与Solr、ElasticSearch及Hadoop软件堆栈。从银行软件到电子商务产品,他在不同的软件公司有超过11年的从业经历。他主要专注于Java,但是对任何有助于简单、快速达到目标的工具或程序设计语言都保持开放态度。Rafa 还是solr.pl网站的创始人之一,在这里他试图和大家分享知识,帮助大家解决有关Solr和Lucene的问题。他还在世界各地的各种会议上做讲者,例如LuceneEurocon、Berlin Buzzwords及ApacheCon。 Rafa 从2002年起开启了他的Lucene之旅,但那时他并非对Lucene一见钟情。当他在2003年年底回到Lucene时,他改变了关于此框架的想法,看到了其在搜索技术方面的潜力。后来Solr出现了,事情就是这样的。在2010年中,他开始使用ElasticSearch。如今,Lucene、Solr、ElasticSearch和信息检索是他的主要兴趣所在。 Rafa 还是Apache Solr 3.1 Cookbook一书的作者,其升级版本Apache Solr 4 Cookbook由Packt Publishing公司出版。
(美) 酷奇, (美) 罗戈任斯基, 著
高凯, 编著
(波) 库赛, (波) 罗格辛斯基, 著
朱林, 编著
(美) 拉斐尔·酷奇 (Rafal Kuc) , 等著
梁斌, 编著
(美) 克罗夫特 (Croft,W.B.) , 等著
何靖, 李晓明, 编著
黄泰山, 著