数据索引与数据组织模型及其应用
数据索引与数据组织模型及其应用封面图

数据索引与数据组织模型及其应用

胡运发, 著

出版社:复旦大学出版社

年代:2012

定价:30.0

书籍简介:

本书分上下两篇,内容包括:单排序互关联后继索引的创建与区间查询算法;双排序互关联后继索引创建与查询算法;互关联后继树索引模型的编码优化方法;基于互关联后继的文本压缩;基于后继模式树的XML索引模型等内容。

作者介绍:

胡运发,1964年复旦大学数学系毕业,后任该校计算机系教授,博士生导师。研究方向是数据、知识工程与知识库、创建新型数据索引-数据组织模型。曾参加我国银河亿次计算机的研制工作、逻辑语言Prolog开发、智能计算机的研制,承担“八六三”项目六次,国家自然科学基金项目四次,参加国家自然科学基金重点项目两次。期闻获得电子工业科技进步二等奖(1986)、国防科工委科技进步一等奖(1994)及二等奖两次、中国人民解放军三等功一次。上海科技进步奖二等奖6项。发表论文100余篇,翻译出版《剑桥五重奏》(上海科技出版社2003.获得牛顿科技普及二等奖),编著教材《数据与知识工程导论》(清华大学出版社,2003)及《人工智能系统原理与设计》(国防科技大学出版社,1989)。获得与本专著有关的国家专利一项(2000)。

书籍目录:

上篇

第一章 第一后继字符有序的互关联后继树索引模型

1.1 全文检索模型综述

1.1.1 位图(Bitmap)

1.1.2 署名文件(Signature Files)

1.1.3 倒排表(Inverted Files)

1.1.4 Pat树和Pat数组

1.1.5 ∑2相邻矩阵模型

1.1.6 全文索引模型的评价标准

1.2 第一后继字符有序的互关联后继树

1.2.1 基本定义

1.2.2 后继区间概念介绍

1.2.3 创建第一后继有序的互关联后继树创建算法

1.3 后继区间查询算法

1.4 后继区间查询算法复杂度及其性能分析

1.5 实验与分析

1.6 小结

第二章 双排序互关联后继树创建与查询算法

2.1 引言

2.2 双有序互关联后继树索引创建算法

2.3 双排序互关联后继树查询算法

2.3.1 逆向区间二分查询算法

2.3.2 双排序互关联后继树二分验证查询算法

2.3.3 双排序互关联后继树线性优化查询算法

2.4 实验与分析

第三章 互关联后继树索引的编码优化方法

3.1 引言

3.2 编码方案

3.3 位编码算法

3.4 原文生成算法

3.4.1 字符定位算法

3.4.2 后继树编码计数算法

3.4.3 后继树编码值算法

3.4.4 原文根地址算法

3.4.5 原文生成算法

3.5 全文检索算法

3.6 实验数据及分析

3.7 小结

第四章 基于互关联后继树索引的文本压缩

4.1 文本数据压缩的常用技术

4.1.1 数据压缩

4.1.2 文本压缩技术的分类

4.1.3 几种主要的压缩模型

4.1.4 文本压缩技术的应用

4.1.5 压缩的评判标准

4.2 后继树静态词典压缩

4.2.1 互关联后继树静态词典的设计

4.2.2 压缩和解压算法

4.2.3 静态词典压缩算法改进

4.2.4 性能比较与分析

4.3 互关联后继树自适应词典压缩

4.3.1 互关联后继树自适应词典的设计

4.3.2 压缩和解压算法

4.3.3 压缩算法改进

4.3.4 互关联后继树自适应压缩算法特点

4.3.5 性能比较与分析

4.3.6 小结

第五章 基于后继模式树的XML索引模型

5.1 引言

5.2 基于后继模式树的倒向XML索引

5.3 XML的统一索引模型

5.3.1 联合索引的创建

5.3.2 XML数据与全文数据的协同查询

……

下篇

参考文献

内容摘要:

《数据索引与数据组织模型及其应用》是面向海量数据处理的属于数据与知识工程范畴的学术专著。本书从数据组织的观点处理数据索引问题,提出一种互关联后继索引的商空间模型,从数学变换角度论证该模型优越于现有经典索引模型的多种特性:保序性、保假性和压缩性,导出多种优越能力:(1)log级的快速查询能力;(2)原文生成能力;(3)高度的压缩能力。
本书以互关联后继索引模型为中心,与多种领域的核心问题相结合,说明该模型如何对数据压缩、全文数据库、关系数据库、Web数据库、演绎数据库、知识库、文本信息隐藏、数据挖掘等领域产生创新性的影响,从而生成一系列新成果。
本书对从事关系数据库、Web数据库、事务库、演绎数据库、知识库、逻辑语言、搜索引擎、数据云、数据压缩、文本分类、数据挖掘等领域的研究人员、工程技术人员、高等院校的教师与学生有重要的参考价值或借鉴作用。

编辑推荐:

胡运发编著的《数据索引与数据组织模型及其应用》是面向海量数据处理的属于数据与知识工程范畴的学术专著。从数据组织的观点处理数据索引问题,提出一种互关联后继索引的商空间模型,从数学变换角度论证该模型优越于现有经典索引模型的多种特性:保序性、保假性和压缩性,导出多种优越能力:log级的快速查询能力;原文生成能力;高度的压缩能力。

书籍规格:

书籍详细信息
书名数据索引与数据组织模型及其应用站内查询相似图书
9787309086942
《数据索引与数据组织模型及其应用》pdf扫描版电子书已有网友提供资源下载链接,请点击下方按钮查看
出版地上海出版单位复旦大学出版社
版次1版印次1
定价(元)30.0语种简体中文
尺寸26 × 19装帧平装
页数印数
全网搜索试读资源

书籍信息归属:

数据索引与数据组织模型及其应用是复旦大学出版社于2012.3出版的中图分类号为 TP311.12 的主题关于 索引组织 的书籍。