XML挖掘

XML挖掘

潘有能, 著

出版社:浙江大学出版社

年代:2012

定价:32.0

书籍简介:

XML自发布之日起就以其良好的可扩展性受到业界的普遍欢迎和支持,逐渐成为Web上的通用语言,在数据交换、Web服务、内容管理、Web集成等方面得到了重要应用。随着XML应用的日益广泛,XML文档的内容和XML文档之间的关系结构也日趋复杂。数据挖掘是当前信息科学的研究热点之一,用于从数据库、数据仓库或其他信息库的大量数据中提取有用信息。将聚类、分类与信息提取等数据挖掘技术应用于XML中有利于网络信息资源的搜集、整理及检索,为基于XML的数据交换和电子商务提供支持。国内目前尚无XML挖掘方面的图书,而只有数据挖掘或是XML技术方面的相关书籍,且均为当前计算机科学、信息科学领域的热点。本书将聚类、分类与信息提取等数据挖掘技术应用到Web 2.0及下一代互联网的基础技术—XML中,但可以增强网络中XML文档的组织性,从而为网络信息资源的搜集、整理及检索利用提供良好的技术支持,还可以在海量网络信息中发现XML文档间隐含的知识,确定XML文档内部标记的真实语义信息,为本体论和语义网的发展奠定坚实基础。

书籍目录:

第1章 XML与数据挖掘概述

1.1 XML

1.1.1 XML的发展与特点

1.1.2 XML文档的结构

1.1.3 DTD和Schema

1.1.4 Namespace

1.1.5 CSS、XSL与XPath

1.1.6 XLink、XPointer和XBase

1.1.7 应用程序接口DOM与SAX

1.2 数据挖掘概述

1.2.1 数据挖掘对象

1.2.2 数据挖掘功能

1.2.3 数据挖掘方法

第2章 XML数据预处理

2.1 XML文档解析

2.2 XML文档标记语义消歧

2.2.1 WordNet简介

2.2.2 基于WordNet的XML文档标记语义消歧

第3章 XML聚类

3.1 XML聚类概述

3.1.1 基于划分的聚类算法

3.1.2 层次聚类算法

3.1 -3基于遗传算法的聚类算法

3.1.4 聚类质量的评价

3.2 XML文档相似度计算

3.2.1 传统XML文档相似度计算方法

3.2.2 XML文档标记语义相似度计算

3.2.3 基于语义的XML文档相似度计算

3.3 XML文档聚类

3.3.1 相似度矩阵

3.3.2 最近邻聚类算法

3.3.3 聚类实验结果与分析

第4章 XML分类

4.1 相关定义

4.2 权重计算

4.2.1 层次权重的计算

4.2.2 结构权重的计算

4.2.3 相关参数的设置

4.3 相似性计算

4.4 XML文档分类

第5章 XML文档间结构挖掘

5.1 XML链接

5.1.1 XML链接和HTML链接的比较

5.1.2 XML简单链接

5.1.3 XML扩展链接

5.2 Web结构挖掘算法

5.2.1 Page Rank算法

5.2.2 HITS算法

5.3 基于XML链接的文档间结构挖掘

第6章 XML查询与信息提取

6.1 XML查询语言

6.1.1 XML查询语言简介

6.1.2 XQuery的数据模型

6.1.3 XQuery语言

……

第7章 基于XML的数据挖掘建模和知识表示

第8章 基于XML的Web使用挖掘

附录一:基于语义的XML文档相似度计算源程序

附录二:XML文档聚类算法源程序

参考文献

内容摘要:

《XML挖掘:聚类、分类与信息提取》分为8章,第1章先对XML和数据挖掘技术作简要介绍。在对XML文档进行挖掘之前,需要先进行文档解析及文档标记消歧,即为第2章的内容。第3章和第4章分别介绍XML挖掘的两项主要功能:聚类与分类。和HTML中的超链接一样,XML文档之间也具有链接性,第5章介绍利用链接挖掘XML文档间结构的方法。针对XML文档的查询、检索以及信息提取有利于用户准确、快速、有效地利用XML文档,《XML挖掘:聚类、分类与信息提取》的第6章即讨论XML查询与信息提取技术;第7章和第8章则介绍基于XML数据挖掘建模、知识表示以及Web日志挖掘。

书籍规格:

书籍详细信息
书名XML挖掘站内查询相似图书
9787308102544
如需购买下载《XML挖掘》pdf扫描版电子书或查询更多相关信息,请直接复制isbn,搜索即可全网搜索该ISBN
出版地杭州出版单位浙江大学出版社
版次1版印次1
定价(元)32.0语种简体中文
尺寸23 × 17装帧平装
页数印数

书籍信息归属:

XML挖掘是浙江大学出版社于2012.7出版的中图分类号为 TP312 的主题关于 可扩充语言-程序设计 的书籍。