出版社:社会科学文献出版社
年代:2015
定价:49.0
本书共分7章。第1章为引言,介绍了本书写作的目的与意义和主要研究内容,最后给出全文的组织结构;第2章对本书所涉及的数据挖掘与知识发现理论做了了较为基础的概述,重点介绍了聚类分析内容、高维数据的形态和特点,分析了高维数据常用的预处理的方法—维数约减,最后系统概述了目前主要的几种高维数据聚类分析方法;第3章提出了一种改进的CABOSFV高属性维稀疏数据聚类算法。研究分析了经典的高属性维稀疏数据聚类CABOSFV算法的不足,提出了融合排序思想的高属性维稀疏数据聚类算法;第4章给出了具有高维稀疏特征的对象—属性空间的定义,提出了对具有高维稀疏特征的对象—属性空间分割的方法识别其子空间的思想,并提出了一种新型的两阶段联合聚类的算法,实现对高维稀疏数据的对象维和属性维进行聚类分割以识别其子空间;第5章提出了对象—属性边缘重叠区域的归属判断算法。研究发现了具有高维稀疏特征的对象—属性子空间边缘可能存在交叉重叠区域现象,设计了对象—属性子空间交叉重叠区域的归属判断目标函数;第6章提出了高维稀疏对象—属性子空间优化方法。通过对对象—属性子空间识别过程的分析,发现了对象属性取值全为零的子空间,在基础上给出了非关联子空间的定义,揭示了非关联子空间的本质。结合冗余理论,得出进行高维稀疏象—属性子空间优化的必要性,并提出剔除非关联子空间RNASAUBSC算法。算法分析了非关联子空间的两种来源,并针对这两种不同来源的非关联子空间给出了对应的优化方法;第7章为总结与展望部分,总结了本书的研究成果,指出了进一步研究的方向。
蔡天文, 沈晓彤, 编
(美) 奎斯塔 (Cuesta,H.) , 著
(美) 迈克尔·S.刘易斯-贝克, 著
(美) 伊森 (Isson,J.P.) , (美) 哈里奥特 (Harriott,J.S.) , 著
(美) 赫克托·奎斯塔 (Hector Cuesta) , (美) 桑帕斯·库马尔 (Dr.Sampath Kumar) , 著
(美) 梅内里 (Minelli,M.) , (美) 钱伯斯 (Chambers,M.) , (美) 帝拉吉 (Dhiraj,A.) , 著
(美) 戈登 S.林那夫 (Gordon S. Linoff) , 著
(美) 刘易斯-贝克, 著
邵晶晶, 著