出版社:中国石油大学出版社
年代:2018
定价:30.0
本研究实现了面向微博数据流的实时话题发现和个性化动态推荐,为了保证其实时性和准确性,对频繁项挖掘、聚类分析和属性约简等数据流挖掘技术进行了研究,并将这些技术进行改进以适应文本数据分析的需求。创新点有:(1)提出了一种在变密度数据流环境下的任意形状聚类算法VDStream。(2)提出了一种面向数据流的频繁项挖掘算法CC,并在此基础上提出了面向微博数据流的频繁项挖掘算法CCK。(3)提出了一种基于聚类的改进协同过滤推荐算法,引入时间衰减因子强化最近被打分项目的重要性,符合用户兴趣可能会随时间而发生漂移的特点。