出版社:兵器工业出版社
年代:2014
定价:35.0
科技情报的采集是科技情报研究工作中的重要组成部分,也是科技情报深入分析挖掘的基础。首先,本书设计并实现了一种无监督的科技情报采集系统。其次,本书针对网页数据中数据量大、重复数据多,科技情报人员难以直接对其进行处理的困难,提出了一种基于快速排序的文本聚类算法,实现对大量网页数据进行去重、压缩的目的。最后,本书基于来自“中国知网”、“维普网”和 “万方数据库”的中文学术论文数据,将科技情报采集系统应用于具体的科技情报工作中,形成了北京科学学研究中心学术影响力分析报告。