出版社:清华大学出版社
年代:2015
定价:30.0
“海量数据分析前沿”调查了海量数据分析中的前沿问题,指出大数据对自然科学,互联网行业,商业决策和国家安全的重要作用。报告认为针对小数据的算法和知识推断工具不一定适用于大规模数据,需要研究新的方法来应对大数据挑战。本书指出了未来可能的研究方向,描述了7个主要的海量数据分析问题,并提出从计算机科学,统计,机器学习等跨学科知识来进行大数据分析。
近年来,大数据成为学术界和工业界的热点,其本质就是海量数据分析。海量数据的来源包括互联网、传感器、生产生活、科学观测、科学实验等。海量数据分析不仅可以帮助人们取得新的科学发现,也可以推动技术的适应性、个性化和健壮性方面的进步。海量数据分析是一个跨学科的研究领域,理解本书的内容需要具备计算机科学、统计学和优化理论的基础知识。本书从计算和推理的角度分析了与海量数据分析相关的前沿问题,重点介绍海量数据挖掘分析以及流数据挖掘的进展,讨论了并行和分布式系统架构方面的全新发展,具体内容包括数据建模、任务建模、计算复杂性问题分析、数据采样以及人工参与的数据分析方法等。