出版社:电子工业出版社
年代:2017
定价:79.0
本书以数据分析领域最热的Python语言为主要线索,介绍了数据分析库numpy、Pandas与机器学习库scikit-learn,使用了可视化环境Orange 3来理解算法的一些细节。对于机器学习,既有常用算法KNN与Kmeans的应用,决策树与随机森林的实战,还涉及常用特征工程与深度学习中的自动编程器。在大数据Hadoop与Hive环境的基础之上,使用Spark的ML/MLlib库集成了前面的各部分内容,让分布式机器学习更容易。大量的工具与技能实战的介绍将各部分融合成一个全栈的数据科学内容。
张宏伦, 编著
谢瑛俊, 编著
徐尔, 赵鲁涛, 主编
张云河, 刘友祝, 王硕, 著
常国珍, 赵仁乾, 张秋剑, 著
(美) 梅甘·斯夸尔 (Megan Squire) , 著
(美) 提尔塔吉奥蒂·萨卡, (印) 舒布哈迪普·罗伊乔杜里, 著
(美) 托马斯·W.米勒 (Thomas W. Miller) , 著
(意) 阿尔贝托·博斯凯蒂, (意) 卢卡·马萨罗, 著