出版社:机械工业出版社
年代:2018
定价:99.0
本书共19章,第1章介绍数据科学中涉及的基本领域;第2~3章介绍与数据工作紧密相关的Python语言基础;第4章讲解描述性统计分析在宏观业务领域的分析;第5章讲解数据规整、清洗的重要技能;第6章介绍数据科学领域实用的四大统计检验;第7章讲解当被解释变量为连续变量时,如何使用线性回归作预测;第8章讲解使用逻辑回归作评分卡模型;第9章讲解另外一个可解释模型——决策树。第10~12章分别讲解了BP神经网络、朴素贝叶斯、最近邻域、支持向量机的原理和在决策类模型中的运用;第13~14章作为一个整体讲解商业分析场景下的信息压缩;第15章以产品推荐作为案例,讲解发现事件与事件伴生关系的关联分析和序列分析算法;第16章使用欺诈识别案例讲解当被解释变量分布极端不平衡时的处理方法;第17章继续使用欺诈识别案例讲解集成学习算法;第18章讲解了使用效应分解和ARIMA方法实现宏观业务指标预测;第19章用案例展现了分类和聚类模型的CRISP-DM和SEMMA流程。
(美) 约翰·保罗·穆勒 (John Paul Mueller) , (意) 卢卡·马萨罗 (Luca Massaron) , 著
(西) 劳拉·伊瓜尔 (Laura Igual) , 等著
(法) 戴维·西伦 (Davy Cielen) , 等著
(俄罗斯) 德米特里·齐诺维耶夫 (Dmitry Zinoviev) , 著
常象宇, 等著
(美) 杰西·丹尼尔 (Jesse C. Daniel) , 著
(美) 罗伯特·约翰逊 (Robert Johansson) , 著
(美) 梅甘·斯夸尔 (Megan Squire) , 著
(美) 提尔塔吉奥蒂·萨卡, (印) 舒布哈迪普·罗伊乔杜里, 著