数据挖掘中的集成方法

数据挖掘中的集成方法

(美) 赛尼 (Seni,G.) , (美) 艾德 (John,E.) , 著

出版社:科学出版社

年代:2015

定价:55.0

书籍简介:

在过去的十年,集成方法被称为数据挖掘和机器学习领域最具影响的发展。它们集组合多个模型成一体而往往比单个最好的模型更精确。对于从投资时机把握到药物发现,从伪造检测到推荐系统等工业挑战(这些领域中,预测精度较之于模型可解释性更为重要),集成能给以重要的提升。本书首先讨论了决策树。继描述树及其长处不足之后,作者对正则化(当前被认为是现代集成算法高级性能的关键原因)作了概述。随后本书清晰地描述了两个近来的发展:重要性采样(IS)和规则集成(RE)。IS展现了经典集成方法--bagging,随机森林和boosting,它们是单个算法的特例,揭示如何改善其精度和速度。REs是源于规则树集成的线性规则模型。它们是集成的最可解释版本,对于诸如信誉评分和故障诊断等应用是本质性的。最后,作者解释了集成对于新数据在复杂性(显然复杂得多)和更大精度方面的悖论。

书籍规格:

书籍详细信息
书名数据挖掘中的集成方法站内查询相似图书
9787030443274
如需购买下载《数据挖掘中的集成方法》pdf扫描版电子书或查询更多相关信息,请直接复制isbn,搜索即可全网搜索该ISBN
出版地北京出版单位科学出版社
版次1版印次1
定价(元)55.0语种简体中文
尺寸24 × 17装帧平装
页数 160 印数

书籍信息归属:

数据挖掘中的集成方法是科学出版社于2015.5出版的中图分类号为 TP274 的主题关于 数据处理 的书籍。