出版社:机械工业出版社
年代:2013
定价:49.0
本书比较全面系统地介绍了机器学习的方法和技术,不仅详细阐述了许多经典的学习方法,还讨论了一些有生命力的新理论、新方法。全书案例既有分类问题,也有回归问题;既包含监督学习,也涵盖无监督学习。本书讨论的案例从分类讲到回归,然后讨论了聚类、降维、最优化问题等。这些案例包括分类:垃圾邮件识别,排序:智能收件箱,回归模型:预测网页访问量,正则化:文本回归,最优化:密码破解,无监督学习:构建股票市场指数,空间相似度:用投票记录对美国参议员聚类,推荐系统:给用户推荐R语言包,社交网络分析:在Twitter上感兴趣的人,模型比较:给你的问题找到最佳算法。各章对原理的叙述力求概念清晰、表达准确,突出理论联系实际,富有启发性,易于理解。在探索这些案例的过程中用到的基本工具就是R统计编程语言。R语言非常适合用于机器学习的案例研究,因为它是一种用于数据分析的高水平、功能性脚本语言。 本书可作为高等院校计算机、自动化、电子和通信等专业研究生和高年级本科生的参考书。本书内容对从事人工智能、机器学习、数据挖掘、模式识别等相关领域研究的科技人员具有较好的参考价值。
前言
第1章 使用R语言
R与机器学习
第2章 数据分析
分析与验证
什么是数据
推断数据的类型
推断数据的含义
数值摘要表
均值、中位数、众数
分位数
标准差和方差
可视化分析数据
列相关的可视化
第3章 分类:垃圾过滤
非此即彼:二分类
漫谈条件概率
试写第一个贝叶斯垃圾分类器
第4章 排序:智能收件箱
次序未知时该如何排序
按优先级给邮件排序
实现一个智能收件箱
第5章 回归模型:预测网页访问量
回归模型简介
预测网页流量
定义相关性
第6章 正则化:文本回归
数据列之间的非线性关系:超越直线
避免过拟合的方法
文本回归
第7章 优化:密码破译
优化简介
岭回归
密码破译优化问题
第8章 PCA:构建股票市场指数
无监督学习
主成分分析
第9章 MDS:可视化地研究参议员相似性
基于相似性聚类
如何对美国参议员做聚类
第10章 kNN:推荐系统
k近邻算法
R语言程序包安装数据
第11章 分析社交图谱
社交网络分析
用黑客的方法研究Twitter的社交关系图数据
分析Twitter社交网络
第12章 模型比较
SVM:支持向量机
算法比较
参考文献
O’Reilly Media通过图书、杂志、在线服务、调查研究和会议等方式传播创新知识。自1978年开始,O’Reilly一直都是前沿发展的见证者和推动者。超级极客们正在开创着未来,而我们关注真正重要的技术趋势——通过放大那些“细微的信号”来刺激社会对新科技的应用。作为技术社区中活跃的参与者,O’Reilly的发展充满了对创新的倡导、创造和发扬光大。
O’Reilly为软件开发人员带来革命性的“动物书”;创建第一个商业网站(GNN);组织了影响深远的开放源代码峰会,以至于开源软件运动以此命名;创立了Make杂志,从而成为DIY革命的主要先锋;公司一如既往地通过多种形式缔结信息与人的纽带。O’Reilly的会议和峰会集聚了众多超级极客和高瞻远瞩的商业领袖,共同描绘出开创新产业的革命性思想。作为技术人士获取信息的选择,O’Reilly现在还将先锋专家的知识传递给普通的计算机用户。无论是通过书籍出版,在线服务或者面授课程,每一项O’Reilly的产品都反映了公司不可动摇的理念——信息是激发创新的力量。
《机器学习:实用案例解析》是机器学习和数据挖掘领域的经典图书,基础理论与实践完美的结合,是一部逻辑紧密、内容详实,适合所有相关技术人员的参考书。
《机器学习:实用案例解析》两名作者都具有丰富的数据分析、处理工作经验,是机器学习实践技术方面的积极实践者。
海报: