出版社:清华大学出版社
年代:2012
定价:79.8
本书共18章,内容涵盖了核心的数据挖掘技术,包括决策树、神经网络、协同过滤、关联规则、链接分析、聚类和生存分析等。此外,还提供了数据挖掘最佳实践的概观、数据挖掘的最新进展和一些极具挑战性的研究课题,其技术深度与广度举世公认。作者注重实效,对每类问题均提供代表性算法,以亲身经历的商业案例为实例,给出每一技术具体的应用法则。
第1章 什么是数据挖掘以及为什么要进行数据挖掘
1.1 什么是数据挖掘
1.1.1 数据挖掘是一项业务流程
1.1.2 大量的数据
1.1.3 有意义的模式和规则
1.1.4 数据挖掘和客户关系管理
1.2 为什么是现在
1.2.1 数据正在产生
1.2.2 数据正存在于数据仓库中
1.2.3 计算能力能够承受
1.2.4 对客户关系管理的兴趣非常强烈
1.2.5 商业的数据挖掘软件产品变得可用
1.3 数据挖掘人员的技能
1.4 数据挖掘的良性循环
1.5 业务数据挖掘的案例研究
1.5.1 识别美国银行的业务挑战
1.5.2 应用数据挖掘
1.5.3 对结果采取行动
1.5.4 度量数据挖掘的影响
1.6 良性循环的步骤
1.6.1 识别业务机会
1.6.2 将数据转换为信息
1.6.3 根据信息采取行动
1.6.4 度量结果
1.7 良性循环上下文中的数据挖掘
1.8 经验教训
第2章 数据挖掘在营销和客户关系管理中的应用
2.1 两个客户生存周期
2.1.1 客户个人生存周期
2.1.2 客户关系生存周期
2.1.3 基于订阅的关系和基于事件的关系
2.2 围绕客户生存周期组织业务流程
2.2.1 客户获取
2.2.2 客户激活
2.2.3 客户关系管理
2.2.4 赢回
2.3 数据挖掘应用于客户获取
2.3.1 识别好的潜在客户
2.3.2 选择通信渠道
2.3.3 挑选适当的信息
2.4 数据挖掘示例:选择合适的地方做广告
2.4.1 谁符合剖析
2.4.2 度量读者群的适应度
2.5 数据挖掘改进直接营销活动
2.5.1 响应建模
2.5.2 优化固定预算的响应
2.5.3 优化活动收益率
2.5.4 抵达最受信息影响的人
2.6 通过当前客户了解潜在客户
2.6.1 在客户成为“客户”以前开始跟踪他们
2.6.2 收集新的客户信息
2.6.3 获取时间变量可以预测将来的结果
2.7 数据挖掘应用于客户关系管理
2.7.1 匹配客户的活动
2.7.2 减少信用风险
2.7.3 确定客户价值
2.7.4 交叉销售、追加销售和推荐
2.8 保留
2.8.1 识别流失
2.8.2 为什么流失是问题
2.8.3 不同类型的流失
2.8.4 不同种类的流失模型
2.9 超越客户生存周期
2.10 经验教训
第3章 数据挖掘过程
3.1 会出什么问题
3.1.1 学习的东西不真实
3.1.2 学习的东西真实但是无用
3.2 数据挖掘类型
3.2.1 假设检验
3.2.2 有指导数据挖掘
3.2.3 无指导数据挖掘
3.3 目标、任务和技术
3.3.1 数据挖掘业务目标
3.3.2 数据挖掘任务
3.3.3 数据挖掘技术
3.4 制定数据挖掘问题:从目标到任务再到技术
3.4.1 选择广告的最佳位置
3.4.2 确定向客户提供的最佳产品
3.4.3 发现分支或商店的最佳位置
3.4.4 根据未来利润划分客户
3.4.5 减少暴露于违约的风险
3.4.6 提高客户保留
3.4.7 检测欺诈性索赔
3.5 不同技术对应的任务
3.5.1 有一个或多个目标
3.5.2 目标数据是什么
3.5.3 输入数据是什么
3.5.4 易于使用的重要性
3.5.5 模型可解释性的重要性
3.6 经验教训
第4章 统计学入门:关于数据,你该了解些什么
4.1 奥卡姆(Occam)剃刀
4.1.1 怀疑论和辛普森悖论
4.1.2 零假设(Null Hypothesis)
4.1.3 p-值
4.2 观察和度量数据
4.2.1 类别值
4.2.2 数值变量
4.2.3 更多的统计思想
4.3 度量响应
4.3.1 比例标准误差
4.3.2 使用置信区间比较结果
4.3.3 利用比例差异比较结果
4.3.4 样本大小
4.3.5 置信区间的真正含义是什么
4.3.6 实验中检验和对照的大小
4.4 多重比较
4.4.1 多重比较的置信水平
4.4.2 Bonferroni修正
4.5 卡方检验
4.5.1 期望值
4.5.2 卡方值
4.5.3 卡方值与比例差异的比较
4.6 示例:区域和开局卡方
4.7 案例研究:利用A/B检验比较两种推荐系统
4.7.1 第一个指标:参与会话
4.7.2 第二个指标:每个会话的日收益
4.7.3 第三个指标:每天谁取胜
4.7.4 第四个指标:每个会话的平均收益
……
第5章 描述和预测:剖析与预测建模
第6章 使用经典统计技术的数据挖掘
第7章 决策树
第8章 人工神经网络
第9章 最近邻方法:基于记忆的推理和协同过滤
第10章 了解何时应担忧:使用生存分析了解客户
第11章 遗传算法与群体智能
第13章 发现相似的岛屿:自动群集检测
第14章 其他的群集检测方法
第15章 购物篮分析和关联规则
第16章 链接分析
第17章 数据仓库、OLAP、分析沙箱和数据挖掘
第18章 构建客户签名
第19章 派生变量:使数据的含义更丰富
第20章 减少变量数量的技术
第21章 仔细聆听客户所述:文本挖掘
谁将是忠实的客?谁将不是呢?哪些消息对哪些客户细分最有效?如何较大化客户的价值?如何将客户的价值最火化?《数据挖掘技术:应用于市场营销、销售与客户关系管理(第3版)》提供了强大的工具,可以从上述和其他重要商业问题所在的公司数据库中提取它们的答案。自本书第1版问世以来,数据挖掘已经日益成为现代商业不可缺少的工具。在这个较新版本中,作者对每个章节都进行了大量的更新和修订,并且添加了几个新的章节。《数据挖掘技术:应用于市场营销、销售与客户关系管理(第3版)》保留了早期版本的重点,指导市场分析师、业务经理和数据挖掘专家利用数据挖掘方法和技术米解决重要的商业问题。在不牺牲准确度的前提下,为了简单起见,即使是复杂的主题,作者也进行了简洁明了的介绍,并尽量减少对技术术语或数学公式的使用。每个技术丰题都通过案例研究和源自作者经验的真实案例进行说明,每章都包含了针对从业者的宝贵提示。书中介绍的新技术和更为深入的技术包括:线性和逻辑回归模型、增量响应(提升)建模、朴素贝叶斯模型、表查询模型、相似度模型、径向基函数网络、期望值较大化(EM)聚类和群体智慧。新的章节专门讨论了数据准备、派生变量、主成分分析和其他变量减少技术,以及文本挖掘。 在建立了全面的数据挖掘应用业务环境,并介绍了所有数据挖掘项目通用的数据挖掘方法论的各个方面之后,《数据挖掘技术:应用于市场营销、销售与客户关系管理(第3版)》详细介绍了每个重要的数据挖掘技术。
(美) 贝瑞 (Berry,M.J.A.) , (美) 莱诺夫 (Linoff,G.S.) , 著
王小妮, 著
(美) 韩家炜 (Han,J.) , 等著
(加) 韩家炜等, 著
王朝霞, 主编
(新西兰) 威滕 (Witten,I.H.) , (新西兰) 弗兰克 (Frank,E.) , (新西兰) 霍尔 (Hall,M.A.) , 著
张良均, 等编著
(新西兰) 伊恩 H. 威腾 (Ian H. Witten) , 等著
陈燕, 屈莉莉, 编著