社交网站的数据挖掘与分析

社交网站的数据挖掘与分析

(美) 罗素 (Russell,M.A.) , 著

出版社:机械工业出版社

年代:2011

定价:42.0

书籍简介:

本书介绍组合社交网络数据、分析技术,如何通过可视化帮助你找到你一直在社交世界中寻找的内容,以及那些你都不知道存在的有用信息。每个独立章节介绍了在社交网络的不同领域挖掘数据的技术,这些领域包括博客和电子邮件。你所需要具备的就是一定的编程经验和学习基本的Python工具的意愿。主要内容包括:获得社交网络世界里的直观概要,使用GitHub上灵活的脚本来获取社交网络API中的数据,学习如何应用便捷的Python工具来交叉分析你所收集的数据,通过XHTML朋友网络探索基于微格式的社交联系,通过基于HTML5和JavaScript工具集的网络技术建立交互式可视化等。

书籍目录:

前言第1章 绪论:Twitter 数据的处理Python 开发工具的安装Twitter 数据的收集和处理小结第2章 微格式:语义标记和常识碰撞XFN 和朋友使用XFN 来探讨社交关系地理坐标:兴趣爱好的共同主线(以健康的名义)对菜谱进行交叉分析对餐厅评论的搜集小结第3章 邮箱:虽然老套却很好用mbox:Unix 的入门级邮箱mbox+CouchDB= 随意的Email 分析将对话线程化到一起使用SIMILE Timeline 将邮件“事件”可视化分析你自己的邮件数据小结第4章 Twitter :朋友、关注者和Setwise 操作REST 风格的和OAuth-Cladded API干练而中肯的数据采集器友谊图的构建小结第5章 Twitter:tweet ,所有的tweet ,只有tweet 笔PK 剑:和tweet PK 机枪对tweet 的分析(每次一个实体)并置潜在的社交网站(或#JustinBieber VS #TeaParty)对大量tweet 的可视化小结第6章 LinkedIn :为了乐趣(和利润?)将职业网络聚类聚类的动机按职位将联系人聚类获取补充个人信息从地理上聚类网络小结第7章 Google Buzz:TF-IDF 、余弦相似性和搭配194Buzz=Twitter+ 博客使用NLTK 处理数据文本挖掘的基本原则查找相似文档在二元语法中发Buzz 利用Gmail 在中断之前试着创建一个搜索引擎……小结第8章 博客及其他:自然语言处理(等)NLP :帕累托式介绍使用NLTK 的典型NLP 管线使用NLTK 检测博客中的句子对文件的总结以实体为中心的分析:对数据的深层了解小结256第9章 Facebook :一体化的奇迹利用社交网络数据对Facebook 数据的可视化小结第10章 语义网:简短的讨论发展中的变革人不可能只靠事实生活期望

内容摘要:

2011年Jolt生产效率大奖获奖图书  新一代在线数据资源挖掘技术指南  社交数据挖掘、分析、可视化必备参考书Facebook、Twitter和LinkedIn产生了大量宝贵的社交数据,但是怎样才能找出谁通过社交媒介正在进行联系?他们在讨论些什么?或者他们在哪儿?本书简洁而且具有可操作性,它将揭示如何回答这些问题甚至更多的问题。你将学到如何组合社交网络数据、分析技术,如何通过可视化帮助你找到你一直在社交世界中寻找的内容,以及你闻所未闻的有用信息。  本书每章都介绍了在社交网络的不同领域挖掘数据的技术,这些领域包括博客和电子邮件。你所需要具备的就是一定的编程经验和学习基本的Python工具的意愿。  通过本书,你将:  获得对社交网络世界的直观认识  使用GitHub上灵活的脚本来获取从诸如Twitter、Facebook和LinkedIn等社交网络API中的数据  学习如何应用便捷的Python工具来交叉分析你所收集的数据  通过XFN探讨基于微格式的社交联系  应用诸如TF-IDF、余弦相似性、搭配分析、文档摘要、派系检测之类的先进挖掘技术  通过基于HTML 5和JavaScript工具包的网络技术建立交互式可视化

书籍规格:

书籍详细信息
书名社交网站的数据挖掘与分析站内查询相似图书
丛书名O’Reilly精品图书系列
9787111369608
如需购买下载《社交网站的数据挖掘与分析》pdf扫描版电子书或查询更多相关信息,请直接复制isbn,搜索即可全网搜索该ISBN
出版地北京出版单位机械工业出版社
版次1版印次1
定价(元)42.0语种简体中文
尺寸24 × 18装帧平装
页数 332 印数 4000

书籍信息归属:

社交网站的数据挖掘与分析是机械工业出版社于2012.1出版的中图分类号为 TP274 的主题关于 数据采集 的书籍。