基于python的web大数据爬取实战指南

基于python的web大数据爬取实战指南

夏换, 杨秀璋, 于小民, 编著

出版社:科学出版社

年代:2019

定价:82.0

书籍简介:

本书主要是基于Python的Web大数据爬取实战指南,选题内容包括基础知识和通过Python爬取Web网页数据两大部分。下图是PythonWeb数据采集的结构图,主要包括三个部分:网络传播技术、信息提取技术和数据存储技术。网络传播通常是使用HTTP进行,常用的传播方式包括HTML、XML、Json、Ajax和纯文本等;信息提取技术主要可以通过Python语言、R语言、Java语言等进行获取,其中主要包括的技术包括:正则表达式、XPath技术、Selenium、BeautifulSoup等;数据存储技术主要是存储爬取的数据信息,主要包括SQL数据库、纯文本格式等。

书籍规格:

书籍详细信息
书名基于python的web大数据爬取实战指南站内查询相似图书
丛书名大数据科学研究丛书
9787030606372
如需购买下载《基于python的web大数据爬取实战指南》pdf扫描版电子书或查询更多相关信息,请直接复制isbn,搜索即可全网搜索该ISBN
出版地北京出版单位科学出版社
版次1版印次1
定价(元)82.0语种简体中文
尺寸24 × 17装帧平装
页数 214 印数

书籍信息归属:

基于python的web大数据爬取实战指南是科学出版社于2019.3出版的中图分类号为 TP311.561 的主题关于 软件工具-程序设计 的书籍。