出版社:科学出版社
年代:2019
定价:82.0
本书主要是基于Python的Web大数据爬取实战指南,选题内容包括基础知识和通过Python爬取Web网页数据两大部分。下图是PythonWeb数据采集的结构图,主要包括三个部分:网络传播技术、信息提取技术和数据存储技术。网络传播通常是使用HTTP进行,常用的传播方式包括HTML、XML、Json、Ajax和纯文本等;信息提取技术主要可以通过Python语言、R语言、Java语言等进行获取,其中主要包括的技术包括:正则表达式、XPath技术、Selenium、BeautifulSoup等;数据存储技术主要是存储爬取的数据信息,主要包括SQL数据库、纯文本格式等。
书籍详细信息 | |||
书名 | 基于python的web大数据爬取实战指南站内查询相似图书 | ||
丛书名 | 大数据科学研究丛书 | ||
9787030606372 如需购买下载《基于python的web大数据爬取实战指南》pdf扫描版电子书或查询更多相关信息,请直接复制isbn,搜索即可全网搜索该ISBN | |||
出版地 | 北京 | 出版单位 | 科学出版社 |
版次 | 1版 | 印次 | 1 |
定价(元) | 82.0 | 语种 | 简体中文 |
尺寸 | 24 × 17 | 装帧 | 平装 |
页数 | 214 | 印数 |
郭卡, 戴亮, 编著
(比) 希普·万登·布鲁克 (Seppe vanden Broucke) , (比) 巴特·巴森斯 (Bart Baesens) , 著
胡书敏, 著
余本国, 著
范晖, 于长青, 张文胜, 编著
上海德拓信息技术股份有限公司, 编著
张晓, 主编
杨秀璋, 颜娜, 编著
杨秀璋, 颜娜, 编著