Python网络爬虫从入门到实践

Python网络爬虫从入门到实践

庄培杰, 编著

出版社:电子工业出版社

年代:2019

定价:79.0

书籍简介:

借着人工智能的浪潮,Python的热度一直持续上涨,训练人工智能依赖于大量的数据,而数据的获取基本靠爬虫。大量的信息通过Web站点进行展示,通过学习编写Python爬虫,编写采集数据的爬虫脚本,对所需的数据进行爬取。本书尝试着由浅入深来剖析Python爬虫,让读者更快更系统的上手Python爬虫的编写。本书包括12章内容,从零开始学习Python爬虫。第1章是Python爬虫概念与Web基础,介绍了Python的一些概念,HTTP协议,简单介绍了网页基本三剑客HTML,CSS和JavaScript的基本语法。第2章介绍Python爬虫库的基本使用,包括Chrome抓包,urllib和lxml库的使用。第3章介绍Python抓包与数据分析,包括HTTPS简介,Charles抓包,Packet Capture抓包,requests库和Beautiful Soup库的使用。第4章介绍使用CSV和Excel存储数据。第5章介绍使用数据库存储数据,包括MySQL,Redis和MongoDB的使用。第6章介绍一些常见的反爬虫策略,代理,ajax,selenium等。第7,8章详细讲解了Python爬虫框架Scrapy的使用。第9章介绍了构建自己的代理ip池。第10章介绍了如何搭建分布式爬虫。第11,12章,利用爬取到的数据进行可视化数据分析。

书籍规格:

书籍详细信息
书名Python网络爬虫从入门到实践站内查询相似图书
丛书名大数据及人工智能产教融合系列丛书
9787121371059
如需购买下载《Python网络爬虫从入门到实践》pdf扫描版电子书或查询更多相关信息,请直接复制isbn,搜索即可全网搜索该ISBN
出版地北京出版单位电子工业出版社
版次1版印次1
定价(元)79.0语种简体中文
尺寸26 × 19装帧平装
页数印数

书籍信息归属:

Python网络爬虫从入门到实践是电子工业出版社于2019.8出版的中图分类号为 TP311.561 的主题关于 软件工具-程序设计 的书籍。