出版社:中国铁道出版社
年代:2018
定价:52.0
网络爬虫是一种按照一定的规则,自动请求万维网网站并提取网络数据的程序或脚本,它可以代替人力进行信息采集,能够自动化采集互联网的数据,以更高地效率利用互联网中的有效信息,在市场的应用需求中占据着重要的位置。本书以Windows为平台,系统全面地讲解了Python网络爬虫的相关知识。其中,第1章主要是带领读者认识网络爬虫;第2章讲解爬虫的实现原理和技术;第3章主要介绍网页请求的原理;第4~5章讲解抓取和解析网页数据的相关技术;第6章讲解并发下载的相关知识;第7章讲解抓取动态网页;第8章讲解图像识别与文字处理;第9章讲解存储爬虫数据;第10-12章侧重讲解Scrapy框架的基础知识和基本使用;第13章拓展介绍分布式爬虫的基础知识和基本使用。本书既可作为高等院校本、专科计算机相关专业的程序设计课程教材,也可作为Python网络爬虫的培训教材,是一本适合广大编程开发者的爬虫入门级教材。
黄永祥, 著
肖睿, 陈磊, 主编
韦玮, 著
吕云翔, 编著
黄永祥, 著
(美) 瑞安·米切尔 (Ryan Mitchell) , 著
(德) 凯瑟琳·雅姆尔 (Katharine Jarmul) , (澳) 理查德·劳森 (Richard Lawson) , 著
李晓东, 编著
江吉彬, 张良均, 主编