出版社:电子工业出版社
年代:2018
定价:99.0
本书以当下在大数据应用方面流行、常用的语言Python为基础,由浅入深,从网络爬虫的基础实现原理入手,逐步将读者引领进入网络爬虫的世界。在各类爬虫框架中将使用最为广泛的Scrapy作为轴心,从多个维度揭开爬虫技术的面纱。例如,爬取规则的制定技巧,高速爬虫的设计,通过人工分析和机器学习技术让爬虫更“聪明”地“读”懂获取数据的技术,将与日据增的海量数据进行分布式的存储技术,具有高隐匿性的爬虫设计,直至对大规模、高并发的分布式爬虫技术。本书基于Python这门灵活且简洁的语言,结合作者在网络数据爬取和大数据的实际工程经验,尝试总结成为一种实用性和系统化的理论与经验沉淀,让更多数据工作者或编程爱好者在这一大数据时代从海量的信息中通过掌握“虫述”来获取对自已或企业具有价值的信息。
(巴西) 卢西亚诺·拉马略 (Luciano Ramalho) , 著
陈屹, 编著
(英) 杰西卡·英格拉斯利诺, 著
未来科技, 编著
刘瑜, 等编著
(日) 斋藤康毅, 著
(德) 凯瑟琳·雅姆尔 (Katharine Jarmul) , (澳) 理查德·劳森 (Richard Lawson) , 著
(美) 布兰登·罗德 (Brandon Rhodes) , (美) 约翰·格岑 (John Goerzen) , 著
罗攀, 蒋仟, 编著