出版社:清华大学出版社
年代:2020
定价:79.8
书讲述如何构建能处理大量数据的分布式数据项目。首先介绍Dask框架,描述Dask如何扩展Numpy和Pandas等常用Python库。然后介绍Dask数据帧,讨论有助于精简分析的代码模式,深入研究Seaborn的可视化,讲述Dask-ML构建机器学习模型。最后讨论如何扩展Dask应用程序,并讲述如何使用AWS和Docker构建Dask集群。本书分析NYC 2013-2017 Parking Ticket数据库中的大量数据,讨论如何分析数据集,以发现NYC趋势和模式。你将学会在自己的数据中发现类似趋势!
书籍详细信息 | |||
书名 | Python和Dask数据科学站内查询相似图书 | ||
丛书名 | 大数据应用与技术丛书 | ||
9787302553786 如需购买下载《Python和Dask数据科学》pdf扫描版电子书或查询更多相关信息,请直接复制isbn,搜索即可全网搜索该ISBN | |||
出版地 | 北京 | 出版单位 | 清华大学出版社 |
版次 | 1版 | 印次 | 1 |
定价(元) | 79.8 | 语种 | 简体中文 |
尺寸 | 24 × 17 | 装帧 | 平装 |
页数 | 印数 | 6000 |
常国珍, 赵仁乾, 张秋剑, 著
(美) 约翰·保罗·穆勒 (John Paul Mueller) , (意) 卢卡·马萨罗 (Luca Massaron) , 著
(西) 劳拉·伊瓜尔 (Laura Igual) , 等著
(法) 戴维·西伦 (Davy Cielen) , 等著
(俄罗斯) 德米特里·齐诺维耶夫 (Dmitry Zinoviev) , 著
常象宇, 等著
(美) 罗伯特·约翰逊 (Robert Johansson) , 著
(美) 弗兰克·凯恩 (Frank Kane) , 著
(美) 梅甘·斯夸尔 (Megan Squire) , 著