出版社:人民邮电出版社
年代:2016
定价:49.0
本书主要内容包括:在数据科学领域数据清理工作的重要作用,文件格式、数据类型、解码的基本概念,表单的关键特性,组织和处理数据的文本编辑器,各种格式的数据转换方法,解析和清理网页上的HTML文件的三种不同策略,深入了解PDF文件并掌握从中拖出数据的方法,检测和清除RDBMS中的坏数据的解决方案,使用书中介绍的方法清理来自Twitter和Stack Overflow的数据。
书籍详细信息 | |||
书名 | 干净的数据站内查询相似图书 | ||
丛书名 | 图灵程序设计丛书 | ||
9787115420473 如需购买下载《干净的数据》pdf扫描版电子书或查询更多相关信息,请直接复制isbn,搜索即可全网搜索该ISBN | |||
出版地 | 北京 | 出版单位 | 人民邮电出版社 |
版次 | 1版 | 印次 | 1 |
定价(元) | 49.0 | 语种 | 简体中文 |
尺寸 | 24 × 19 | 装帧 | 平装 |
页数 | 102 | 印数 | 3000 |
王兆君, 王钺, 曹朝晖, 编著
李涛, 著
(日) 城田真琴, 著
(美) 克莉丝汀 L.伯格曼 (Christine L. Borgman) , 著
王学钦, 赵鹏, 主编
(美) 埃弗格林, 著
赵眸光, 赵勇, 编著
于洋, 余敏雄, 吴娜, 师胜柱, 著
(美) 瓦利阿帕·拉克什曼南 (Valliappa Lakshmanan) , 著