出版社:人民邮电出版社
年代:2016
定价:49.0
本书主要内容包括:在数据科学领域数据清理工作的重要作用,文件格式、数据类型、解码的基本概念,表单的关键特性,组织和处理数据的文本编辑器,各种格式的数据转换方法,解析和清理网页上的HTML文件的三种不同策略,深入了解PDF文件并掌握从中拖出数据的方法,检测和清除RDBMS中的坏数据的解决方案,使用书中介绍的方法清理来自Twitter和Stack Overflow的数据。
王兆君, 王钺, 曹朝晖, 编著
李涛, 著
(日) 城田真琴, 著
(美) 克莉丝汀 L.伯格曼 (Christine L. Borgman) , 著
王学钦, 赵鹏, 主编
(美) 埃弗格林, 著
赵眸光, 赵勇, 编著
于洋, 余敏雄, 吴娜, 师胜柱, 著
(美) 瓦利阿帕·拉克什曼南 (Valliappa Lakshmanan) , 著