Python 3 爬虫、数据清洗与可视化实战(第2版)

📚 基本信息

  • 书名:Python 3 爬虫、数据清洗与可视化实战(第2版)
  • 作者:零一, 韩要宾, 黄园园
  • 出版社:电子工业出版社
  • 出版时间:2020/7/1
  • 字数:120千字

💡 推荐语

一本通过实战教初学者学习爬取数据、清洗和组织数据进行分析和可视化的Python读物。

📖 内容简介

书中案例均经过实战检验,笔者在实践过程中深感采集数据、清洗和组织数据的重要性,作为一名数据行业的“码农”,数据就是沃土,没有数据,我们将无田可耕。

本书共13章,包括6个核心主题,其一是Python基础入门,包括环境配置、基本操作、数据类型、语句和函数;其二是Python爬虫的构建,包括网页结构解析、爬虫流程设计、代码优化、爬虫效率优化、无线端的数据采集、容错处理、反防爬虫、表单交互和模拟页面点击;其三是Python数据库应用,包括MongoDB、MySQL 在Python中的连接与应用;其四是数据清洗和组织,包括NumPy数组知识,以及pandas数据的读写、分组、变形,缺失值、异常值和重复值处理,时序数据处理和正则表达式的使用等;其五是综合应用实例,帮助读者贯穿爬虫、数据清洗与组织的过程;最后是数据可视化,包括matplotlib和pyecharts两个库的使用,涉及饼图、柱形图、线图、词云图等图形,帮助读者进入可视化的殿堂。

本书以实战为主,适合Python初学者及高等院校相关专业的学生阅读,也适合Python培训机构作为实验教材。

✍️ 作者简介

作者零一,原名陈海城,慕研数据分析师事务所创始人,电商数据专家,数据分析师,开发工程师;从事教育培训、数据分析和人工智能行业,专注于电商企业的数据化服务。

🏢 出版社介绍

电子工业出版社成立于1982年10月,是国务院独资、工信部直属的中央级科技与教育出版社,是专业的信息技术知识集成和服务提供商。经过三十多年的建设与发展,已成为一家以科技和教育出版、期刊、网络、行业支撑服务、数字出版、软件研发、软科学研究、职业培训和教育为核心业务的现代知识服务集团。出版物内容涵盖了电子信息技术的各个分支及工业技术、经济管理、科普与少儿、社科人文等领域,综合出版能力位居全国出版行业前列。
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。