Python网络爬虫技术与实战

? 基本信息

  • 书名:Python网络爬虫技术与实战
  • 作者:王健, 赵国生
  • 出版社:机械工业出版社有限公司
  • 出版时间:2021/1/1
  • 字数:410千字

? 推荐语

涵盖网络爬虫的核心概念、算法和技术实现,内容系统,案例丰富。

? 内容简介

本书是一本系统、全面地介绍Python网络爬虫的实战宝典。作者融合自己丰富的工程实践经验,紧密结合演示应用案例,内容覆盖了几乎所有网络爬虫涉及的核心技术。在内容编排上,一步步地剖析算法背后的概念与原理,提供大量简洁的代码实现,助你从零基础开始编程实现深度学习算法。

全书按照学习爬虫所涉及的核心技术从易到难,再到应用的顺序分为14章。

第1章介绍Python的安装配置和基础语法;第2章介绍爬虫类型、抓取策略以及网络基础知识;第3章介绍Python常用库;第4章介绍正则表达式的语法、匹配规则;第5章讲解PIL库、Tesseract库和TensorFlow库的语法、类型和识别方法;第6章介绍抓包利器Fiddler;第7章介绍数据存储;第8章介绍Scrapy爬虫框架;第9章介绍多线程爬虫;第10章介绍动态网页爬虫;第11章介绍分布式爬虫;第12章介绍电商网站商品信息爬虫项目;第13章介绍生活娱乐点评类信息爬虫;第14章介绍图片信息类爬虫项目。

? 出版社介绍

机械工业出版社是全国优秀出版社,自1952年成立以来,坚持为科技、为教育服务,以向行业、向学校提供优质、权威的精神产品为宗旨,以“服务社会和人民群众需求,传播社会主义先进文化”为己任,产业结构不断完善,已由传统的图书出版向着图书、期刊、电子出版物、音像制品、电子商务一体化延伸,现已发展为多领域、多学科的大型综合性出版社,涉及机械、电工电子、汽车、计算机、经济管理、建筑、ELT、科普以及教材、教辅等领域。
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。