Python网络爬虫:从入门到精通(附微课)

📚 基本信息

  • 书名:Python网络爬虫:从入门到精通(附微课)
  • 作者:吕云翔 主编
  • 出版社:人民邮电出版社
  • 出版时间:2023/7/1
  • 字数:233千字

💡 推荐语

本书主要介绍如何使用Python语言进行网络爬虫程序的开发。

📖 内容简介

本书从Python语言的基本特性入手,详细介绍Python网络爬虫开发的多个方面,涉及HTTP、HTML、正则表达式、JavaScript、自然语言处理、数据处理与科学计算等不同领域的内容。

全书共12章,包括基础篇、进阶篇、提高篇和实战篇4个部分。

基础篇包括第1、2、3章,分别为Python基础及网络爬虫、静态网页抓取、数据存储。

进阶篇包括第4、5、6章,分别为JavaScript与动态内容、模拟登录与验证码、爬虫数据的分析与处理。

提高篇包括第7、8、9章,分别为爬虫的灵活性和多样性、Selenium模拟浏览器与网站测试、爬虫框架Scrapy与反爬虫。

实战篇提供了3个实战项目供读者学习参考。

本书内容覆盖网络数据抓取与爬虫编程中的主要知识和前沿技术。同时,本书在重视理论基础的前提下,从实用性和丰富度出发,结合实例演示爬虫程序编写的核心流程,将理论与实践结合,力求提高读者的网络爬虫实操技能。

🏢 出版社介绍

人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。