用Python写网络爬虫(第2版)

📚 基本信息

  • 书名:用Python写网络爬虫(第2版)
  • 作者:[德] 凯瑟琳·雅姆尔, [澳] 理查德·劳森
  • 出版社:人民邮电出版社
  • 出版时间:2018/7/1
  • 字数:155千字

💡 推荐语

这本书告诉你,如何使用Python来编写网络爬虫程序。

📖 内容简介

书中主要内容包括网络爬虫简介,从页面中抓取数据的3种方法,提取缓存中的数据,使用多个线程和进程进行并发抓取,抓取动态页面中的内容,与表单进行交互,处理页面中的验证码问题,以及使用Scarpy和Portia进行数据抓取,并在最后介绍了使用本书讲解的数据抓取技术对几个真实的网站进行抓取的实例,帮助你活学活用书中介绍的技术。

本书适合有一定Python编程经验而且对爬虫技术感兴趣的读者阅读。

✍️ 作者简介

作者凯瑟琳·雅姆尔,德国柏林的一位数据科学家和Python支持者。她经营了一家数据科学咨询公司——Kjamistan,为不同规模的企业提供诸如数据抽取、采集以及建模的服务。她从2008年开始使用Python进行编程,从2010年开始使用Python抓取网站,并且在使用网络爬虫进行数据分析和机器学习的不同规模的初创企业中工作过。读者可以通过Twitter(@kjam)关注她的想法以及动态。

🏢 出版社介绍

人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。