Spark快速大数据分析(第2版)

📚 基本信息

  • 书名:Spark快速大数据分析(第2版)
  • 作者:[美] 朱尔斯·S.达米吉, [美] 布鲁克·韦尼希, [印] 泰瑟加塔·达斯, [美] 丹尼·李
  • 出版社:人民邮电出版社
  • 出版时间:2021/11/1
  • 字数:252千字

💡 推荐语

涵盖Spark 3.0的新特性,着重展示如何利用机器学习算法执行大数据分析。

📖 内容简介

本书的主角是在大数据时代应运而生的数据处理与分析利器——Spark。你将通过丰富的示例学习如何使用Spark的结构化数据API,利用Spark SQL进行交互式查询,掌握Spark应用的优化之道,用Spark和Delta Lake等开源工具构建可靠的数据湖,并用MLlib库实现机器学习流水线。

随着Spark从2.x版本升级到3.0版本,本书第2版做了全面的更新,以体现Spark生态系统在机器学习、流处理技术等方面的发展,另新增一章详解Spark 3.0引入的新特性。

✍️ 作者简介

作者朱尔斯·S.达米吉(Jules S. Damji),Databricks的高级开发人员,也是MLflow的贡献者。

🏢 出版社介绍

人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。