基于DeepSeek大模型的深度应用实践

📚 基本信息

  • 书名:基于DeepSeek大模型的深度应用实践
  • 作者:韩晓晨
  • 出版社:清华大学出版社
  • 出版时间:2025/4/1
  • 字数:163千字

💡 推荐语

系统阐述DeepSeek大模型的技术架构、开发实践与行业应用。

📖 内容简介

全书分为3部分11章。

第1~4章深入介绍大模型的理论基础与核心技术,包括大模型的核心概念、Transformer与MoE机制,以及DeepSeek架构的关键设计思想、优化策略与开发基础等。

第5~7章聚焦于实际应用开发,详细讲解如何在DeepSeek平台上构建智能开发工具,包括编程智能助手的技术实现、智能代码生成、调试、多任务跨领域应用以及Prompt设计等。

第8~10章深入探讨了大模型在行业中的定制化应用,通过多个案例展示了大模型如何解决零售、制造等行业中的具体业务问题,帮助读者掌握从需求分析到模型部署的全流程。

第11章详细介绍了DeepSeek-R1的关键技术。

✍️ 作者简介

作者韩晓晨,博士,长期从事高性能计算与大模型训练算力优化研究。近十年来,专注于智能计算架构优化及大规模数据处理,深耕控制算法、机器视觉等领域。近年来,重点研究大模型训练加速、算力调度与异构计算优化,致力于提升计算效率与资源利用率,推动大规模人工智能模型的高效部署与应用。

🏢 出版社介绍

清华大学出版社成立于1980年6月,是由教育部主管、清华大学主办的综合出版单位。植根于“清华”这座久负盛名的高等学府,秉承清华人“自强不息,厚德载物”的人文精神,清华大学出版社在短短二十多年的时间里,迅速成长起来。清华大学出版社始终坚持弘扬科技文化产业、服务科教兴国战略的出版方向,把出版高等学校教学用书和科技图书作为主要任务,并为促进学术交流、繁荣出版事业设立了多项出版基金,逐渐形成了以出版高水平的教材和学术专著为主的鲜明特色,在教育出版领域树立了强势品牌。
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。