从零构建大模型：算法、训练与微调-至尊宝书

📚 基本信息

书名：从零构建大模型：算法、训练与微调
作者：梁楠
出版社：清华大学出版社
出版时间：2025/4/1
字数：110千字

💡 推荐语

一本系统且实用的大模型构建指南。

📖 内容简介

本书旨在引领读者从基础知识起步，逐步深入探索大模型的算法原理、训练方法及微调技术。

全书共12章，涵盖了Transformer模型的基础理论，如Seq2Seq模型、分词、嵌入层和自注意力机制等关键概念；并深入剖析了GPT模型的核心实现与文本生成过程，以及BERT模型的预训练和微调技术。同时，也对ViT（视觉Transformer）模型的架构、训练方法，以及高阶微调策略如Adapter Tuning和P-Tuning进行了详尽讲解。

此外，还系统地介绍了数据处理、数据增强、模型性能优化（包括混合精度训练和分布式训练）、对比学习、对抗训练、自适应优化器、动态学习率调度，以及模型蒸馏与剪枝技术等多个方面。最后，通过应用案例，展示了模型训练和微调的完整流程，助力读者将理论知识转化为实践技能。

✍️ 作者简介

作者梁楠，博士，毕业于北京航空航天大学，高级职称，长期从事模式识别、机器学习、统计理论的研究与应用，负责或参与科研项目多项，专注于人工智能、大语言模型的应用与开发，对深度学习、数据分析与预测等有独到见解。

🏢 出版社介绍

清华大学出版社成立于1980年6月，是由教育部主管、清华大学主办的综合出版单位。植根于“清华”这座久负盛名的高等学府，秉承清华人“自强不息，厚德载物”的人文精神，清华大学出版社在短短二十多年的时间里，迅速成长起来。清华大学出版社始终坚持弘扬科技文化产业、服务科教兴国战略的出版方向，把出版高等学校教学用书和科技图书作为主要任务，并为促进学术交流、繁荣出版事业设立了多项出版基金，逐渐形成了以出版高水平的教材和学术专著为主的鲜明特色，在教育出版领域树立了强势品牌。

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

从零构建大模型：算法、训练与微调

📚 基本信息

💡 推荐语

📖 内容简介

✍️ 作者简介

🏢 出版社介绍

相关文章

远见

智能网联汽车V2X与智能网联设施I2X

人工智能：驯服赛维坦

四维人类

资源下载

需要授权123云盘账号

授权后您可以：