深入理解自然语言处理

? 基本信息

  • 书名:深入理解自然语言处理
  • 作者:宋文峰 编著
  • 出版社:清华大学出版社
  • 出版时间:2025/1/1
  • 字数:224千字

? 推荐语

资深算法工程师多年NLP算法与模型研究经验总结。

? 内容简介

本书结合多个真实的落地项目,从自然语言处理(NLP)的任务视角,分门别类地介绍现阶段各NLP任务中深度学习的应用。以任务视角是指以一个个场景项目为视角,这样做可以获得更多的实战经验。本书的每一章都有核心模型的先验链条,这对理解和掌握NLP模型非常有帮助。

本书分为9章,对应9种NLP任务。

第1章介绍分词和词性标注任务。第2章介绍文本分类任务,如情感分析、文章分类与打标签等都是常见的文本分类任务。第3章介绍命名实体识别任务,如提取内容中的姓名和公司名称等,在知识图谱、内容结构化和智能对话等场景中也是该任务的具体应用。

第4章介绍神经机器翻译任务,它是NLP最先商用的独立任务场景。第5章介绍文本纠错任务,它是应用非常广泛的一类NLP任务,因为凡是涉及用户输入的场景或多或少都需要用到纠错任务,否则用户体验就会很差。第6章介绍机器阅读理解任务,该任务偏学术,在实践中往往属于某个大任务下的子任务。

第7章介绍句法分析任务,它是NLP中非常传统的任务。第8章介绍文本摘要任务,该类任务在新闻类业务场景中使用较多。第9章介绍信息检索和问答系统任务,凡是类似于搜索和输入这类需要等待回复的场景都可以归为该任务。

✍️ 作者简介

编著者宋文峰,毕业于中山大学,获计算机硕士学位。先后担任百度、联想和趣头条等互联网大厂的算法团队负责人。熟悉自然语言处理的相关算法和模型,有多年的算法开发、推荐系统开发和自然语言处理项目经验。业余时间兼职自然语言处理讲师,从事相关课程的讲授工作,积累了丰富的经验。

? 出版社介绍

清华大学出版社成立于1980年6月,是由教育部主管、清华大学主办的综合出版单位。植根于“清华”这座久负盛名的高等学府,秉承清华人“自强不息,厚德载物”的人文精神,清华大学出版社在短短二十多年的时间里,迅速成长起来。清华大学出版社始终坚持弘扬科技文化产业、服务科教兴国战略的出版方向,把出版高等学校教学用书和科技图书作为主要任务,并为促进学术交流、繁荣出版事业设立了多项出版基金,逐渐形成了以出版高水平的教材和学术专著为主的鲜明特色,在教育出版领域树立了强势品牌。
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。