基础信息
书名:Python文本分析
作者:【印度】迪潘简·撒卡尔
出版社:机械工业出版社
出版时间:2018年5月
ISBN:9787111593249
字数:357千字
推荐语
本书介绍了有关Python文本分析的常用算法。
内容简介
本书遵循结构化和综合性的方法,介绍了文本和语言语法、结构和语义的基础概念和高级概念。从自然语言和Python的基础开始,进而学习先进的分析理念和机器学习概念。全面提供了自然语言处理(NLP)和文本分析的主要概念和技术。本书包含了丰富的真实案例实现技术,例如构建分类新闻文章的文本分类系统,使用主题建模和文本摘要分析app或游戏评论,进行热门电影概要的聚类分析和电影评论的情感分析。介绍了基于Python和流行NLP开源库和文本分析实用工具,如自然语言工具包(nltk)、gensim、scikit-learn、spaCy和Pattern。
作者简介
作者迪潘简·撒卡尔(Dipanjan Sarkar)Intel 数据科学家。他的主要研究领域是数据分析、商业智能、应用开发以及大型智能系统构建。他专注于数据分析实践领域已经有四年多了,通过约翰霍普金斯大学的网络公开课程获得了数据科学专业认证,并且还出版了几本关于R语言和机器学习的书。
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。