📚 基本信息
- 书名:数字文献资源高维聚合模型研究
- 作者:牛奉高
- 出版社:中国社会科学出版社
- 出版时间:2017/4/1
- 字数:175千字
💡 推荐语
基于元数据的文献聚类新算法研究
📖 内容简介
针对文本挖掘和信息检索中的文本或文献聚类与分类等问题,学术界基于VSM(向量空间模型)主要有两方面的研究,一者是文献表示模型的改进,二者是算法的改进。然而传统的算法对高维稀疏的向量聚类存在不足,一些新的算法也不尽完美,更主要的是聚类算法的效果与数据本身的特征以及信息提取和表示密切相关,特别是在信息有限的情况下,聚类算法的优势也不能得到完美发挥,相比之下,信息的挖掘、提取和文献向量表示就尤为重要。在本文仅限于元数据甚至只有关键词的前提下,文献的表示向量相比一般文本表示就表现得非常稀疏,面对这种情形聚类算法即使是“巧妇”也“难为无米之炊”,因此,本书的重点突破是文献主题语义信息的提取、度量和文献高维向量的新表示方法。基于以上问题和现象,本书以数字文献资源为对象,本着在信息资源聚合中减少对背景知识的依赖,便于推广应用的宗旨,提出了基于文献集本身或者相关领域的共现信息而实现文献聚合的共现潜在语义向量空间模型(CLSVSM)。而且通过实验证实基于CLSVSM的文献聚类表现比基于VSM和GVSM(广义向量空间模型)显著地好。
🏢 出版社介绍
中国社会科学出版社成立于1978年6月,是由中国社会科学院创办并主管的以出版人文社会科学学术著作为主的国家级出版社。1993年和1998年先后荣获中共中央宣传部和国家新闻出版总署授予的全国优秀出版社称号。1993年第一批荣获中共中央宣传部和国家新闻出版署授予的全国优秀出版社称号。
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。
