论文研究基于词条属性聚类的文本特征选择算法.pdf

Name: 论文研究基于词条属性聚类的文本特征选择算法.pdf
Rating: 4.5 (81 reviews)
Author: u735696828

上传者：u735696828 2019-09-04 02:05:09上传 PDF文件 1.16MB 热度 81次

文本挖掘之前首先要对文本集进行有效的特征选择。传统的特征选择算法在维数约减及文本表征方面效果有限，并且因需要用到文本的类别信息而不适用于无监督的文本聚类任务。针对这种情况，设计一种适用于文本聚类任务的特征选择算法，提出词条属性的概念。首先基于词频、文档频、词位置及词间关联性构建词条特征模型，重点研究了词位置属性及词间关联性属性的权值计算方法，改进了Apriori算法用于词间关联性属性权值计算；然后通过改进的K-means聚类算法对词条特征模型进行多次聚类完成文本特征选择。实验结果表明，与传统特征选择算法相比，该算法在获得较好维数约减率的同时提高了所选特征词的文本表征能力，能有效适用于文本聚类任务。

下载地址

用户评论

更多下载

下载地址

立即下载

用户评论

论文研究基于词条属性聚类的文本特征选择算法.pdf

文本挖掘之前首先要对文本集进行有效的特征选择。传统的特征选择算法在维数约减及文本表征方面效果有限，并...

大小：0B | 2019-09-04 02:05:09
论文研究Web文本特征选择算法的研究.pdf

以向量空间模型作为Web文本的表示方法，结合Web文本的结构特征对向量空间模型中的特征选择算法进行了...

大小：131KB | 2020-07-29 07:16:20
论文研究一种基于特征聚类的特征选择方法.pdf

特征选择是数据挖掘和机器学习领域中一种常用的数据预处理技术。在无监督学习环境下，定义了一种特征平均相...

大小：0B | 2019-09-04 00:49:04
聚类特征选择算法总数

本文档讲述了聚类特征选择算法的相关信息，内容详细全面，非常适合初学者学习。

大小：0B | 2019-05-27 10:34:12
论文研究统计文本特征选择方法.pdf

在分析H.264/AVC编码过程中存储器带宽需求的基础上，提出一种DRAM控制器结构，并实现了几种不...

大小：698KB | 2020-07-16 05:39:28
论文研究基于特征选择与谱聚类的视觉词典构建算法.pdf

传统的视觉词典一般通过K-means聚类生成，一方面这种无监督的学习没有充分利用类别的先验信息，另一...

大小：0B | 2020-01-08 05:06:38
论文研究基于filterwrapper模式的特征选择算法.pdf

特征选择是数据挖掘、机器学习和模式识别中始终面临的一个重要问题。针对类和特征分布不均时，传统信息增益...

大小：0B | 2020-02-03 05:55:32
论文研究聚类分析中特征选择的研究.pdf

介绍了一种新颖的基于高斯混合模型的特征选择算法，并且应用该方法的结果对模拟数据和真实数据进行聚类。实...

大小：0B | 2019-08-17 12:33:59
论文研究基于高性能特征选择函数的Web文档聚类算法.pdf

目前常用向量空间模型 VSM(vector space model)表示文档，造成的高维问题制约了其...

大小：632KB | 2020-07-27 07:44:04
论文研究一种面向聚类的加权特征选择算法.pdf

针对面向聚类的特征选择算法效率和效果无法兼顾，并且对高维数据适用度不高的问题，提出了一种基于邻域分析...

大小：1MB | 2020-07-16 21:38:54
论文研究基于线性组合文本特征选择方法.pdf

常用文本分类特征选择算法主要通过某种评价函数来计算单个特征对类别的区分能力，由于仅考虑了特征和类别之...

大小：346KB | 2020-07-16 05:39:28
论文研究基于核稀疏表示的特征选择算法.pdf

为了解决高维数据在分类时导致的维数灾难，降维是数据预处理阶段的主要步骤。基于稀疏学习进行特征选择是目...

大小：1.54MB | 2020-07-17 05:08:02
论文研究基于改进量子进化算法的特征选择.pdf

特征选择作为一种数据预处理技术被广泛研究，由于其具有NP难度而一直无法找到有效的求解方法。鉴于目前在...

大小：0B | 2020-05-17 18:01:34
论文研究基于聚类粗糙集的集成特征选择方法.pdf

基于聚类粗糙集的集成特征选择方法，刘铭阳，龚萍，邻域粗糙集是处理连续型数据特征选择的一种重要方法，能...

大小：0B | 2019-09-06 06:39:11
论文研究使用优化模拟退火算法的文本特征选择.pdf

在文本分类中，特征空间维数通常高达几万，甚至远远超出训练样本的个数，这是一种十分普遍的现象。为了提高...

大小：947KB | 2020-07-16 20:15:15
论文研究基于K均值聚类的无监督的特征选择方法.pdf

模式识别方法首先要解决的一个问题就是特征选择,目前许多方法考虑了有监督学习的特征选择问题,对无监督学...

大小：0B | 2019-09-15 04:25:33