1. 首页
  2. 数据库
  3. 其它
  4. 数据筛选特征方法 方差法

数据筛选特征方法 方差法

上传者: 2020-12-31 07:32:11上传 PDF文件 49.63KB 热度 18次
在数理统计中,方差是测算随机变量离散趋势最重要、最常用的指标,方差是各变量值与其均值离差平方的平均数,它是测算数值型数据离散程度的最重要的方法。 当数据分布比较集中时,各个数据与平均数的差的平方和较小,当数据分布比较分散(即数据在平均数附近波动较大)时,各个数据与平均数的差的平方和较大,方差就较大。因此方差越大,数据的波动越大;方差越小,数据的波动就越小,因此需要优先消除方差为0或较小的特征。 sklearn库中的用于特征选择的函数,使用VarianceThreshold法,先要计算各个特征的方差,然后根据阈值,剔除方差大于阈值的特征。 # -*- coding:utf-8 -*- impor
用户评论