1. 首页
  2. 数据库
  3. 其它
  4. K Means欠采样处理不平衡样本python实现

K Means欠采样处理不平衡样本python实现

上传者: 2020-12-23 01:34:31上传 PDF文件 40.48KB 热度 12次
K-Means欠采样python实现 1. K-Means欠采样原理 为解决分类问题中效果受样本集类间不平衡,并提高训练样本的多样性,可以使用K-Means欠采样对样本进行平衡处理。该方法利用K-means方法对大类样本聚类,形成与小类样本个数相同的簇类数,从每个簇中随机抽取单个样本与风险样本形成平衡样本集。K-means欠采样过程如下: Step1:随机初始化k个聚类中心,分别为uj(1,2,...,k); Step2:对于大样本xi(1,2,...,n),计算样本到每个聚类中心uj的距离,将xi划分到聚类最小的簇,c(i)为样本i与k个类中距离最近的那个类,c(i)的值为1到k中的一个,则c(i)
下载地址
用户评论