颜色分类leetcode driftDatasets 漂移数据集
颜色分类leetcode漂移数据集人造的:该数据集由50000个实例组成,具有三个属性,其中只有两个是相关的。两个类别的决策边界由f 1 + f 2 = b给出,其中f 1 、f 2是两个相关特征和ba预定义阈值。通过每12500个样本更改b的值,使用四种不同的概念模拟突然漂移。还包括10%的噪音。 d维空间中的超平面在位置和方向连续加法上不断变化。我们在MOA中使用了与(10维,2类,delta=0.001)相同的参数化的随机超平面生成器。具有随机初始位置、权重和标准偏差的高斯分布在d维空间中以恒定速度v移动。权重控制高斯样本之间的划分。我们在MOA中使用了随机RBF生成器,其参数化与(10个维度,50个高斯,5个类别,v=0.001)中的参数化相同。 (自己的数据集:用于发表时请引用) 15个具有随机协方差矩阵的高斯分布每3000个样本相互替换。因此,切换位置的高斯人的数量每次增加1,直到所有人都同时改变他们的位置。这允许在强度增加的突然漂移的情况下评估算法。在这个数据集中总共发生了67
用户评论