论文研究 P A.pdf
为了在仅有正例和未标注样本的训练数据集下进行机器学习(positive unlabeled learning,PU学习),提出一种可用于PU学习的平均n依赖决策树(P-AnDT)分类算法。在构造决策树时,选取样本的n个属性作为依赖属性,在每个分裂属性上计算依赖属性和类别属性的共同影响;然后分别选用不同的输入属性作为依赖属性建立多个有差异的分类器并对结果求平均值,构造集成分类算法。最终通过估计正例在数据集中的比例参数p,使该算法能够在PU学习场景下进行分类。在多组UCI数据集上的实验结果表明,与基于贝叶斯假设的PU学习算法(PNB、PTAN等算法)相比,P-AnDT算法有更好更稳定的分类准确率。
下载地址
用户评论