聚类是一种重要的无监督分类方法,它基于一些相似性度量将数据分为不同的组。 K-means逐渐成为聚类的一种方法,并在不同的应用中得到了广泛的应用。 质心初始化策略是K-means聚类的关键步骤。 通常,K-means具有三种有效的初始化策略来改善其性能,即Random,K-means ++和基于PCA的K-means。 在本文中,我们设计了一个实验,以评估UCI ML手写数字数据集上的这三种策略。 实验结果表明,三种K均值初始化策略发现了几乎相同的聚类质心,并且它们具有几乎相同的聚类结果,但是基于PCA的K均值策略显着提高了运行时间,并且比其他两种更快策略。