基于关联分析算法的超市销售数据研究
一个以超市销售数据中的饮料为例的关联分析算法,结合了Apriori算法和FP-growth算法,研究顾客购买行为中与饮料相关的模式。测试环境为Python 3.9.6及Jupyter Notebook,包含相关数据集,可供相关课程大作业使用。通过运行结果显示,顾客在购买进口食品时有93.3%的概率再次购买饮料;购买常温熟食类时有92.3%的概率再次购买饮料;购买香烟时有84.97%的概率再次购买饮料;购买糖果巧克力时有91.7%的概率再次购买饮料;购买散装休闲食品时有87.5%的概率再次购买饮料。对比结果发现,Apriori算法在当前数据集上效率较高(时间集中在0.03秒以下),结果易于解读;而FP-growth算法则更容易展示各因素之间的关联性。Apriori算法实现简单,理论易于理解。
用户评论