基于MovieLens数据集做的关联规则
Children和Animation这俩题材是最相关的了常识也可以分辨出来.电影题材关联数据集MovieLens small https grouplens.org datasets movielens提升度lift物品集A的出现对物品集B的出现概率发生了多大的变化lift A B confidenceA B support B p B A p B现在有1000个消费者有500人购买了茶叶其中有450人同时购买了咖啡另50人没有.由于confidence茶叶咖啡45050090由此可能会认为喜欢喝茶的人往往喜欢喝咖啡.但如果另外没有购买茶叶的500人其中同样有450人购买了咖啡同样是很高的置信度90由此得到不爱喝茶的也爱喝咖啡.这样看来其实是否购买咖啡与有没有购买茶叶并没有关联两者是相互独立的其提升度9045045010001.
下载地址
用户评论