scala_portrait.rar
一.用户聚类分析 1.提取特征:用户msisdn,流量类型,上网时长,使用总流量,url访问网址地区 2.选取算法:聚类算法-KMeans 3.确定聚类个数(6个) 4.通过训练模型形成中心点 5.对用户进行聚类 二.性别预测 1.理解需求:行为性别(男(1),女(0)) 2.提取特征:用户msisdn,流量类型,上网时长,使用总流量,url访问网址地区 3.选算法:分类算法(朴素贝叶斯) 4.获取经验样本:打上类别标签(抽取数据,人工打上标签--男--女) 5.评估模型效果(用样本中一部分数据做测试) 6.模型应用于大量待计算数据 三.年龄层次预测 1.理解需求:年龄阶段预测(青年(0),中
用户评论