Uber客户评价数据集机器学习预测模型
Uber客户评价数据集涵盖了2013至2019年间的客户评价数据,主要用于文本分类任务,尤其是情感分类。数据集包含多种特征,如文本、输入、预测等,数据量在1K到10K之间,语言为英语。数据集的特征包括文本类型、结构化数据(包含文本字段)、列表类型(含标签和分数)以及字符串类型。数据集被划分为训练集,训练集包含2347个样本,总大小为2761597字节,下载文件大小为1691346字节。
数据集可用于分析客户反馈,通过情感极性分析对评论进行分类,并构建机器学习模型进行情感预测。通过可视化工具如Tableau展示分析结果,可以揭示用户对Uber服务的满意度,帮助识别服务中的问题,从而优化用户体验。数据处理过程包括去除不必要的列、使用TextBlob计算情感极性、将情感极性映射到情感类别,并利用TF-IDF Vectorizer和逻辑回归模型进行情感预测。
通过分类报告和Tableau可视化,能够展示模型性能与情感分布趋势。该数据集为研究人员和分析师提供了宝贵的资源,支持深入分析共享经济中的用户行为和反馈,进而推动服务优化与创新。
下载地址
用户评论