credit card fraud 源码
信用卡诈骗 数据集包含2013年9月欧洲持卡人通过信用卡进行的交易。此数据集显示了两天内发生的交易,在284,807笔交易中,我们有492起欺诈。数据集高度不平衡,阳性类别(欺诈)占所有交易的0.172%。它仅包含数字输入变量,它们是PCA转换的结果。遗憾的是,由于机密性问题,我们无法提供有关数据的原始功能和更多背景信息。功能部件V1,V2,...,V28是使用PCA获得的主要组件,尚未通过PCA转换的唯一功能部件是“时间”和“量”。功能“时间”包含数据集中每个事务和第一个事务之间经过的秒数。功能“金额”是交易金额,此功能可用于与示例相关的成本敏感型学习。特征“类别”是响应变量,在发生欺诈时其值为1,否则为0。 灵感识别欺诈性的信用卡交易。 给定类别不平衡率,我们建议使用精确召回曲线下的面积(AUPRC)来测量准确性。混淆矩阵的准确性对于不平衡分类没有意义。在此Jupyter笔记本中,我们
下载地址
用户评论