Pandas剔除混合数据中非数字的数据操作
首先读入数据,可以发现提示:Columns have mixed types,这里Columns 是指标值混有字符串格式数据在进行数据分析与清理中,我们可能常常需要在数据集中去掉某些异常值。anaconda已经有这个包了,纯净版python的可以自行pip安装。更具体来说,例如,对于appID这个属性,我们想去掉appID=278和appID=382的样本。另外,我们有时候并不只是考虑某一列,还需要考虑另外若干列的情况。其实,在这里我们看到,就是由两部分组成的,第一部分就是appID中等于278和382的,另外一部分就是appPlatform中等于2的。对于数据集df,我们想过滤掉creativeID(第一列)中ID值大于10000的样本。
用户评论