pandas数据离散化pandas.cut()和pandas.qcut()
pandas数据离散化 什么叫数据离散化?也可以理解为数据分组。举个简单的例子,我们有一组学生成绩的数据,我们可以将数据按照成绩的最大值和最小值划分为几个相同的区间。假设最高分100分,最低分50分,我们可以划分为两个相同宽度的范围。分别是[50,74]、[75,100]。 统计这两个区间都有多少数据。第二种是根据人数对成绩区间进行划分,所划分的区间人数基本持平。接下来具体通过代码来实现看看。 等宽划分成绩区间 import pandas as pd import numpy as np cutnum = pd.cut(tips['tip'],4) print(tips['tip']的最大值
用户评论