1. 首页
  2. 数据库
  3. 其它
  4. 数据清洗之 数据离散化

数据清洗之 数据离散化

上传者: 2021-01-29 15:06:28上传 PDF文件 71.42KB 热度 43次
数据离散化 数据离散化就是分箱 一把你常用分箱方法是等频分箱或者等宽分箱 一般使用pd.cut或者pd.qcut函数 pandas.cut(x, bins, right=True, labels) x: 数据 bins: 离散化的数目,或者切分的区间 labels: 离散化后各个类别的标签 right: 是否包含区间右边的值 import pandas as pd import numpy as np import os os.getcwd() 'D:\\Jupyter\\notebook\\Python数据清洗实战\\数据' os.chdir('D:\\Jupyter\\noteboo
用户评论