《机器学习实战》kNN学习笔记(一)
概述 k-近邻算法采用测量不同特征值之间的距离方法进行分类 优缺点 优点:精度高、对异常值不敏感、唔数据输入假定 缺点:计算复杂度高、空间复杂度高。 适用数据范围:数值型和标称型 标称型:标称型目标变量的结果只在有限目标集中取值,如真与假(标称型目标变量主要用于分类)标称型:标称型目标变量的结果只在有限目标集中取值,如真与假(标称型目标变量主要用于分类) 数值型:数值型目标变量则可以从无限的数值集合中取值,如0.100,42.001等 (数值型目标变量主要用于回归分析) k-近邻算法的一般流程 收集数据:可以使用任何方法. 准备数据:距离计算所需要的数值,最好是结构化的数据格式. 分析数据:可
用户评论