基 于 聚 类 改 进 的 KNN 文 本 分 类 算 法
传 统 的 KNN 文 本 分 类 算 法 是 一 种 无 监 督 的 、 无 参 数 的 、 简 单 的 、 较 流 行 的 且 容 易 实 现 的 分 类 算 法 。 但 是 KNN 算 法 在 处 理 文 本 分 类 的 过 程 中 需 要 不 断 地 计 算 待 测 文 本 与 样 本 的 相 似 度 , 当 文 本 数 量 更 大 时 , 算 法 的 效 率 就 会 更 差 。 为 了 提 高 传 统 KNN 算 法 在 文 本 分 类 中 的 效 率 , 提 出 一 种 基 于 聚 类 的 改 进 KNN 算 法 。 算 法 开 始 之 前 采 用 改 进 χ 2 统 计 量 方 法 进 行 文 本 特 征 提 取 , 再 依 据 聚 类 方 法 将 文 本 集 聚 类 成 几 个 簇 , 最 后 利 用 改 进 的 KNN 方 法 对 簇 类 进 行 文 本 分 类 。 实 验 对 比 与 分 析 结 果 表 明 , 该 方 法 可 以 较 好 地 进 行 文 本 分 类
用户评论