1. 首页
  2. 大数据
  3. flink
  4. 数据挖掘主要算法.pdf

数据挖掘主要算法.pdf

上传者: 2020-12-16 10:39:47上传 PDF文件 1.34MB 热度 15次
. 朴素贝叶斯 有以下几个地方需要注意 1. 如果给出的特征向量长度可能不同这是需要归一化为通长度的向量这里以文本分类 为例比如说是句子单词的话则长度为整个词汇量的长度对应位置是该单词出现的次数 2. 计算公式如下 其中一项条件概率可以通过朴素贝叶斯条件独立展开 要注意一点就是 的计 算方法而由朴素贝叶斯的前提假设可知 = 因此一般有两种 一种 是在类别为 ci 的那些样本集中 找到 wj 出现
用户评论