1. 首页
  2. 行业
  3. 互联网
  4. QT版本DFA敏感词过滤

QT版本DFA敏感词过滤

上传者: 2020-12-20 09:24:06上传 ZIP文件 11.22KB 热度 16次
该算法基于DFA并进行相应的简化,大概流程是将敏感词库按模块聚合构建成一个词树,然后从头到尾扫描一遍目标文本,当遇到以敏感词树中的索引的字时,查看后面的文本是否构成敏感词,构成敏感词即记录(当查找到敏感词时,记录下来敏感词位置,接着往下匹配,如果后续匹配不上,则以之前匹配到的为主,如若后续匹配上了,则将之前匹配到的节点后移,以此匹配到最长的敏感词) 该DEMO已实现添加敏感词 设置敏感词的等级 敏感词低于何种等级不屏蔽 实现了最长的敏感词匹配(即敏感词为:中国,中国人,中国人民 )当输入:我是一个中国人民时,匹配到中国人民
下载地址
用户评论