ahocorapy:纯Python Aho Corasick库 源码
ahocorapy-在纯Python中快速进行多关键字搜索 ahocorapy是Aho-Corasick算法的纯python实现。 给定关键字列表,可以检查线性时间内给定文本中是否至少存在一个关键字。 比较: 为什么还要使用另一种Aho-Corasick实现? 我们从2016年初开始研究此问题。我们的要求包括结合python2.7的unicode支持。 对于基于C扩展的库(例如 ),这是不可能的。 由于内存爆炸,纯python库非常慢或无法使用。 从那时起,又发布了另一个纯python库 。 该存储库还包含有关不同实现的一些讨论。 还有一个 ,但是它包含注释(“当前构造算法不适用于非常大的关
用户评论