natasha:解决基本的俄罗斯NLP任务针对较低级别的Natasha项目的API 源码
Natasha解决了俄语的基本NLP任务:标记化,句子分段,单词嵌入,形态标记,词形化,短语规范化,语法解析,NER标记,事实提取。 新闻文章的每项任务质量均与当前的SOTA相似或更高,请参阅。 娜塔莎(Natasha)不是研究项目,其基础技术是为生产而构建的。 我们注意模型大小,RAM使用率和性能。 模型在CPU上运行,请使用Numpy进行推断。 Natasha通过一个便捷的API集成了库: 令牌,俄语的句子分段 —紧凑的俄罗斯嵌入 —用于俄罗斯NLP的现代深度学习技术,用于俄罗斯形态,语法,NER的紧凑模型。 基于规则的事实提取,类似于Tomita解析器。 — NER和语法标
用户评论