1. 首页
  2. 数据库
  3. 其它
  4. textpipe:Textpipe:清理并从文本中提取元数据 源码

textpipe:Textpipe:清理并从文本中提取元数据 源码

上传者: 2021-04-27 15:51:21上传 ZIP文件 57.47KB 热度 15次
textpipe:清理并从文本中提取元数据 textpipe是一个Python软件包,用于将原始文本转换为干净的可读文本并从该文本中提取元数据。 它的功能包括通过删除HTML标记并从文本中提取元数据(例如单词数和命名实体)将原始文本转换为可读文本。 愿景:textpipe的禅宗 设计用于没有成人监督的生产管道。 随附可充电电池:提供合理的默认值和清晰的示例以进行调整。 带有最新NLP封装的薄包装的统一界面。 尽可能与语言无关。 带上自己的模型。 产品特点 通过删除HTML和其他不可读的结构来清理原始文本 识别文字的语言 从文本中提取单词数,句子数,命名实体 计算文本的复杂度 通过指定
用户评论