1. 首页
  2. 数据库
  3. 其它
  4. ODSC_text_analysis:具有空间性和文本性的探索性文本分析材料 源码

ODSC_text_analysis:具有空间性和文本性的探索性文本分析材料 源码

上传者: 2021-04-08 23:35:55上传 ZIP文件 11.52MB 热度 6次
使用spaCy和textacy在Python中进行探索性文本分析 斯科特·贝利(Scott Bailey) 数字研究与奖学金图书馆员版权和数字奖学金中心(CDSC) 北卡罗来纳州立大学图书馆 2021年东部开放数据科学会议讲习班 Python生态系统有许多用于自然语言处理(NLP)的库,这会使开始将文本作为数据进行分析变得令人困惑。 该研讨会将介绍spaCy,它是NLP的强大而自以为是的库,可促进文本数据的分析,而textacy是增加信息检索和语料库分析功能的库。 通过完成此研讨会,您将开发核心技能,这些问题将通过spaCy的标记化,词性标记和命名实体识别来提出文本问题并识别有趣的功能。 您还将学习扩展该分析并将其通过文本扩展到许多文档。 运行研讨会代码 该研讨会中的所有代码都存在于Jupyter Notebooks( .ipynb文件)中。 研讨会代码可以以多种方式运行。 如果您已经
下载地址
用户评论