1. 首页
  2. 数据库
  3. 其它
  4. scattertext:关于文档类型之间语言差异的漂亮可视化 源码

scattertext:关于文档类型之间语言差异的漂亮可视化 源码

上传者: 2021-02-08 07:34:30上传 ZIP文件 7.38MB 热度 3次
分散文字0.1.0.0 一种用于在语料库中查找区别性术语并将其显示在交互式HTML散点图中的工具。 与术语相对应的点被有选择地标记,以使它们不与其他标记或点重叠。 以下是使用Scattertext创建可视化术语的示例,该术语在2012年美国政治公约中使用。 在散点图中,最关联的2,000个字母组合显示为点。 他们的x轴和y轴分别是共和党和民主党议长使用它们的密集等级。 import scattertext as st df = st.SampleCorpora.ConventionData2012.get_data().assign( parse=lambda df: df.te
下载地址
用户评论