1. 首页
  2. 数据库
  3. 其它
  4. 用Python正则实现词频统计并验证Zipf Law

用Python正则实现词频统计并验证Zipf Law

上传者: 2020-12-22 19:43:40上传 PDF文件 72.58KB 热度 27次
注: 以长篇小说《追风筝的人》(中文版为例) Zipf-Law: 在给定的语料中,对于任意一个term,其频度(freq)的排名(rank)和频度(freq)的乘积大致是一个常数。 推荐阅读:Zipf and Heaps Laws’ Coefficients Depend on Language 导入中文分词库jieba,Counter库,matplotlib.pyplot库和re库 import jieba import re import matplotlib.pyplot as plt from collections import Counter jieba 是一个python实现的分
用户评论