用Python正则实现词频统计并验证Zipf Law
注: 以长篇小说《追风筝的人》(中文版为例) Zipf-Law: 在给定的语料中,对于任意一个term,其频度(freq)的排名(rank)和频度(freq)的乘积大致是一个常数。 推荐阅读:Zipf and Heaps Laws’ Coefficients Depend on Language 导入中文分词库jieba,Counter库,matplotlib.pyplot库和re库 import jieba import re import matplotlib.pyplot as plt from collections import Counter jieba 是一个python实现的分
用户评论