论文研究 汉语口语和书面语单词长度分布的比较
在这项研究中,我们将Zipf-Alecseev函数应用于中文散文和对话文本的字长分布。由于有两个潜在的中文单词长度测量单位,因此我们将Zipf-Alecseev函数应用于这两个单位。结果表明,所有字长分布均符合Zipf-Alecseev函数,无论用字符或组件来测量字长。Zipf-Alecseev函数y=cxabln(x)中的参数a和b在不同的文本样式(在我们的情况下是散文和对话)中没有显示出差异。但是,当以不同单位(分别为字符和组成部分)测量字长时,参数会有所不同。这表明Zipf-Alecseev函数对字长度量单位敏感,但对文本样式不敏感。
下载地址
用户评论