基于线性表和二叉排序树的低频词过滤系统
实习内容:对于一篇给定的英文文章,分别利用线性表和二叉排序树来实现单词频率的统计,实现低频词的过滤,并比较两种方法的效率。实习要求:1.读取英文文章文件(InFile.txt),识别其中的单词。2.分别利用线性表和二叉排序树构建单词的存储结构。当识别出一个单词后,若线性表或者二叉排序树中没有该单词,则在适当的位置上添加该单词;若该单词已经被识别,则增加其出现的频率。3.统计结束后,删除出现频率低于五次的单词,并显示该单词和其出现频率。4.其余单词及其出现频率按照从高到低的次序输出到文件中(OutFile.txt),同时输出用两种方法完成该工作所用的时间。5.计算查找表的ASL值,分析比较两种方法的效率。
用户评论