summarizer:总结wiki页面的Python脚本。使用nltk
总结者是一种基于提取的文本摘要算法。编写这个Python脚本是为了试验NLTK并为给定的文本实现一个总结算法。此项目改编了一篇关于的文章,并遵循了一些已有的算法和方法。需要注意的是:一些Unicode问题仍然存在。在使用时,通过命令行导航到文件夹并运行以下命令:python summarizer.py
。例如,执行命令:python summarizer.py http://en.wikipedia.org/wiki/Nodejs
。
该脚本已在Python 2.7上进行测试,并具有以下依赖项:NLTK和Goose。有关这些依赖项的安装和配置,可以参考以下链接:
Python27安装NLTK的包及依赖:https://www.dude6.com/q/a/405544.html
Python PyTorch实现的CNNDailyMail文本摘要:https://www.dude6.com/q/a/5181893.html
Python NLTK数据:https://www.dude6.com/q/a/5974631.html
文本自动摘要:https://www.dude6.com/q/a/6198415.html
Python Text Summarizer Python自动文本摘要程序源码:https://www.dude6.com/q/a/7512731.html
用户评论