natural language processing 源码
第十二单元—加密货币的故事 背景 最近有很多关于加密货币的新闻大肆宣传,因此,您可以盘点有关比特币和以太坊的最新新闻头条,以便更好地了解每种硬币的当前公众情绪。 我使用自然语言处理来了解有关比特币和以太坊的最新新闻中的情绪。 我还应用了基本的自然语言处理技术,以更好地理解与硬币价格有关的其他因素,例如文章中提到的常用单词和短语以及组织和实体。 指示 情绪分析 我使用了来获取有关比特币和以太坊的最新新闻,并为每个硬币创建一个情感分数的DataFrame。 自然语言处理 在本节中,我将使用NLTK和Python将每个硬币的文本标记化。 接下来,我查看了每种硬币的ngram和单词频率。 我使用NLTK来生成N = 2的ngram。 我列出了每个硬币的前10个字。 最后,我为每个硬币生成了词云,以总结每个硬币的新闻。 命名实体识别 在本部分中,我为两种硬币都建立了一个命名实体识别模型,并
用户评论