1. 首页
  2. 数据库
  3. 其它
  4. kafka twitter spark streaming:实时计算每个用户的推文 源码

kafka twitter spark streaming:实时计算每个用户的推文 源码

上传者: 2021-02-09 19:44:57上传 ZIP文件 3.07KB 热度 10次
Apache Kafka的Twitter和Spark流 该项目实时统计每个用户包含#GoTS7主题标签的推文。 此外,还会打印用户名和推文计数。 代码说明 身份验证操作已通过Python的Tweepy模块完成。 为Twitter流创建了名为KafkaPushListener的StreamListener。 StreamListener为Kafka Consumer生成数据。 产生的数据已被过滤掉,其中包括《权力的游戏》主题标签。 创建SparkContext来连接Spark集群。 创建了使用“ twitter”主题中的数据的Kafka Consumer。 计算每个用户包含#GotS7
用户评论