1. 首页
  2. 大数据
  3. spark
  4. SparkStreaming流式日志过滤与分析

SparkStreaming流式日志过滤与分析

上传者: 2020-05-18 13:25:35上传 ZIP文件 938KB 热度 33次
记得自己要引入环境 (1)利用SparkStreaming从文件目录读入日志信息,日志内容包含: ”日志级别、函数名、日志内容“三个字段,字段之间以空格拆分。请看数据源的文件。 (2)对读入都日志信息流进行指定筛选出日志级别为error或warn的,并输出到外部MySQL中。 需要用到的函数 (1)输入采用textFileStream()算子 (2)输出采用foreachRDD()算子 (3)将RDD转为DataFrame (4)DataFrame注册为临时表,使用SQL过滤 (5)将过滤后的数据保存到MySQL
下载地址
用户评论