1. 首页
  2. 数据库
  3. 其它
  4. dend project 3:Udacity数据工程纳米学位项目3:具有S3和Redshift的AWS ETL管道 源码

dend project 3:Udacity数据工程纳米学位项目3:具有S3和Redshift的AWS ETL管道 源码

上传者: 2021-04-26 08:05:02上传 ZIP文件 61.3KB 热度 13次
| | 2020-11-23 项目3:AWS数据仓库 音乐流媒体创业公司Sparkify已经扩大了用户群和歌曲数据库,并希望将其流程和数据转移到云中。 他们的数据位于S3中,位于应用程序上有关用户活动的JSON日志目录中,以及位于应用程序中的歌曲上的具有JSON元数据的目录中。 他们要求数据工程师建立一个ETL管道,该管道从S3提取数据,在Redshift中进行分级,然后将数据转换为一组维度表,供其分析团队使用,以继续寻找用户正在收听的歌曲的见解。 通过运行Sparkify分析团队提供给您的查询,并将您的结果与预期结果进行比较,您将能够测试数据库和ETL管道。 项目概况 在这个项目中,我将
用户评论