1. 首页
  2. 移动开发
  3. 其他
  4. Udacity Data Engineering P1 Data Modeling With Postgres 源码

Udacity Data Engineering P1 Data Modeling With Postgres 源码

上传者: 2021-04-06 13:54:22上传 ZIP文件 1.38KB 热度 11次
项目1:使用Postgres进行数据建模 介绍 一家名为Sparkify的初创公司希望分析他们在新音乐流应用程序上收集的有关歌曲和用户活动的数据。 分析团队对了解用户正在收听的歌曲特别感兴趣。 当前,他们没有一种简单的方法来查询数据,该数据位于应用程序上有关用户活动的JSON日志目录中,以及位于应用程序中的歌曲上的具有JSON元数据的目录中。 分析团队希望像您一样的数据工程师使用表来创建Postgres数据库,该表旨在优化歌曲播放分析中的查询。 您的任务是为该分析创建数据库架构和ETL管道。 然后,通过运行Sparkify分析团队提供给您的查询来测试数据库和ETL管道,并将您的结果与预期结果进行比较。 1.数据库设计说明 有两个源数据集,一个称为“歌曲”,另一个称为“ log”。 然后从这两个数据集中创建以下星型模式数据库,以优化歌曲播放分析的查询。 下表如下: 1.1事实表 该星型方案
下载地址
用户评论