1. 首页
  2. 数据库
  3. 其它
  4. Projects Udacity Data Engineering Nanodegree:该存储库包含Udacity在整个数据工程纳米学位中开发的所有项目 源码

Projects Udacity Data Engineering Nanodegree:该存储库包含Udacity在整个数据工程纳米学位中开发的所有项目 源码

上传者: 2021-04-08 04:10:40上传 ZIP文件 3.85MB 热度 9次
数据工程项目 ! ́ 该存储库包含Udacity在整个数据工程纳米学位中开发的所有项目。 使用Postgres(SQL)进行数据建模 该项目模拟了一个名为Sparkify的Startup音乐流,将关系数据库和数据建模的知识融合在一起,以便使用python开发一个ETL管道。 该项目的目标是创建一个Postgres数据库,其中包含旨在优化歌曲播放分析查询的表。 这里使用了诸如OLAP和Fact and Dimension Tables以及Star Schema之类的概念,以创建高效的ETL管道,该管道仅需几个命令即可运行必要的查询,以从JSON文件生成数据库。 在项目结束时,将创建一个包含用于倍数分析任务的数据的数据库,该数据库可用于任何想使用它的人。 链接:使用 使用Apache Cassandra(NoSQL)进行数据建模 该项目模拟了一个名为Sparkify的启动音乐流,将NoSQ
下载地址
用户评论