Udacity Data Engineering datalake with aws spark:Udacity Data Engineering的第4个项目使

Name: Udacity Data Engineering datalake with aws spark:Udacity Data Engineering的第4个项目使
Rating: 4.5 (45 reviews)
Author: verge4545

上传者：verge4545 2021-04-29 14:24:15上传 ZIP文件 34KB 热度 45次

带有AWS Spark的数据湖 Udacity Data Engineering的第4个项目,使用AWS Spark服务构建Data Lake。该项目在spark AWS S3 Bucket和Amazon spark中实现了Data Lake。了解要解决的问题资料说明建模数据湖项目结构 ETL描述运行ETL管道问题理解为S3上托管的数据湖构建ETL管道。从S3存储桶中加载数据,使用Aws服务中托管的Spark将数据处理到分析表中,然后再将其加载回S3中。资料说明该项目使用“,该是免费提供的音频功能和元数据的集合,包含一百万条当代流行音乐曲目(300 GB)。此数据开放供探索和研究,并且对于该项目,将仅使用来自歌曲数据库的样本和json格式的艺术家信息。歌曲数据集: Json文件位于/ data / song_data目录下。文件格式为: {"num_son

下载地址

用户评论

更多下载

下载地址

立即下载

用户评论

Udacity Data Engineering datalake with aws spark Udacity Data Engineering的第4个项目使

带有AWS Spark的数据湖 Udacity Data Engineering的第4个项目,使用A...

大小：34KB | 2021-04-29 14:24:15
Udacity Data Engineering datawarehouse with aws redshift Udacity Data Engineerin

带有AWS Redshift的数据仓库该存储库用于Udacity的第三个数据工程纳米学位项目。该...

大小：3KB | 2021-04-29 14:24:11
Udacity Data Engineering Udacity数据工程纳米学位DEND源码

数据工程纳米学位 Udacity在开发的项目和资源。项目1: 。使用PostgreSQL开发了一...

大小：1.79MB | 2021-02-01 22:16:29
Udacity Data Engineering P1Data Modeling With Postgres源码

项目1:使用Postgres进行数据建模介绍一家名为Sparkify的初创公司希望分析他们在新音...

大小：1KB | 2021-04-06 13:54:22
udacity data engineering capstone Udacity数据工程纳米级顶石项目源码

项目5-顶石概述该项目的目的是为全球陆地温度和美国人口统计数据集创建一条ETL管道,以形成有关美...

大小：512KB | 2021-04-04 10:04:10
Udacity_Data_Engineering_Lesson3udacity数据工程课程的第3课源码

Udacity_Data_Engineering_Lesson3

大小：10KB | 2021-02-22 18:18:38
Udacity Data Engineering6数据工程的顶峰项目源码

Udacity-数据工程-6 顶石项目关于/简介在数据工程的顶峰项目中,我结合了我在整个程序中学...

大小：37.42MB | 2021-03-23 19:44:02
Udacity Datalake Spark具有Spark的Udacity数据湖源码

Sparkify的Data Lake ELT流程概括介绍该项目将为Sparkify提取歌曲和日...

大小：499KB | 2021-03-02 01:03:04
udacity data engineering nanodegree用于项目上传的Github存储库源码

数据工程纳米课程这GitHub的库是为完成所有完成所需要的项目取得Udacitiy课程。仓库结构...

大小：342KB | 2021-02-10 03:15:28
udacity data engineering nanodegree Github资源库用于项目上传源码

数据工程纳米课程这GitHub的库是为完成所有完成所需要的项目取得Udacitiy课程。储存库结...

大小：576KB | 2021-03-21 09:30:05
Data Engineering

大小：0B | 2019-04-06 17:09:16
Udacity Data Engineering Project2使用Redshift的云数据仓库源码

项目:云数据仓库音乐流初创公司Sparkify已经扩大了用户群和歌曲数据库,并希望将其流程和数据转...

大小：78KB | 2021-03-20 07:54:32
udacity data_a源码

udacity-data_a

大小：4.23MB | 2021-03-07 09:40:40
Udacity Data Science源码

Udacity-Data-Science

大小：7KB | 2021-02-22 18:18:50
Projects Udacity Data Engineering Nanodegree该存储库包含Udacity在整个数据工程纳米学位中开发的所有项目源码

数据工程项目 ! ́ 该存储库包含Udacity在整个数据工程纳米学位中开发的所有项目。使用Po...

大小：3.85MB | 2021-04-08 04:10:40
udacity data engineering nanodegree sparkify data house一家虚构的音乐初创公司Sparkify扩大了用户

数据工程纳米数据仓库一家虚构的音乐初创公司Sparkify已扩大了用户群,并希望将其流程转移到云中...

大小：13KB | 2021-02-23 15:50:42