Data Modeling with Postgres 源码
要求:设计一个数据仓库来存储有关不同用户正在播放的所有歌曲的数据。这个想法是使数据适合于分析。 解决方案: 创建一个具有4个维度表和一个事实表的数据仓库:用户-用户维度及其属性Songs-歌曲维度及其属性artist-艺术家维度及其属性time-time维度及其属性songplays-在事实表中播放所有歌曲系统以及指向不同维度的链接 将数据插入数据仓库 该解决方案包含以下文件: sql_queries.py:包含删除和创建数据库对象所需的所有sql查询,以及将数据插入表中的插入查询。 create_tables.py:包含用于创建“ sparkify”数据库以及创建事实和维度表的函数。 etl.py:解析json文件并将数据插入数据仓库中的表中。 test.py:连接数据库并查询表是否已按预期填充。 脚步: 打开一个新的jupyter笔记本文件。 执行以下语句创建数据库对象:%ru
用户评论