1. 首页
  2. 大数据
  3. 算法与数据结构
  4. 数据仓库ETL算法详解

数据仓库ETL算法详解

上传者: 2018-12-28 08:05:04上传 PDF文件 111.29KB 热度 59次
1. ETL的定义:是数据抽取(Extract)、转换(Transform)、清洗(Cleansing)、装载(Load)的过程。是构建数据仓库的重要一环,用户从数据源抽取出所需的数据,经过数据清洗,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去; 2. 常用的ETL工具:主要有三大主流工具,分别是Ascential公司的Datastage、Informatica公司的Powercenter、NCR Teradata公司的ETL Automation.还有其他开源工具,如PDI(Kettle)等。
下载地址
用户评论