幸福香烟

文章
8
资源
0
加入时间
3年0月20天

数据清洗第二章知识点一:基于ETL的数据清洗二:ETL关键技术

ETL是将业务系统的数据经过抽取、清洗转换之后加载到数据仓库的过程,目的是将企业中的不完整数据,重复数据以及错误数据等“脏”数据内容通过清洗转换操作转变为符合企业要求的数据,便于为企业的决策提供分析依据。一:基于ETL的数据清洗ETL是实现商务智能的核心和灵魂。 ETL的实现有多种方式,常见的方式有借助ETL工具、编写SQL语句、将ETL工具和SQL语句结合起来使用。 如果数据源为外部文件,就无法使用SQL语句进行数据清洗工作。二:ETL关键技术ETL关键技术一共有三个,分别是数据的抽取,