首先,我们先来看下数据库、数据集市、数据仓库以及数据湖的概念。数据库(Database)是按照一定格式和数据结构在计算机保存数据的软件,属于物理层。最早期是广义上的数据库,这个阶段的数据库结构主要以层次或网状的为主,这是数据库的数据和程序间具备非常强的依赖性,应用有一定局限性。我们现在所说的数据库一般指的是关系型数据库。关系数据库是指采用了关系模型来组织数据的数据库,其以行和列的形式存储数据,具有结构化程度高,独立性强,冗余度低等优点。关系型数据库主要用于联机事务处理OLTP(On-Line T