数据仓库作为信息工程领域的重要概念,自提出以来便引起了广泛关注,数据仓库的定义究竟是由哪位信息工程学家提出的呢?答案是W.H.Inmon,他是数据仓库领域的奠基人,为数据仓库的发展做出了巨大贡献。
W.H.Inmon,全名William H.Inmon,是美国著名的数据库和大数据专家,他在20世纪80年代提出了数据仓库的概念,并详细阐述了数据仓库的定义、架构和实施方法,Inmon认为,数据仓库是一个面向主题的、集成的、稳定的、时变的、非易失的数据集合,用于支持管理层的决策。
数据仓库由以下几个部分构成:
图片来源于网络,如有侵权联系删除
1、数据源:数据源是数据仓库的基础,它包括内部数据源和外部数据源,内部数据源主要是指企业内部的各种业务系统,如ERP、CRM等;外部数据源则是指来自互联网、政府部门、合作伙伴等的数据。
2、数据抽取:数据抽取是指将数据源中的数据抽取到数据仓库中,数据抽取可以分为全量抽取和增量抽取,全量抽取是指将数据源中的所有数据一次性抽取到数据仓库中;增量抽取是指只抽取数据源中发生变化的数据。
3、数据清洗:数据清洗是指在将数据源中的数据抽取到数据仓库之前,对数据进行处理,以确保数据的质量,数据清洗主要包括数据去重、数据转换、数据标准化等。
4、数据加载:数据加载是指将清洗后的数据加载到数据仓库中,数据加载可以分为批量加载和实时加载,批量加载是指将数据一次性加载到数据仓库中;实时加载是指将数据实时加载到数据仓库中。
图片来源于网络,如有侵权联系删除
5、数据模型:数据模型是数据仓库的核心,它包括实体模型、关系模型和维度模型,实体模型用于描述业务实体及其关系;关系模型用于描述实体之间的联系;维度模型用于描述业务实体的属性。
6、数据存储:数据存储是指将数据仓库中的数据存储在数据库中,数据存储可以分为关系型数据库和非关系型数据库,关系型数据库主要用于存储结构化数据;非关系型数据库主要用于存储非结构化数据。
7、数据访问:数据访问是指用户通过查询、分析、报告等方式获取数据仓库中的数据,数据访问可以分为SQL查询、OLAP查询和报表等。
8、数据管理:数据管理是指对数据仓库中的数据进行管理,包括数据备份、数据恢复、数据安全等。
图片来源于网络,如有侵权联系删除
数据仓库的发展历程可以追溯到20世纪80年代,当时W.H.Inmon提出了数据仓库的概念,并逐渐得到业界的认可,随着信息技术的发展,数据仓库逐渐从单一的数据源向多源数据集成发展,从结构化数据向非结构化数据拓展,数据仓库已成为企业信息化建设的重要组成部分,广泛应用于金融、电信、零售、医疗等多个行业。
在我国,数据仓库的发展也取得了显著成果,近年来,我国政府高度重视大数据产业发展,数据仓库作为大数据技术的重要组成部分,得到了广泛的应用,我国企业在数据仓库领域也涌现出一批优秀的企业和产品,为我国大数据产业的发展提供了有力支撑。
数据仓库是由W.H.Inmon提出的重要概念,其发展历程可以追溯到20世纪80年代,数据仓库由数据源、数据抽取、数据清洗、数据加载、数据模型、数据存储、数据访问和数据管理等多个部分构成,随着信息技术的不断发展,数据仓库在各个行业中的应用越来越广泛,为我国大数据产业的发展提供了有力支持。
评论列表