黑狐家游戏

数据仓库中的逻辑结构数据由什么数据组成,数据仓库的逻辑模型包括哪些

欧气 4 0

本文目录导读:

  1. 事实表
  2. 维度表
  3. 星型模型、雪花模型和星座模型

数据仓库逻辑模型的构成要素

数据仓库中的逻辑结构数据由什么数据组成,数据仓库的逻辑模型包括哪些

图片来源于网络,如有侵权联系删除

事实表

1、定义与作用

- 事实表是数据仓库逻辑模型中的核心组成部分,它主要用于存储业务过程中的度量值,这些度量值是对企业运营过程中可量化事件的记录,在销售业务中,销售额、销售量、销售成本等都是事实表中的典型度量值,事实表反映了企业业务活动的实际情况,是进行数据分析和决策支持的重要依据。

- 事实表中的数据通常具有可加性、半可加性或不可加性,可加性度量值如销售额,可以在不同维度上进行汇总求和;而像温度这样的度量值可能是半可加性的,因为它在某些维度组合下不能简单相加;还有一些如比率等度量值是不可加性的。

2、粒度

- 事实表的粒度定义了事实表中数据的详细程度,它确定了事实表中每行数据所代表的业务含义,在销售事实表中,粒度可以是每个销售订单行项目,这意味着每行数据代表一个具体的销售订单中的一个产品销售记录;也可以是每个销售订单汇总,此时每行数据是一个完整销售订单的总体信息,较细的粒度能够提供更详细的业务信息,但数据量会更大,存储和处理成本也更高;较粗的粒度则数据量相对较少,但可能会丢失一些细节信息。

3、事实表的类型

事务事实表:它记录了业务过程中的每一个事务操作,以电商平台为例,每次用户下单购买商品都会在事务事实表中生成一条记录,包含订单编号、商品编号、购买数量、购买金额等信息,事务事实表能够精确地反映业务活动的细节,适用于对业务操作的实时监控和分析,如订单处理流程的优化、库存的实时管理等。

周期快照事实表:这种事实表按照固定的周期对业务状态进行记录,企业可以每天对库存水平进行快照记录,包括每个仓库、每种商品的库存数量、库存成本等信息,周期快照事实表有助于分析业务状态在不同时间段的变化情况,如分析库存的季节性波动、评估库存周转率等。

累积快照事实表:它主要用于跟踪业务过程从开始到结束的整个生命周期状态,在订单处理流程中,从订单创建、支付、发货到最终签收的各个关键状态的时间戳和相关信息都会记录在累积快照事实表中,这种事实表适合于分析业务流程的效率和持续时间,如分析订单的平均处理时长、找出流程中的瓶颈环节等。

数据仓库中的逻辑结构数据由什么数据组成,数据仓库的逻辑模型包括哪些

图片来源于网络,如有侵权联系删除

维度表

1、定义与作用

- 维度表是对事实表中数据进行描述和分类的表,它为事实表中的度量值提供了上下文信息,使得用户能够从不同的角度对事实数据进行分析,在销售事实表中,维度表可以包括产品维度表、客户维度表、时间维度表和销售渠道维度表等,产品维度表可能包含产品名称、产品类别、产品品牌等信息;客户维度表可能包含客户姓名、客户年龄、客户地理位置等信息,这些维度信息能够帮助企业更好地理解销售数据,如分析不同产品类别、不同客户群体、不同时间段和不同销售渠道的销售业绩。

2、维度的层次结构

- 维度表通常具有层次结构,以地理位置维度为例,可能存在国家 - 省份 - 城市 - 区县这样的层次结构,这种层次结构允许用户在不同的粒度级别上进行数据分析,企业可以先分析全国范围内的销售情况,然后逐步深入到各个省份、城市甚至区县的销售数据,维度的层次结构还可以支持钻取操作,即从高层次数据逐步深入到低层次数据,以发现更详细的业务信息。

3、缓慢变化维

- 在实际业务中,维度表中的数据可能会随着时间发生变化,但这种变化往往是缓慢的,客户的联系方式可能会发生改变,产品的价格可能会调整,对于这种缓慢变化的维度,数据仓库需要采用相应的处理策略,常见的处理缓慢变化维的方法有三种:

类型1:直接覆盖:当维度数据发生变化时,直接用新数据覆盖旧数据,这种方法简单,但会丢失历史信息,如果采用类型1处理客户维度表中的客户联系方式变化,那么之前的联系方式将无法查询到,适用于对历史数据不太关注的情况,如某些临时促销活动中对客户信息的简单更新。

类型2:增加新行:当维度数据发生变化时,在维度表中增加一行新记录,同时保留旧记录,并通过一些标识字段来区分不同版本的记录,这种方法能够保留历史信息,但会使维度表的数据量增加,当产品价格调整时,在产品维度表中增加一行新记录,记录新的价格和调整时间等信息,这样就可以查询到产品不同时期的价格情况,适用于需要详细历史数据的场景,如财务审计、市场价格趋势分析等。

类型3:增加新列:当维度数据发生变化时,在维度表中增加新的列来存储变化后的数据,同时保留旧列的数据,这种方法适用于维度数据变化有限且对存储空间不太敏感的情况,对于客户维度表中的客户信用等级,如果信用等级只有少数几个变化状态,如从“普通”变为“良好”再变为“优秀”,可以通过增加新列来记录每次的变化情况。

数据仓库中的逻辑结构数据由什么数据组成,数据仓库的逻辑模型包括哪些

图片来源于网络,如有侵权联系删除

星型模型、雪花模型和星座模型

1、星型模型

- 星型模型是数据仓库逻辑模型中一种简单而常见的结构,它由一个事实表和多个维度表组成,事实表位于中心,维度表围绕在事实表周围,就像星星的形状一样,在星型模型中,维度表与事实表直接相连,没有复杂的层次关系,在一个销售数据仓库的星型模型中,销售事实表与产品维度表、客户维度表、时间维度表和销售渠道维度表直接相连,星型模型的优点是结构简单、查询性能高,因为数据的关联关系比较直接,在进行数据分析时,SQL查询语句相对简单,能够快速地获取所需的数据,它适用于数据集市等对查询性能要求较高、分析需求相对固定的场景。

2、雪花模型

- 雪花模型是星型模型的扩展,在雪花模型中,维度表可能会进一步细化,形成多个层次的子维度表,在产品维度表中,如果产品有类别、品牌等属性,在雪花模型中可能会将产品类别和品牌分别建立单独的维度表,并且这些子维度表与产品维度表之间存在关联关系,雪花模型的优点是能够减少数据冗余,提高数据的一致性,因为它将一些重复的维度数据进行了分解,使得数据结构更加规范化,雪花模型的查询性能相对星型模型可能会稍低一些,因为在查询时可能需要更多的表连接操作,雪花模型适用于对数据规范化要求较高、数据冗余度要求较低的场景,如企业级数据仓库的构建。

3、星座模型

- 星座模型是多个星型模型或雪花模型的组合,在实际的企业数据仓库中,可能存在多个业务主题,每个业务主题都有自己的事实表和相关的维度表,企业既有销售业务主题,又有库存业务主题,在星座模型中,销售事实表和库存事实表可能会共享一些维度表,如时间维度表、产品维度表等,星座模型的优点是能够整合多个业务主题的数据,提高数据的共享性和复用性,方便企业进行跨业务主题的数据分析,如分析销售与库存之间的关联关系,以优化企业的供应链管理,但星座模型的构建相对复杂,需要对企业的业务流程和数据关系有深入的理解。

数据仓库的逻辑模型通过事实表、维度表以及不同的模型结构(星型模型、雪花模型和星座模型),有效地组织和存储企业数据,为企业的数据分析和决策支持提供了坚实的基础。

标签: #数据仓库 #逻辑结构 #逻辑模型

黑狐家游戏
  • 评论列表

留言评论