《数据治理的核心:超越流程的多要素协同》
一、数据治理包含的要素
图片来源于网络,如有侵权联系删除
1、数据标准
- 数据标准是数据治理的基础要素之一,它定义了数据的格式、编码规则、数据结构等,在金融行业,对于客户的身份信息,有统一的标准来规定姓名的格式(如姓在前名在后,不允许特殊字符等)、身份证号码的格式校验规则等,这有助于确保数据在不同系统、不同部门之间的一致性,如果没有统一的数据标准,数据可能会出现同名异义或者同义异名的情况,导致数据整合和分析的困难。
- 数据标准还涉及到数据的语义标准,即对数据含义的统一界定,对于“销售额”这个数据项,需要明确它是含税销售额还是不含税销售额,是按照订单金额计算还是按照实际到账金额计算等。
2、数据质量
- 数据质量是衡量数据满足业务需求程度的指标,它包括数据的准确性、完整性、一致性、时效性等方面,准确性要求数据反映的内容与实际情况相符,例如企业的财务报表中的数据必须准确无误,否则会影响企业的决策,完整性则意味着数据没有缺失重要信息,如客户订单信息中如果缺少客户联系方式,可能会导致无法顺利发货或提供售后服务。
- 一致性是指在不同数据源或不同时间点上,相同数据的取值应该一致,在企业的多个销售渠道中,同一产品的价格数据应该保持一致,否则会引起市场混乱,时效性要求数据在合适的时间内可用,对于一些实时性要求高的业务,如股票交易数据,过时的数据可能会导致巨大的损失。
3、元数据管理
- 元数据是描述数据的数据,元数据管理包括对元数据的采集、存储、维护和使用,元数据可以记录数据的来源、数据的定义、数据的转换规则等信息,在一个大型数据仓库中,元数据可以告诉用户某个数据字段是从哪个业务系统抽取过来的,经过了哪些清洗和转换操作。
- 通过有效的元数据管理,企业可以更好地理解数据的来龙去脉,提高数据的可追溯性,当数据出现问题时,可以通过元数据快速定位问题的源头,是数据抽取环节的错误,还是数据转换过程中的失误等。
4、数据安全
- 数据安全是数据治理的重要保障要素,它涵盖了数据的保密性、完整性和可用性,保密性要求保护数据不被未经授权的访问和泄露,例如企业的客户隐私数据,如银行卡号、密码等,必须严格保密,完整性除了前面提到的数据质量中的含义外,在数据安全范畴内还包括防止数据被恶意篡改。
- 可用性则确保数据在需要的时候能够被合法用户正常访问和使用,企业的核心业务系统中的数据必须保证7×24小时的可用性,否则可能会导致业务中断,数据安全还涉及到数据的备份与恢复策略,以应对数据丢失或损坏的情况。
5、数据生命周期管理
图片来源于网络,如有侵权联系删除
- 数据如同产品一样,有其生命周期,包括数据的创建、存储、使用、共享、归档和销毁等阶段,在数据创建阶段,要确保数据的初始质量和元数据的准确记录,存储阶段要考虑数据的存储架构、存储成本等因素。
- 使用和共享阶段要遵循数据的安全和合规性要求,在企业内部不同部门之间共享数据时,要确保数据的使用符合企业的数据治理政策,归档阶段要对不再经常使用但仍有价值的数据进行妥善保存,销毁阶段则要按照规定彻底删除无用的数据,以释放存储空间并保护数据安全。
6、数据治理流程
- 数据治理流程是对数据治理活动进行有序组织的一系列步骤,它包括数据治理的规划、数据标准的制定流程、数据质量的评估与改进流程、元数据的管理流程、数据安全的保障流程以及数据生命周期的管理流程等,数据质量的评估流程可能包括确定评估指标、收集数据样本、进行质量评估、分析问题原因、制定改进措施等环节。
- 数据治理流程为数据治理的各项工作提供了规范的操作框架,确保各项工作有序进行,不同部门和人员之间能够有效协作。
二、各要素之间的关系
1、数据标准与其他要素的关系
- 数据标准是数据质量的前提,只有在统一的数据标准下,才能准确地评估数据的质量,如果没有明确的客户地址数据标准,就无法判断一个地址数据是否完整和准确,数据标准也是元数据管理的重要内容,元数据需要记录数据是否符合标准等相关信息。
- 在数据安全方面,数据标准可以帮助定义哪些数据是敏感数据,从而制定相应的安全策略,对于数据生命周期管理,数据标准影响着数据在不同阶段的格式、存储要求等,在归档阶段,按照数据标准对数据进行整理后再归档。
2、数据质量与其他要素的关系
- 良好的数据质量是数据安全的基础,如果数据质量差,例如数据存在大量错误或缺失,那么数据安全措施可能无法有效实施,不准确的数据可能会被误当作正常数据进行安全保护,而实际上这些数据可能已经失去了保护的价值。
- 数据质量与元数据管理密切相关,元数据可以为数据质量的评估提供依据,通过元数据可以了解数据的来源、转换过程等信息,从而有助于发现影响数据质量的因素,在数据生命周期管理中,不同阶段对数据质量有不同的要求,例如在数据共享阶段,需要保证数据质量以满足其他部门或外部合作伙伴的需求。
3、元数据管理与其他要素的关系
图片来源于网络,如有侵权联系删除
- 元数据管理为数据安全提供支持,通过元数据可以了解数据的访问权限、数据的敏感度等信息,从而更好地实施数据安全策略,在数据标准的制定过程中,元数据可以记录标准的制定过程、参与人员等信息,便于标准的维护和更新。
- 在数据生命周期管理中,元数据可以跟踪数据在各个阶段的状态变化,如数据何时从生产环境迁移到归档环境等,对于数据质量的改进,元数据可以提供数据的历史信息,帮助分析数据质量问题的根源。
4、数据安全与其他要素的关系
- 数据安全贯穿于数据生命周期的各个阶段,在数据创建时就要考虑安全因素,如数据的加密存储,在数据使用和共享过程中,要确保数据的安全访问控制,数据安全也影响着数据质量,如果数据遭到恶意攻击被篡改,数据质量就会受到严重影响。
- 在元数据管理中,数据安全要求对元数据本身也要进行保护,因为元数据包含了数据的重要描述信息,对于数据标准,数据安全规定了对标准文档等的保护措施,防止标准被恶意修改。
5、数据生命周期管理与其他要素的关系
- 数据生命周期管理整合了其他要素,在每个阶段都需要考虑数据标准、数据质量、元数据管理和数据安全等问题,在数据存储阶段,要按照数据标准进行存储,保证数据质量,管理好元数据,同时确保数据的安全。
- 不同阶段的数据管理要求不同,这也促使其他要素根据数据生命周期的变化进行相应的调整,在数据销毁阶段,要确保数据安全地被销毁,同时元数据也要进行相应的更新,以反映数据已不存在的状态。
6、数据治理流程与其他要素的关系
- 数据治理流程是协调其他要素的纽带,它将数据标准的制定、数据质量的管理、元数据的管理、数据安全的保障和数据生命周期的管理等活动有序地组织起来,数据治理流程规定了数据质量评估的周期、参与人员等,使得数据质量评估能够持续进行。
- 流程为其他要素的实施提供了规范和指导,同时其他要素的执行情况也会反馈到流程中,促使流程的优化,如果数据安全事件频繁发生,可能需要对数据治理流程中的安全管理流程进行重新审视和调整。
数据治理的核心不是单纯的流程,而是多要素的协同,虽然数据治理流程在组织和协调数据治理活动中起着重要的作用,但数据标准、数据质量、元数据管理、数据安全和数据生命周期管理等要素同样不可或缺,它们相互关联、相互影响,共同构成了数据治理的整体框架,只有全面考虑这些要素并实现它们之间的协同运作,企业才能实现有效的数据治理,提升数据的价值,为企业的决策、创新和发展提供有力支持。
评论列表