24张架构图讲透数据治理核心内容
一、数据治理的框架和核心内容
不同的利益相关者群体对数据治理的关注点不一样,因此各自的视图也不一样。其中管理者视图可以概括为“五域模型”,分别是“管控域”、“过程域”、“治理域”、“技术域”、“价值域”。
图1、管理者视角-数据治理五域模型
管控域:在数据治理战略指导下制订企业数据治理组织,明确组织的责、权、利,岗位编制及技能要求。
治理域:是数据治理的主体,明确数据治理的对象和目标。
技术域:数据治理的支撑手段,指的工具平台。
过程域:是数据治理的方法论。
价值域:通过对数据资产的管控挖掘数据资产的价值,并通过数据的流动、共享、交易变现数据资产。
图2、技术视角:企业大数据治理实践指南框架
数据治理体系,包括数据战略、数据治理管控体系(数据治理组织、制度、流程、管控机制、绩效体系及标准体系)、数据架构、主数据、元数据、指标数据、时序数据、数据质量、数据安全、数据集成与交换、数据开放和共享、数据资产管理能力成熟度评估以及数据价值、数据共享、数据变现等多方面。
图3、数据治理车轮图
接下来从数据战略、数据管控(组织管理、制度体系、流程管理及绩效)、三个核心体系(数据标准体系、数据质量体系、数据安全体系)和工具等分别进行介绍。
图4、企业数据管控和三个核心体系
1、数据战略
数据战略是整个数据治理体系的首要任务,关注整个组织数据战略的规划,愿景和落地实施,为组织数据管理、应用工作的开展提供战略保障,应由数据治理组织中的决策层制定,需要指明数据治理的方向,包括数据治理的方针、政策等。
图5、数据治理顶层规划设计方法论
正确的顶层设计是企业家对未来形势的正确判断,对机会和战略,治理与架构,资本和模式,供应链和数字化,品牌和营销,产品和客户等整体一盘棋的布局。如果说商战就是没有硝烟的战争,那么顶层设计则是整体战的部署。
2、组织管理
组织保障是数据治理成功的关键。组织建设一般包括组织架构设计、部门职责、人员编制、岗位职责及能力要求、绩效管理等内容。数据治理是一项需要企业通力协作的工作,而有效的组织架构是企业数据治理能够成功的有力保障。为达到数据战略目标,非常有必要建立体系化的组织架构,明确职责分工。
图6、某集团数据治理组织架构设置范例
图7、某央企数据治理组织架构设置范例
3、制度体系
保障组织架构正常运转和数据治理各项工作的有序实施,需要建立一套涵盖不同管理粒度、不同适用对象,异覆盖数据治理过程的管理制度体系,从“法理”层面保障数据治理工作有据、可行、可控。
图8、数据治理制度框架
企业的数据治理制度通常根据企业的IT制度的总体框架和指导原则制定,往往包含数据质量管理、数据标准管理、数据安全管理等制度,以及元数据管理、主数据管理、数据指标管理等办法及若干指导手册。
图9、数据治理制度框架体系
图10、数据资产管理规定目录
4、流程管理
制定数据治理的流程框架也是数据治理的重要工作。数据治理流程包括从数据的生产、存储、处理、使用、共享、销毁全生命周期过程中所遵循的活动步骤,以及元数据管理、主数据管理、数据指标管理等流程。
图11、数据治理流程框架体系
5、绩效管理
数据治理考核是保障数据治理制度落实的根本,通过系统的方法、原理来评定和测量企业员工在一段时间内数据治理相关的工作行为和工作效果,进一步激发员工的积极性和创造性,提供员工的数据治理责任心和基本素质。
图12、数据治理绩效体系
6、标准体系
数据标准是实现数据标准化、规范化的前提,是保证数据质量的必要条件。数据标准一般分为元数据标准、主数据标准、数据指标标准、数据分类标准、数据编码标准、数据集成标准等内容。
图13、数据标准化体系
7、质量体系
数据质量管理是对数据的分析、监控、评估和改进的过程。包括规划和实施质量管理技术,以测量、评估和提高数据在组织内的适用性,提高数据对业务和管理的满足度。重点关注数据质量需求、数据质量检查、数据质量分析和数据质量提升的实现能力。
图14、数据质量框架体系
数据质量管理贯穿数据生命周期的全过程,除了明确数据质量管理的策略,还要善于使用数据质量管理的手段及工具,覆盖数据质量需求、数据探查、数据诊断、质量评估、质量提升等方面。
8、安全体系
数据安全管理是为了确保数据隐私和机密性得到维护,数据不被破坏。数据安全体系框架通过3个维度构建而成,包括政策法规、技术层面和安全组织人员。数据安全治理体系框架在符合政策法规及标准规范的同时,需要在技术上实现对数据的实时监管,并配合经过规范培训的安全组织人员,构成了数据安全治理整体架构的建设。
图15、数据安全治理体系
数据安全治理能力建设是一个覆盖数据全部生命周期和使用场景的数据安全体系,需要从决策到技术,从制度到工具,从组织架构到安全技术通盘考虑。
图16、数据数据全部生命周期
9、平台工具
搭建一体化数据平台,满足前台应用准确性、快速性和多样性的数据需求,缩短研发周期、降低技术成本,将数据中心逐步由成本中心向资产中心转变,提升数据价值,实现五个打通:
(1)横向打通:破除部门壁垒,横向跨专业间的分析挖掘融通;
(2)纵向打通:内部多层级数据打通,形成统一资源目录。上下级数据共享交换;
(3)内外打通:消除内外数据的鸿沟,实现内外部数据的关联分析;
(4)管理打通:建立企业标准,实现统一管理统计口径;
(5)服务打通:数据中台统一对外提供数据服务和应用构建,与业务系统和数据应用充分协同。
图17、两体系两平台一服务的数据平台总体框架
面向数据全生命周期,提供的一站式数据规划、集成、开发、治理、服务、应用等产品。
图18、数据平台能力框架
从数据接入整合能力、数据共享应用能力、数据综合管理能力、基础组件支撑能力四方面,全面建设数据能力,培育能力体系,以多类型大数据量的汇聚为基础,以统一模型为标准,为前端应用提供灵活的统一数据服务。
图19、数据平台四大支撑能力
数据治理需要多种数据治理工具软件的支撑,包括以主数据为核心的套装软件、以数据资产目录为核心的数据资源管理工具、以元数据和数据模型为核心的数据中台,此外还有时序数据、数据交换等。
数据治理管理工具包括数据架构工具、元数据管理工具、数据指标管理工具、主数据管理工具、时序数据管理工具、数据交换与服务工具、质量管理工具和安全管理工具等。
图20、数据治理工具集
图21、以元数据治理为核心的数据治理工具
主数据服务业务视图包括8个业务域、32个业务子域及相关业务活动,主数据管理工具是主数据全生命周期管理的平台,也是主数据标准、运维体系落地的重要保障。
图22、以主数据治理为核心的数据治理工具
主数据治理平台是企业数据规划、数据标准落地的载体,实现数据治理统一标准、统一规则的支撑。
图23、主数据管理工具-逻辑架构
二、人工智能是大数据治理核心方向
“无治理、不分析”,没有高质量的数据,就不会有可信的AI。数据治理是人工智能基础,为人工智能提供高质量的数据输入。有了人工智能加持,数据治理将变得更加高效和智能。人工智能技术在数据采集、数据建模、元数据管理、主数据管理、数据标准、数据质量及数据安全等领域有着深入的应用。
图24、人工智能技术在数据治理中的应用
三、结束语
数据治理的发展是伴随着不同行业对数据资源资产化、数据确权与合规、数据价值创造与共享、隐私保护的认识、研究和实践的一个演进过程,是一项繁杂、长期的工作,需要工匠精神、锲而不舍。
注:本文转自源架构师修炼之道,侵删,如需转载请联系原作者!