< 返回

为什么数据治理很重要?数据治理框架的组件和挑战

2023-03-18 10:01 作者:joseph wu 阅读量:856

数据治理(DG)是管理企业系统中数据的可用性、可用性、完整性和安全性的过程,它基于内部数据标准和也控制数据使用的策略。有效的数据治理可确保数据一致且值得信赖,并且不会被滥用。随着组织面临新的数据隐私法规并越来越依赖数据分析来帮助优化运营和推动业务决策,它变得越来越重要。

一个设计良好的数据治理计划通常包括一个治理团队、一个充当管理机构的指导委员会和一组数据管理员。他们共同制定数据管理标准和政策,以及主要由数据管理员执行的实施和执行程序。理想情况下,除了 IT 和数据管理团队之外,来自组织业务运营的高管和其他代表也会参与。

独立顾问 Nicola Askham 在 2022 年 1 月的一篇博文中写道,虽然数据治理是整体数据管理战略的核心组成部分,但组织需要关注治理计划的预期商业利益才能取得成功。纽约梅隆银行首席数据官埃里克·赫施霍恩 (Eric Hirschhorn) 在 2022 年企业数据世界数字会议期间的一次会议上提出了同样的观点。“结果不能只是良好的治理,”他说。“结果必须是经营更好的企业。”

这份全面的数据治理指南进一步解释了它是什么、它是如何工作的、它提供的商业利益、最佳实践和治理数据的挑战。您还将找到可以帮助治理流程的数据治理软件和相关技术的概述。在整个指南中,超链接指向相关文章,这些文章更深入地涵盖了正在讨论的主题。

为什么数据治理很重要?

如果没有有效的数据治理,组织中不同系统中的数据不一致可能无法得到解决。例如,客户名称在销售、物流和客户服务系统中可能会有所不同。这可能会使数据集成工作复杂化,并产生影响商业智能 (BI)、企业报告和分析应用程序准确性的数据完整性问题。此外,可能无法识别和修复数据错误,进一步影响 BI 和分析的准确性。

这些是制定数据治理计划的一些主要原因。糟糕的数据治理也会阻碍监管合规计划。这可能会给需要遵守越来越多的数据隐私和保护法律的公司带来问题,例如欧盟的 GDPR 和加州消费者隐私法案 (CCPA)。企业数据治理计划通常包括开发适用于所有业务系统的通用数据定义和标准数据格式,从而提高业务和合规性用途的数据一致性。

数据治理目标和收益

数据治理的一个关键目标是打破组织中的数据孤岛。当各个业务部门在没有集中协调或企业数据架构的情况下部署单独的事务处理系统时,通常会形成这种孤岛。数据治理旨在通过协作过程协调这些系统中的数据,各业务部门的利益相关者参与其中。

另一个数据治理目标是确保数据得到正确使用,既可以避免将数据错误引入系统,也可以阻止对客户个人数据和其他敏感信息的潜在滥用。这可以通过制定统一的数据使用政策以及监控使用情况和持续执行政策的程序来实现。此外,数据治理有助于在数据收集实践和隐私要求之间取得平衡。

除了更准确的分析和更强的合规性之外,数据治理提供的好处还包括提高数据质量;降低数据管理成本;并增加了数据科学家、其他分析师和业务用户对所需数据的访问权限。最终,数据治理可以通过为高管提供更好的信息来帮助改进业务决策。理想情况下,这将带来竞争优势并增加收入和利润。

谁负责数据治理?

在大多数组织中,不同的人参与数据治理过程。这包括业务主管、数据管理专业人员和 IT 人员,以及熟悉组织系统中相关数据域的最终用户。这些是主要参与者及其主要治理职责。

首席数据官。首席数据官 (CDO)(如果有的话)通常是负责监督数据治理计划并对其成败负有高层责任的高级管理人员。CDO 的职责包括确保项目获得批准、资金和人员配备;在设立过程中发挥主导作用;监控其进展;并在内部充当它的倡导者。如果组织没有 CDO,则通常由另一位最高层主管担任执行发起人并处理相同的职能。

数据治理经理和团队。在某些情况下,CDO 或相当的执行官——例如企业数据管理主管——也可能是实际数据治理项目经理。在其他情况下,组织会任命一名数据治理经理或负责人专门负责运行该程序。无论哪种方式,项目经理通常都会领导一个全职处理项目的数据治理团队。有时更正式地称为数据治理办公室,它协调流程、领导会议和培训课程、跟踪指标、管理内部通信并执行其他管理任务。

数据治理委员会。不过,治理团队通常不制定政策或标准决策。这是主要由业务主管和其他数据所有者组成的数据治理委员会或委员会的责任。该委员会批准基本数据治理政策和相关的政策和规则,如数据访问和使用,以及实施它们的程序。它还解决了争议,例如不同业务部门之间在数据定义和格式方面的分歧。

数据管理员。数据管理员的职责包括监督数据集以使其保持有序。他们还负责确保数据治理委员会批准的政策和规则得到实施,并确保最终用户遵守这些政策和规则。具有特定数据资产和领域知识的工作人员通常被任命来处理数据管理角色。这在一些公司是全职工作,在另一些公司是兼职。还可以混合使用 IT 和业务数据管理员。

这显示了数据治理过程中的主要参与者以及他们扮演的角色。数据架构师、数据建模师和数据质量分析师和工程师通常也是治理流程的一部分。此外,业务用户和分析团队必须接受数据治理政策和数据标准方面的培训,这样他们才能避免以错误或不当的方式使用数据。您可以在技术作家 George Lawton 撰写的相关文章中了解有关数据治理角色和职责以及如何构建治理程序的更多信息。

数据治理框架的组件

数据治理框架由作为治理计划的一部分实施的政策、规则、流程、组织结构和技术组成。它还详细说明了项目的任务说明、目标和成功的衡量方式,以及项目中各种职能的决策责任和问责制。一个组织的治理框架应该被记录下来并在内部共享,所以每个参与的人都清楚——预先——这个项目将如何运作。

在技??术方面,数据治理软件可用于自动化管理治理程序的各个方面。虽然数据治理工具不是强制性的框架组件,但它们支持程序和工作流管理、协作、治理策略的开发、流程文档、数据目录的创建和其他功能。它们还可以与数据质量、元数据管理和主数据管理 ( MDM ) 工具结合使用。

数据治理实施

数据治理应该是组织的一项战略举措。在一篇关于创建数据治理策略的文章中,咨询公司 TreeHive Strategy 的负责人 Donald Farmer 推荐了一系列要采取的步骤,包括以下待办事项:

  • 识别数据资产和现有的非正式治理流程;
  • 提高最终用户的数据素养和技能;
  • 决定如何衡量治理计划的成功。

在实施数据治理框架之前,Farmer 提到的另一个步骤是识别整个企业中不同数据资产的所有者或保管人,并让他们——或指定的代理人——参与治理计划。然后,CDO、执行发起人或专门的数据治理经理带头创建项目结构,为数据治理团队配备人员,确定数据管理员并正式组建治理委员会。

一旦结构到位,管理数据的真正工作就开始了。必须制定数据治理政策和数据标准,以及定义授权人员如何使用数据的规则。此外,还需要一套控制和审计程序来确保持续遵守内部政策和外部法规,并保证数据在应用程序中以一致的方式使用。治理团队还应记录数据的来源、存储位置以及如何保护数据免受滥用和安全攻击。

数据治理计划通常还包括以下要素:

  • 数据映射和分类。映射系统中的数据有助于记录数据资产以及数据如何在组织中流动。然后可以根据诸如是否包含个人信息或其他敏感数据等因素对不同的数据集进行分类。分类会影响数据治理策略如何应用于单个数据集。
  • 商业词汇表。业务词汇表包含组织中使用的业务术语和概念的定义——例如,什么构成活跃客户。通过帮助建立业务数据的通用词汇表,业务词汇表可以帮助治理工作。
  • 数据目录。数据目录从系统中收集元数据,并使用它来创建可用数据资产的索引清单,其中包括有关数据沿袭、搜索功能和协作工具的信息。有关数据治理策略和执行这些策略的自动化机制的信息也可以构建到目录中。

管理数据治理计划的最佳实践

由于数据治理通常会对数据的处理和使用方式施加限制,因此在组织中可能会引起争议。IT 和数据管理团队之间的一个共同担忧是,如果他们领导数据治理计划,他们将被业务用户视为“数据警察”。为促进业务支持并避免抵制治理政策,经验丰富的数据治理经理和行业顾问建议项目由业务驱动,数据所有者参与其中,数据治理委员会就标准、政策和规则做出决策。

数据治理的培训和教育是计划的必要组成部分,特别是让业务用户和数据分析师熟悉数据使用规则、隐私要求以及他们自己帮助保持数据集一致的责任。通过报告、电子邮件通讯、研讨会和其他外展方法的组合,与企业高管、业务经理和最终用户就数据治理计划的进展进行持续沟通也是必须的。

沟通和培训是Farmer 在第二篇文章中概述的一组七个数据治理最佳实践的一部分。其他一些包括尽可能靠近源系统应用数据安全和隐私规则,在组织的每个级别制定适当的治理策略并定期审查治理策略。

Gartner 分析师 Saul Judah 推荐了一种自适应数据治理方法,该方法将不同的治理策略和风格应用于各个业务流程。他还列出了成功管理数据和分析应用程序的这七个基础:

  • 关注商业价值和组织成果;
  • 关于数据责任和决策权的内部协议;
  • 依赖于数据沿袭和管理的基于信任的治理模型;
  • 遵循一套道德原则的透明决策;
  • 风险管理和数据安全作为核心治理组成部分;
  • 持续的教育和培训,以及监督其有效性的机制;
  • 鼓励广泛参与的协作文化和治理流程。

促进数据治理流程最佳实践的专业协会包括 DAMA International 和 Data Governance Professionals Organization。Data Governance Institute 是一个由当时的顾问 Gwen Thomas 于 2003 年创立的组织,它发布了一个数据治理框架模板和各种关于治理最佳实践的指南。一些信息在其网站上公开提供,而其他材料只能由付费会员访问。其他地方也提供类似的指南——例如,在由 EWSolutions 维护的 DataManagementU 在线图书馆中。

数据治理挑战

通常,数据治理工作的早期步骤可能是最困难的,因为组织的不同部分通常对关键数据实体(例如客户或产品)有不同的看法。这些差异必须作为数据治理过程的一部分加以解决——例如,通过就通用数据定义和格式达成一致。这可能是一项充满争议且难以处理的工作,这就是为什么数据治理委员会需要一个明确的争议解决程序。组织在数据治理方面面临的其他常见挑战包括以下内容。

展示其商业价值。如果没有数据治理计划的预期业务收益的前期文档,获得批准、资助和支持可能会很困难。在她 2022 年 1 月的博客文章中,Askham 表示,企业高管希望在治理计划开始时就知道对他们有什么好处。“如果你不能以他们真正感兴趣并使他们受益的方式回答这个问题,他们就不会感兴趣,”她写道。

在持续的基础上,展示业务价值需要开发可量化的指标,尤其是在数据质量改进方面。这可能包括每季度解决的数据错误数量以及由此产生的收入收益或成本节约。其他常见的数据质量指标衡量数据集的准确性和错误率以及相关属性,例如数据完整性和一致性。详细了解数据治理和数据质量之间的密切联系,以及也可用于显示治理计划价值的其他类型的指标。

支持自助服务分析。向自助服务 BI 和分析的转变通过将数据交到组织中的更多用户手中而带来了新的数据治理挑战。治理计划必须确保自助服务用户的数据准确且可访问,但也要确保这些用户(业务分析师、高管和公民数据科学家等)不会滥用数据或与数据隐私和安全发生冲突限制。用于实时分析的流数据进一步使这些工作复杂化。

治理大数据。大数据系统的部署也增加了新的治理需求和挑战。数据治理程序传统上侧重于存储在关系数据库中的结构化数据,但现在它们必须处理大数据环境通常包含的结构化、非结构化和半结构化数据的混合,以及各种数据平台,包括 Hadoop 和 Spark 系统, NoSQL 数据库和云对象存储。此外,大数据集通常以原始形式存储在数据湖中,然后根据需要进行过滤以供分析使用,这进一步使数据治理复杂化。

关键数据治理支柱

数据治理计划由整个数据管理流程的其他几个方面提供支持。最值得注意的是,这些方面包括以下内容:

数据管理。如前所述,数据管理员负责组织的一部分数据。数据管理员还有助于实施和执行数据治理策略。通常,他们是精通数据的业务用户,是各自领域的主题专家。数据管理员与数据质量分析师、数据库管理员和其他数据管理专业人员协作。他们还与业务部门合作,以确定数据要求和问题。

数据质量。数据质量改进是数据治理活动背后的最大驱动力之一。跨系统的数据准确性、完整性和一致性是成功治理计划的重要标志。数据清理,也称为数据清理,修复数据错误和不一致,它还会关联和删除相同数据元素的重复实例,以协调客户或产品在不同系统中的列出方式。数据质量工具通过数据剖析、解析和匹配功能以及其他功能提供这些功能。从 IT 服务提供商 RadixBay 的高级战略家和顾问 Chris Foot 的文章中获取有关管理数据质量改进工作的技巧。

主数据管理。MDM 是另一个与数据治理流程密切相关的数据管理规程。MDM 计划建立关于客户、产品和其他业务实体的主数据集,以帮助确保数据在整个组织的不同系统中是一致的。因此,MDM 自然地与数据治理相吻合。但是,与治理计划一样,MDM 工作可能会在组织中引起争议,因为部门和业务单位之间在如何格式化主数据方面存在差异。此外,与数据治理相比,MDM 的复杂性限制了它的采用。但两者的结合导致了向由数据治理目标驱动的较小规模 MDM 项目的转变。

数据治理也与信息治理相关,信息治理更广泛地关注信息在组织中的整体使用方式。在高层次上,数据治理可以被视为信息治理的一个组成部分,但它们通常被认为是具有相似目标的独立学科。

数据治理用例

有效的数据治理是管理操作系统中使用的数据以及由数据仓库、数据集市和数据湖提供的 BI 和分析应用程序的核心。它也是数字化转型计划的一个特别重要的组成部分,它可以帮助其他企业流程,例如风险管理、业务流程管理和并购。

随着数据用途的不断扩大和新技术的出现,数据治理可能会得到更广泛的应用。例如,正在努力将数据治理流程应用于机器学习算法和其他人工智能工具。此外,备受瞩目的数据泄露事件和 GDPR 和 CCPA 等法律使得将隐私保护纳入数据治理政策成为治理工作的核心部分。

联系我们
返回顶部