干货|一家企业,如何0-1搭建数据治理体系?
来源:引流技巧
编辑:引流技巧
时间:2025-10-04







/ 字节数据治理演进阶段 /
字节数据治理演进阶段分为6个阶段: 1.业务第一原则:坚持业务第一原则,解决业务实际遇到的治理痛点 2.优先稳定建设:优先解决交付稳定,保障数据链路与产出稳定,减少交付延迟 3.保障数据质量:核心链路质量管控,配置强质量规则,自动熔断,避免全链路数据污染;加强事前检查,从源头加强质量控制;完善事后评估,为每一张表建立健康档案,持续改进。 4.关注数据安全:冗余权限识别,消除授权风险;数据分类分级,风险定义与多策略控制,减少安全风险 5.重视成本优化:基于多种规则的与完备的治理元数仓,提供低门槛的治理产品能力,快速优化存储 6.提高员工幸福感:在帮助业务完成数据治理的后,还需要考虑团队的负载压力,报警治理,降低员工起夜率;归因分析,快速排查修复故障。 在这里,再介绍字节特色的“0987”量化数据服务标准。这四个数字分别指的是:稳定性 SLA 核心指标要达到 0 个事故,需求满足率要达到 90%,数仓构建覆盖 80% 的分析需求,同时用户满意度达到 70%。 按照这个高标准来要求自己,同时这也是一种自监管的机制,能够有效的防止自嗨,脱离业务需求和价值。 / 字节的部分场景实践 / 下面通过两个例子为大家介绍数据治理在字节的场景实践。 案例一: 问题:字节跳动内部2019年到2020年间,双月内事故数量较多,对业务造成一定影响,且收敛困难,每天都有告警、起夜、对正常开发进度造成影响。 解决方案:采用了分布式用户自治的SLA治理,通过数据分级保障目标管理,在各业务内部进行【拉齐链路-数据分级-广泛共识-系统管理】的行动闭环,系统化保障目标传递和落地。 效果: 截止2020年中,事故以每双月30%环比下降,在1年内达到稳定性问题彻底收敛。 案例二: 问题:抖音的实时数仓治理人员的精力分散,以被动的运动式、“救火”式的工作模式为主。协同效率低,人力投入巨大,缺少可持续性。 解决方案:覆盖质量、成本、SLA、安全等治理方向,以业务评估体系,构建治理方案进行例行诊断,对存量问题进行识别和派发,形成一套【评估->识别->规划->执行->复盘】业务内部分布式自治的治理机制。 效果:从21年至今,治理人员的精力彻底从”运动式“治理的模式中解放出来,更多精力会集中在监督执行与规则优化中,团队起夜率降低30%。质量保障覆盖率达到100%。双月存储优化均在20+PB。

数据治理的关键的重点领域包括可用性、一致性、数据完整性和数据安全性,也包括建立流程来确保整个企业实施有效数据管理。 在传统的数据治理方法论与定义中,注意到他有以下共性特点,同时也是现在大多数公司的实践路径,即:


难点二业务影响大,目标对齐难。需完成存量的资产归属划分、改造生产开发体系,对增量定期人力打标,确保资产归属与权责边界清晰,因可能业务系统改造,会对业务发展造成影响。
3. 需要进行复盘抽查 管理组织定期检查各业务治理过程是否符合公司治理制度,定期检查各项治理结果是否落地,线下复盘与推动不符合预期的治理过程。 难点三 沟通成本高,执行推动难。如何制定适用于不同业务特点与发展阶段的团队的治理评估体系,各团队是否认可评估标准。 为了解决以上三个问题,我们有些新的思考,通过火山引擎大数据研发治理套件DataLeap推出「分布式」的理念。 Governance一词在根源上同Government,1990年代被经济学家和政治科学家重新创造,由联合国、世界货币组织和世界银行等机构进行传播。 其核心有以下两种论述: ● 第一个论述:标准与规范。指的是一定范围内的一致的管理,统一的政策,某一责任区指导以及合适的监管和可问责机制。这种行政力的集中化管理存在一些问题,比如决策成本高,人力投入高、落地阻力大,精力消耗大。 ● 第二个论述:过程与结果。指的是只要关注结果和产出以及业务内部实践,通过分布式协作让业务的治理结果、业务痛点和治理方式及手段在内部闭环,而不是由中台层面统一推动。 我们尝试从第二种论述,即重视过程落地和治理结果产出的出发,更快的落地产品,落地数据治理的产品解决方案。/ 从集中式到分布式 /
基于分布式的数据自治的理念,我们来解决在落地执行上的两个最困难的点。 一、组织制度分布式:尝试将组织的强管理属性转换到监督属性,治理单元与制度设计回归到业务单元。好处是,不强依赖横向中心化组织,业务治理痛点闭环在业务单元,且业务基于自身发展阶段制定治理目标,ROI论证回归业务。 二、权责验收分布式:基于产品体系与落地解决方案,支持业务按需自驱,市场化执行,平台辅助与按需验收。好处是,无须长周期的资产类目梳理,业务系统改造,权责均由业务区分,基于业务单元与多维视角,按需验收治理结果,业务单元内对齐。

/ 我们理解的分布式治理 /
定义:DataLeap以业务单元为数据治理闭环单元,通过完善的产品工具,将管理视角转化为监督视角,解决数据治理落地痛点;各业务团队分布式自运行,整体上达到全局最优,从形态上,适配更多业务特性和发展阶段,从效果上,强推进重落实与结果。 DataLeap通常以业务单元作为一个数据治理闭环,即在业务单元内部完成数据稳定性、质量、存储、计算等治理。同时每个业务单元不是孤立的,也有相互协作,比如A业务单元的数据治理经验可以沉淀为治理模板,供后续其他业务使用。





/ 产品体系 /
以上关于分布式的理解,下面将介绍DataLeap分布式治理的产品体系。

/ 治理双路径 /


1.规划式治理路径案例


2.规划式治理路径案例


/ 治理全规则 /








/ 治理全景-分布式验收 /




/ 复盘管理 /


/ SLA治理 /


/ 数据安全 /
在数据安全层面,主要专注于清理冗余权限,完善分类分级。不同团队对冗余权限定义不同,有的90天无访问算冗余权限,有的70天,有的7天。因此我们提供自定义能力,由业务内部发起review,完成冗余权限的识别和定义规则,识别之后复用诊断能力。/ 资源优化 /


/ 报警归因 /
在报警归因方面,我们能提供所有报警明细,方便查看是否有重复规则,是否有高频报警规则,帮助用户发现无效报警和重复规则,降低告警量和跟起夜率。除此之外,我们也提供业务内部的归因登记和分析能力。 以上是字节跳动在数据治理相关实践。 目前,字节跳动也将沉淀的数据治理经验,通过火山引擎大数据研发治理套件DataLeap对外提供服务。作为一站式数据中台套件,DataLeap汇集了字节内部多年积累的数据集成、开发、运维、治理、资产、安全等全套数据中台建设的经验,助力ToB市场客户提升数据研发治理效率、降低管理成本,欢迎大家点击“阅读原文”来体验。产品介绍
火山引擎大数据研发治理套件DataLeap 一站式数据中台套件,帮助用户快速完成数据集成、开发、运维、治理、资产、安全等全套数据中台建设,帮助数据团队有效的降低工作成本和数据维护成本、挖掘数据价值、为企业决策提供数据支撑。后台回复数字“2”了解产品。








原文始发于微信公众号(字节跳动数据平台)


相关文章:
相关推荐:
栏目分类

最新文章

热门文章
