最近看到一篇文章,核心观点是“Ontology 不适合做数据治理”。

这篇文章能引起共鸣,不是因为它“反本体”,而是因为它戳中了很多企业项目的真实痛点:

  • 主数据没稳,先讨论本体应用,最后空转。
  • 质量规则没打牢,想靠语义模型一把梭,最后没人维护。
  • 用高成本建模去做全量低价值清洗,ROI 极差。

这些观察,很多都对。

但问题是,很多人读到这里就停了,然后直接下了一个过度结论:
“既然本体不适合治理,那治理就只做质量、标准、血缘、权限就够了。”

这一步,才是真正危险的地方。

因为它把“治理”缩窄成了“数据后勤”,把最难也最关键的部分——语义一致与行动执行——从治理议程里删掉了。


先把争论点摆正:不是“本体能不能治理”,而是“治理分几层”

在这里插入图片描述

企业里的“治理”,至少分三层:

1)底座治理:保证数据可用、可控、可追溯

这一层大家最熟:

  • 数据质量
  • MDM
  • 数据标准
  • 元数据与血缘
  • 权限与合规

这层是地基。地基不稳,上层都站不住。

2)语义治理:保证概念一致、规则一致、边界一致

这一层是很多团队缺的:

  • 什么叫“高风险客户”?
  • “异常订单”在销售、风控、客服是不是同一语义?
  • 同一个规则在不同系统里有没有被重写?

语义治理要解决的不是“字段有没有值”,而是“这个值在业务上到底是什么意思”。

3)行动治理:让规则进入流程与 Agent 决策

今天做 AI,很多团队已经不是“能不能答”,而是“敢不敢执行”。

要敢执行,必须回答:

  • 这次动作依据了哪条规则?
  • 规则是谁给的?哪个版本?
  • 为什么这个场景触发了A策略而不是B策略?
  • 出问题后能不能回放与追责?

这就是行动治理。

一句话总结:
底座治理管“数据对不对”,语义治理管“意思准不准”,行动治理管“能不能执行且可追责”。


为什么“只做底座治理”在 AI 时代会越来越不够

过去 BI 时代,只要“报表正确率高”,很多问题能被容忍。

但在 Agent 时代,系统会自己做动作:

  • 自动审批
  • 自动派单
  • 自动归因
  • 自动预警

这时如果没有语义与行动治理,企业会出现三类新风险:

风险 1:看起来都对,实际口径打架

字段都齐,血缘也全,但各部门对同一指标定义不同。
最后不是技术问题,是协作失效。

风险 2:规则写在文档里,系统跑的是另一套

会议纪要有“原则”,系统里是临时 patch。
一到复杂场景,团队只剩“谁嗓门大听谁的”。

风险 3:AI 输出看似合理,但无法追责

模型给了答案,业务不敢落地。
因为没人能说清:它为什么这么判、依据哪条可审计规则。

这三类风险,都不是“再加几条质量规则”能解决的。


本体真正该做什么,不该做什么

在这里插入图片描述

先讲边界,避免神话。

本体该做的(高价值区)

  1. 统一关键术语与关系
    把“客户—订单—风险事件—处置动作”的语义链路固定下来。

  2. 沉淀可执行规则
    规则不是一句话,要有触发条件、优先级、冲突处理、适用边界。

  3. 承接上下文授权
    不只看“你是谁”,还看“你在什么业务上下文里请求什么动作”。

  4. 提供可解释证据链
    每次决策能回溯到概念定义、规则版本、执行路径。

本体不该硬做的(低价值区)

  1. 全量低价值清洗(先用 ETL + 质量规则引擎)
  2. 纯物理存储优化(交给数据平台)
  3. 通用权限基线(先 ACL / ABAC)

所以正确关系不是“本体替代治理”,而是:
底座治理保稳定,本体补语义,流程化把语义变行动。


一条能落地的路线:先小闭环,不搞大而全

在这里插入图片描述

很多项目失败,不是方向错,是起手式错。
一上来就做“全企业统一本体”,基本必死:周期长、争议多、业务等不起。

建议分三步走:

第一步:把底座先稳住

  • 锁主数据主键
  • 上最小质量规则(空值、唯一性、时效)
  • 拉通核心血缘

验收看三个硬指标:

  • 关键字段质量达标率
  • 主键冲突率
  • 核心链路可追溯率

第二步:做一个语义最小闭环

  • 只选 1 个高争议场景(如授信解释、异常归因、投诉责任判定)
  • 只建最小语义集(10-20 概念、20-40 关系)
  • 规则全部绑定来源专家、版本号、生效边界

验收看三个结果指标:

  • 争议解释时长下降
  • 跨部门口径冲突下降
  • 规则复用率上升

第三步:把规则接进流程与 Agent

  • 在流程节点里强制规则校验
  • 在 Agent 决策里增加语义约束与审计日志
  • 建回放机制:能复现“为何如此决策”

验收看三个业务指标:

  • 返工率下降
  • 策略执行一致性上升
  • 事故定位时间下降

这条路线的核心不是“快做大”,而是“先做成一个可证明价值的闭环,再扩域”。


一个常见误区:把“本体项目”当“知识建模项目”

很多团队最后做成了“概念图工程”:

  • 图画得越来越漂亮
  • 文档越来越厚
  • 业务动作没有变化

这不是本体的问题,是目标定义错了。

你如果把目标设成“把概念定义清楚”,项目会停在会议室。
你如果把目标设成“让争议减少、返工下降、决策可追责”,项目才会进生产。

所以,评估本体工作,不要只问“建了多少类、多少关系”。
要问:

  • 解释时长是否下降?
  • 争议率是否下降?
  • 返工率是否下降?
  • 审计回放是否可用?

能回答这些,才叫治理能力。


结尾:把对错之争,改成分层协作

回到那篇“本体不适合治理”的文章。

它的价值在于提醒我们:
别把本体当万能工具,别在底座未稳时强行上层建模。

但我们的主观点更进一步:

不是“本体适不适合治理”的二选一。
而是“底座治理 + 语义治理 + 行动治理”三层协同。

最终结论可以写得更准确:

本体不适合替代数据治理底座,但非常适合成为治理上层的语义执行系统。

当企业进入 Agent 时代,真正的竞争力不再只是“数据有没有”,而是:
语义是否一致,规则能否执行,决策是否可解释并可追责。

Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐