
元数据管理太难了,这是实话。 以前我们公司,数据组和业务组每次开会,那简直就是战场,谁也说服不了谁。报表一出来,数字永远对不上。你问业务方,这个“销售额”到底是怎么算的...
元数据管理太难了,这是实话。
以前我们公司,数据组和业务组每次开会,那简直就是战场,谁也说服不了谁。报表一出来,数字永远对不上。你问业务方,这个“销售额”到底是怎么算的?他说是扣了税的。你问数据组,表里的“sales\_amount”是他们说,是从上游系统直接拉的,那是含税的。这不就乱套了吗?大家就这么混着,直到那件事出了大纰漏。
有个特重要的客户报表,因为我们数据组和财务组对一个关键指标的定义彻底搞错了——名字都一样,但定义差了十万八千里。客户拿着我们的报表,直接跟我们闹翻了。合同没保住,几千万的单子说飞就飞了。当时我们项目经理直接被公司给骂惨了,差点被撤职。
我当时真的吓坏了,周末两天两夜我把自己关在办公室,像个疯子一样,手动去几百个ETL脚本里翻,去对几千个数据字段的注释,就为了证明不是我一个人搞砸的。那份绝望,我现在想起来心脏还抽抽。
当时我就发誓,这破事儿不能再这么干了。元数据管理喊了三年,买了各种大厂工具,但没人用,因为太重了,配置一个字段要点十几下鼠标。狗屁专家,只会说术语。

我决定自己动手,绕开那些花架子。我找了产品,拉了架构师,开了一个紧急会议。我没谈什么“数据治理”高大上名词,我只问了三件事:
我们把所有复杂的东西全扔了。没有去上什么昂贵的平台,我搭了一个简陋的Wiki,或者说,就是一个共享的文档系统。
第一步,我亲自给所有核心业务表定义了“身份证”——唯一的中文名称和业务负责人。这一步花了一周,用动词描述:我们跑遍了所有部门,一个一个地问,逼着他们确认这个词到底代表我做了一个超大的Excel表,里面就放三个东西:表名、中文名、负责人。

第二步,强制要求所有新字段在上线前,必须先在这个Wiki上写清楚
是的,就是这么简单粗暴。我派了一个实习生专门盯着,谁没写就不让他上线。刚开始大家骂我,说我搞形式主义,耽误进度。但不到一个月,效果立马显现了。报表一出问题,大家直接去Wiki查,五分钟就能定位到是定义冲突还是数据错误。
你别听那些卖软件的忽悠,说什么AI智能识别元数据,那都是扯淡。元数据管理的核心不是技术,是人、是规矩。你得先把规矩立起来,让大家用最简单的方式去维护它。我们用最土的办法,成功地把那些数据“黑话”变成了大家都能懂的“普通话”。现在我们团队协作效率,直接翻了一倍。这不比那些几百万的系统管用多了?