查看原文
其他

数据中台完蛋了,数据软件行业还是要继续

GEORGE陈果 InfoQ数字化经纬
2024-09-16
△点击上方卡片关注我,回复“实践”,即可获得 AI Agent、RAG、多模态大模型相关的案例资料。
作者 | 陈果  
近日,Gartner 中国宣布在技术风潮曲线上取消“数据中台”,意味着从权威评测机构的角度,对这个名词判了死刑。
同时,Gartner 又推出了一个新名词“数智基建”,从这个词所包括的内容来看(如下图),我觉得和过去几年说的“数据中台”并没有显著的变化,或者说和十多年以来说的“企业级数仓”也并没有什么原则上革命。
分析师说“数智基建厂商”要和云厂商、数据分析服务厂商以及人工智能厂商等进行生态合作——这么说来,“数智基建厂商”就是“数据中台厂商”换了个马甲。我先把话撂在这里,“数智基建”这个词,几年之内又会被分析师们淘汰,因为,在中国当前的企业数字化环境下,不可能存在一体化的“数据中台”或者“数智基建”厂商。
从“数据中台”这个概念几年前被炒起来,至少是在我熟悉的制造业、消费品零售行业里,这个概念不能解决企业的问题,2021 年初,我就对这个概念提出了质疑,参见《数字化转型的误区| “数据中台”概念的局限性》,我认为制造业、消费品企业的数据质量问题主要出在数据生成的源头上,即 ERP、CRM 这些核心业务系统,就我的观察,这类企业基本没有太多的人力资源来对数据进行后期加工,所谓的“数据中台”不可能存在。
到 2022 年年初“数据中台”开始在业界大热时,我在《二论数据中台选型 | 为啥中国这条跑道里跑不出大的创业公司》文中直接质疑国内的“数据中台”创业公司都跑不出来。理由有四:1,SaaS 不普及,导致中国很难出现美国那样的数据技术工具链,2,云平台垄断,不利于数据创业公司生存,3,企业内没人会用这些对使用者有技术能力要求的数据加工和数据管理的工具,4,缺乏社会性标准化的技术栈引导。
写这篇文章大背景是三年前,我接受一位制造业企业客户委托,帮助评估“数据中台”的供应商,借这个机缘,我和同事访谈了当时在国内各种“数据中台”榜单上排名前茅的六、七家厂商,观看了产品演示,我最后得出的结论就是,这玩意儿就是给工程师用的一堆数据加工工具,那家企业如果买回去,不知道给谁用,反正他们自己 IT 部门内部没人玩得转这个东西。
今天,我和国内一位头部数据平台公司的联合创始人探讨了为何国内数据平台软件行业起不来,为何“数据中台”行业满盘尽墨,我总结了一下我的思路,画了这样一张图,企业级数据管理是包括“两大体系、八个环节、一个中心”:
中外企业的数字化环境差别非常大,数据软件行业的发展历程不同,这个行业最初发展是大型机时代的信息管理系统,后来出现了数据库管理软件,90 年代后出现企业应用软件,覆盖了后端的数据库,随着近年来云时代发展,应用软件、数据管理、分析 /AI 服务三者都在云上独立存在,共同形成应用生态:
中国有企业级信息系统也就是最近二十年的事情,因为没有欧美那样的历史发展过程,所以中国企业的数据管理环境和欧美企业有很大差别,具体来说:
1. 大多数中国企业对于企业软件的 OLTP、OLAP 两类软件区分没有概念,造成企业内部在 IT 应用架构和组织设置上,OLAP 层严重不足,组织和人员的能力不匹配。“数据中台”出现在互联网公司,然而互联网公司 OLTP 的建设是非常零碎(所谓的“敏捷”),缺乏规划的,另一方面,互联网公司的商业模式是“数据驱动业务”,无论是公司经营层的经分组,还是在业务运营层的产品组,都大量使用数据分析来进行业务洞察、迭代,所以在中国大型互联网公司里都有专门做数据产品的团队,来服务于经分、产品团队。然而在中国传统行业里,是重 OLTP,轻 OLAP 的。
2. 中国企业 OLAP 软件严重缺乏用户:OLAP 和 OLTP 类的产品应用模式不太一样。OLTP 软件由于将数据底层、算法逻辑进行了封装,企业应用人员更多关注在业务逻辑层;而 OLAP 软件需要对数据进行直接的加工,具有较高的开发技术要求,而中国企业的普遍现象是企业内缺乏数据工程师(写 SQL 来加工数据的)和数据科学家(用 Python 编程或 MatLab 一类工具来做机器学习模型的),另一方面,业务人员不会用 BI 来建立分析模型(别说玩转 BI,中国企业有多少能把 Excel 玩转),所以,所谓“数据中台”就根本没有用户基础。过去有些中国大型企业(例如金融机构、通讯运营商等)建立数据中台,实际上不是给自己企业用户用的,而是给多个外包开发商进场工作时,统一标准和开发平台用的。
3. 国外已经形成行业公认的数据软件的技术栈划分(例如现代数据栈 MDS),基于技术栈划定的标准化产品跑道,各家厂商在这些跑道里做深,形成了行业生态。中国情况是政企类客户的技术决策者很多人不懂、不专业,没有行业标准,造成厂商和业务方都热衷于项目总包,厂商为了占据客户心智和钱包份额,制造竞争屏障而乱忽悠概念、名词,搞“数据中台”这种大而全、似是而非的东西。
我给这位头部数据平台公司的联合创始人的建议是:从公司发展战略上,国外的技术商业路线是对的,中国社会的这种做法是错的,要有战略定力。
总结下来,我认为 Gartner 新造的名词“数智基建”在中国企业信息化领域也不会成为一个集成的软件产品,这类产品在中国目前找不到用户,具体来说,我对行业的观点是:
1. 短期来看,中国企业的数据软件技术栈不宜过于复杂,“企业级数仓”这种东西虽然在国外很普及,但是在中国,大多数企业根本就玩不转;我认为大多数中国企业建设数据能力,应该是先把 BI 玩转,先不要去急着建数仓,理解 OLTP 和 OLAP 是两种不同性质的系统,简化在数据源和数据分析之间的数据管道。
2. 中期来看:提升企业“管数、用数”的组织能力,建立数据工程团队,国外大型企业的一般实践是,数据工程和数据治理是属于企业集中的 IT 组织的职能范畴,而使用数据工程团队加工好的数据来进行数据分析、形成包括 AI 在内的业务能力,应该是业务部门的事情,
3. 长期来看,企业要培养数据素养和数据文化,互联网公司的用数模式怎样移植到中国传统企业里去,目前还没有成功实践。AI 落地也是组织文化的变革问题,当前主流企业级 AI 技术是一个机器学习的黑盒,如果企业没有快速 A/B 测试的文化去适应 AI,没有相信“电脑算命”的机制去跟随 AI,那么 AI 在企业内就用不起来。现在很多大企业在一窝蜂地搞大模型,搞来搞去都是一堆废铁、毫无作用的聊天机器人。
4. 最近这段时间炒得厉害的数据资产入表、数据资产交易就是一场闹剧,对企业推进上述的数据技术栈没啥大用,是个比“数据中台”还荒唐的事情。“生数据”对企业来说,只有在一定业务上下文里才有意义,才具有价值——数据本身没有价值,有价值的是信息;所以,即便数据可以被交易,在企业一定的上下文中使用,那么企业购买它也是费用性质,而非资产性质。更何况目前数据在权属、隐私保护、估值计价等方面,都存在着跟资产属性的根本性矛盾,法律层面都还没解决,就在谈财务层面了。资产入表这事儿闹腾一阵子,我预言结果就跟前几年酒店里的人脸识别系统一样。注:本文来自于“陈果George”公众号,经授权同意后发布。
内容推荐
金融行业凭借相对完善的数据和技术基础,以及丰富的业务场景,成为智能技术的实践场。在智能时代背景下,包括银行、保险、证券等在内的金融机构正在借助 AI 大模型、大数据、云计算等数字化技术不断完善和迭代自身的产品和服务,同时通过向外赋能,加速其它行业数字化,完成数实融合。关注「InfoQ 数字化经纬」,回复「实践案例」领取相关资料。
企业福利极客时间企业版推出「金融科技人才培养解决方案」, 构建金融科技人才数字化能力的全景培养体系,提供一个结构化的成长路径,满足金融科技行业对于不同层级人才的需求,明确了数字化领军人才、数字化管理人才、业技融合人才、数字化应用人才、专项技术人才各层级的培养重点及形式。扫描二维码了解方案详情。
活动推荐
AI 应用开发正在逐步成为各行业内的核心创新驱动力,CUI 式的对话助手、串联业务流程的 Agent 或是内嵌在原有业务逻辑中的 AI 模块,都在不断拓展面向用户的新应用场景。我们惊喜地看到从中小创业公司到大型企业,都在利用计算机视觉、自然语言处理、个性化推荐、对话式交互等 AI 能力提升业务效率、优化用户体验,显著增强了产品的市场竞争力。10 月 18-19 日,来 QCon 全球软件开发大会(上海站),了解更多成功应用 AI 技术的案例与最佳实践。
福利通道
  • 关注InfoQ数字化经纬公众号,回复案例领取《行知数字中国数字化转型案例集锦》。
  • 关注InfoQ数字化经纬公众号,回复进群加入数字化读者群交流。
今日好文推荐数字孪生如何推动企业架构的迭代与变革?案件量增加400%,理赔员却减少30%?保险企业如何通过数智化实现高效运营加速“AI+金融”落地,招行上半年IT支出达48.6亿你的工作流程被 AI 颠覆了吗?解读数字化浪潮中的 AI 与数据工程新趋势
继续滑动看下一个
InfoQ数字化经纬
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存