火山引擎,越来越有 Google Cloud 的味道_
刚看完 IDC 的最新报告,说实话还是挺吃惊的。报告里有两条信息,我觉得所有人都值得看一下。
第一条,2025 年全年,中国公有云上的大模型调用量达到了 1944 万亿 Token,同比增长 16 倍。
第二条,火山引擎的 MaaS 市场份额涨到了 49.5%,几乎占了中国 MaaS 市场的半壁江山。
第二条相当超出我的预期。2025 上半年的时候,火山引擎 MaaS 的份额是 49.2%,已经是第一了。当时我还跟几个朋友聊过,估计下半年其他大厂反应过来,火山的份额会跌一些。结果,不跌反涨。
这里要先说一下 IDC 的口径,因为它直接决定这两个信息的含金量。
IDC 统计的是各大云厂商对外部客户提供的 MaaS 服务调用量,不含自有业务。
具体到火山引擎,就是不含抖音、豆包 App、即梦 App 这些字节自家产品的调用。所以 49.5%,是纯外部企业客户在火山方舟上跑出来的 Token。
看来国内企业 Token 调用的盘子也在快速变大,一年 16 倍,照这个势头今年还会更高。企业对 AI 的采用远远超出我的预期。
去年火山在 Force 大会公布过一些典型场景。
AI 搜索 5 个月涨 10 倍,AI 编程涨 8.4 倍,K12 在线教育因为视觉理解模型成熟涨了 12 倍。除此之外还有一批过去根本不存在的场景,比如智能巡检、视频检索,几个月就跑到日均百亿 Token 的水平。
IDC 统计的 MaaS 全是企业场景的调用。我们平时买 ChatGPT、Claude 会员,反映的是 C 端用户的采用率。MaaS 反映的是企业的采用率。这两件事完全不一样。
用户买个会员,可能用来写文章,用来写代码,用得勤一点不勤一点都是个人的事。企业接入是另一回事,它得实打实塞进真实业务场景里去跑。
K12 就是一个具体例子,视觉模型一成熟,立刻被接入作业批改、错题讲解这些环节,Token 消耗几个月翻一个量级。毫无疑问,在一些重要任务上,人类的能力已经没有 AI 强。
#01
从红杉资本的大会说起
昨天我写了一篇文章,总结红杉大会上 Claude Code 创始人的核心判断。但其实大会的主题演讲更精彩。红杉合伙人 Pat Grady 的观点相当高屋建瓴。
他 Share 了一张图。这张图我觉得把整个技术发展拉成一条纵深线,从 60 年代的硅基晶体管开始,往后是操作系统、网络、互联网、社交和云、移动,最后到 AI。
Pat 的核心观点是,这些浪潮不是相互取代,是互相叠罗汉。AI 这一层能成立,是因为前面几层把算力、带宽、数据、人才都准备好了。
但这一波 AI 浪潮又跟以往有个不同。
过去几次浪潮主要重塑软件市场。云计算时代软件总盘子从 3500 亿美金涨到 6500 亿,云本身占 4000 亿。
这一波 AI 同时撬动了软件和服务两个市场,法律、咨询、医疗、会计这些过去高度依赖人脑的行业也开始被软件化。Pat 的估算是 10 万亿美金量级。
我自己经历过移动互联网那波。当年已经够快了,但这一波 AI 比移动互联网还要快。AI 是迄今为止最快的一波浪潮。
这波浪潮里有三个标志性跳变,每一次跳变 Token 消耗都直接上一个台阶。
第一次是 2022 年 11 月,ChatGPT。全世界第一次直观感受到预训练大模型的威力。
这个阶段烧的 Token 主要是纯文本,写文档、写代码、聊天,单次任务几千到几万。
第二次是 O1 这类推理模型。模型在推理时也开始烧算力,Scaling Law 从训练扩展到推理。
国内对应的节点是 2025 年 2 月 DeepSeek R1 爆红,那个月 IDC 报告里中国公有云大模型调用量增速直接拉到 60%。推理模型一道题能想十几分钟,单次消耗比之前高一个量级。
第三次是 Claude Code 这种长程 Agent。它能在复杂任务上持续迭代几小时甚至几天,自己出错自己改回来,不太需要人盯着。
一个 Agent 跑一晚上烧掉的 Token,相当于过去聊一个月天。
更关键的是,跳变的同时多模态也进来了。图像生成、视频生成、设计稿生成,单次任务一吃就是几千万 Token。这是 Token 调用量增长的大背景。
#02
火山引擎的切入点
阿里、腾讯、华为,加上 UCloud 这一批创业公司,要上云的客户该签的都签了。
记得当时我有朋友拿到火山的 Offer 问我要不要去,我说这事难度挺大,让一家后来者从存量市场里抢增量客户。我那会比较悲观。
结果这两年看下来,火山反而是几家云厂商里跑得最猛的那个。我一开始的判断完全错了。
真正的变量是 AI。整个行业那几年都没料到 AI 大模型能涨得这么猛,不只是我,所有人对云计算市场的判断都被这件事重写了一遍。
云计算这一波本质是数字化。卖的是算力、存储、网络,或者托管数据库、消息队列这些 PaaS,他们都是企业 IT 基础设施。
但 AI 不一样,它把 AI 当成一种基础能力嵌进业务里。客户买的不再是 CDN,不再是服务器,而是 Token,是生产力。这是另外一门生意。
过去几年,老牌云厂商手里有存量包袱,多年的 IaaS 生意、销售体系、客户预期、组织习惯,都是围绕传统云业务搭起来的。
AI 对它们来说是加在原有摊子上的新一层,主战略还是老的那一套。面对 AI,虽然大家都知道这事重要,但想快速切换,也没那么快。
而火山引擎没有这个包袱。它进场的时候手上没什么存量可守,反而能直接把 AI 当主战略来打。
所以它做的事情不是原来的云生意再加一层 AI,是 AI 做核心,云是为 AI 服务的。
这两套逻辑听着像绕口令,但落到产品形态、定价方式、迭代节奏、组织优先级上,全都不一样。
最能看出这种差别的就是 MaaS。
我清楚记得火山引擎第一次提 MaaS 服务的时候,国内还没人提这个概念,那会字节自己的模型都没发布。
在传统云厂商眼里,MaaS 这玩意肉太少。卖一台云服务器一年好几千上万,卖 Token 那会调用量小,单价低,销售算账算不过来,自然也不积极。
但火山的做法非常绝。我认识火山引擎的销售,他们怎么说的呢,公司就是力推 MaaS。
开个玩笑讲,你 Token 卖得不错,其他业绩差点公司也认。反过来,你 CDN 卖得再好,MaaS 这块卖得少,绩效就是不合格。整个公司过去几年就是这么硬推 Token、硬推 MaaS。
去年这事很多人不理解,今年大家反应过来了。Token 经济也好,Token 是新时代的水电也好,国家层面都开始重视了。
等回头一看,火山的调用量已经跑到了新的量级,硬生生在夹缝里长出来一棵大树。
#03
AI 云是新的竞争逻辑
而且 AI 云同样是一门规模取胜的生意,甚至比之前更甚。
因为 AI 云卖的是 Token。Token 这东西的单位成本很大程度上取决于推理效率,而推理效率又取决于 Infra。一张 GPU 能榨出多少 Token,不同的推理方案差距能有几倍。
而 Infra 的水准又跟调用量直接挂钩。调用量大,集群就能被压满,单位推理成本就低;成本低,客户就更愿意用,调用量又涨上去。这是一个自我加速的循环。
回过头去看我前面贴的红杉那张图就更明白。
我们说的云计算,跟之前那波云计算本质上已经不是一回事了。
之前那波卖的是资源,算力、存储、网络、托管数据库;这一波卖的是 Token,是模型本身的能力。Token 这件事的想象空间,可能比之前大百倍。
这也是为什么全球范围内,AWS、Google Cloud 和 Azure 这三家云计算公司也在经历价值重估。
早几年前,AWS 拥有最强的云计算基础设施,是云计算领域的鼻祖。Azure 有最强的企业软件体系。Google Cloud 当时其实非常被动,在传统云市场一直缺乏优势。
但这两年很明显,AI 已经成为 Google Cloud 的新入口。很多企业未必是因为云服务器迁移过去,而是因为 Gemini、多模态和 AI Agent 能力,开始把 AI 工作负载放到 Google Cloud 上。
也就是说,AI 彻底改写了云计算的竞争逻辑。以前企业选云计算,核心看谁的服务器更便宜,谁的生态更成熟。
现在会更多去看谁的模型更强,谁的 Token 更便宜,谁的多模态做得好,谁能真正帮业务提升效率。
火山引擎其实也有点这个味道。它本来并不是传统云市场最强的玩家。但 AI 时代,字节模型能力的溢出,开始反过来带动云业务。