文 | 一财商学院 王艺霏
最近这一个月,关于AI行业最重要也最深刻的变化只有一个:它终于告别了“烧钱造梦”的狂热期,开始集体低头算账。
一边,是越来越多Agent突破了浏览器的禁锢,被塞进微信对话框、电脑桌面和企业真实的业务运转流中。模型API的调用量暴涨,AI大厂们终于摸到了按Token(词元)稳定收钱的商业命脉。
另一边,无论是普通消费者还是手握预算的企业CXO,都不再愿意为那些仅仅是“看起来很聪明”、“能写几首打油诗”的通用模型盲目买单。不是所有人都能承担得起200美元一天的“养虾费”,用户手里的这本账必须算清:用这个Agent,到底能不能帮我节约2个小时?能不能替我省下两个外包员工的工资?能不能实打实地提升这套业务流的转化率?

进入赚钱时代:
AI从网页进入桌面工作流

如果说2026年的前两个月,AI大模型厂商第一次因为小龙虾(OpenClaw)能赚到钱了,那么到了3月,一场由小龙虾引发的桌面级Agent风暴,彻底改变了潮水的方向。
“小龙虾”的爆火,让普通人第一次直观地感受到:AI不仅局限在网页里,而是可以下载到本地、自己动鼠标,可以跨越不同的软件,在你睡觉的时候,不知疲倦地在后台帮你抓取竞对商品价格、清洗Excel数据。
这种奇袭,直接唤醒了头部AI大厂,发起一场“桌面入口之战”。
3月里,阿里、腾讯、智谱、阶跃星辰等大厂密集砸出了8款重磅Agent产品。这其中,尤其以腾讯和阿里的战略落子最为密集。

Agent处理的任务更复杂了,费的脑子和体力也就更多了。
当AI从“聊天解闷”变成“挂在电脑后台自动干活”时,最直接的变化就是:使用频次呈指数级飙升,调用成本也开始暴露。
以前,你让AI写个小红书种草笔记,消耗的Token量有限。但现在,一个监控全网热点的自动化创意Agent,读取网页、抓取热点、创作,一次循环可能就消耗上万Token,一天下来就是海量的算力燃烧。
国家数据局3月23日披露的数据印证了这一疯狂的趋势:中国日均 Token 调用量在两年内飙升超千倍,在今年3月达到了 140 万亿。按DeepSeek每百万Token 2块钱人民币的白菜价算,中国人光是烧Token每天也创造了3亿多的流水。
以至于Token在3月拥有了“词元”之名时,大家还在调侃它应该叫“偷啃”,就这么偷偷把钱包啃没了。但这对大厂来说,这代表AI正在以极快的速度进入商业化。
赚钱的两套逻辑:
卖“廉价水电”与卖“高薪员工”
翻开各家的账本看一看,在当前的AI行业里,商业模式已经悄然发生了极致的分化,形成了两类截然不同的生意。
1. 中国AI军团的“规模游戏”:以极致性价比垄断自来水
既然让Agent干活需要消耗海量Token,最理性的选择是,哪个模型便宜就选哪个。在这场红利中,中国AI厂商凭借全球最低的推理成本和持续不断的工程优化,成了第一阶段最大的赢家。3月底OpenRouter的数据显示,全球模型调用量前6名都是中国AI。

这些中国厂商相当于“基础设施运营商”。比如DeepSeek、智谱,像卖水和电一样卖Token,他们不强求定制每一个具体的应用场景,而是致力于提供最便宜、最稳定、基础逻辑最过关的API接口。只要全网还有无数个类似于“小龙虾”的Agent在运转,他们的计费表就在跳动。
靠着这种务实模式,业绩立竿见影:截至3月,上市公司智谱的云端API业务年度经常性收入(ARR)已突破2.5亿美元。
但随着Agent的Token需求量加大,模型厂为了抢份额,免不了价格内卷。截至3月底,主流模型中最便宜的是阶跃星辰的Step 3.5 Flash,百万Tokens输出价格已经卷到0.3美元,最贵的Claude Opus 4.6是它的82倍。

2. Anthropic的“价值游戏”:能干活的“数字员工”反超OpenAI
如果说中国厂商在卖便宜的基础资源,那么海外巨头Anthropic(Claude大模型的母公司)则展示了一条暴利路线。
3月,Anthropic公开其年化收入(ARR)达到300亿美元,正式在商业营收上反超了OpenAI(约240亿美元)。
很多人对此感到不可思议。毕竟OpenAI的ChatGPT拥有数亿的周活用户,而Anthropic的用户盘子只有ChatGPT的大概5%。它凭什么这么赚钱?
答案藏在他们的“企业优先(Enterprise-first)”战略中。Anthropic的营收大头,来自于其主攻B端办公开发需求的“编程Agent”(Claude Code和Claude Cowork)。仅仅是Claude Code这一项,2月份的收入就已经达到了25亿美元。
如果拿两家公司来比较:
因此企业在买单时,对比的不再是其他软件的月租,而是硅谷动辄数万美元一个月的程序员薪水。如果一个AI能替代掉初级数据分析师或外包程序员的工作,企业花几百甚至上千美元,不仅不觉得贵,反而觉得捡了巨大的便宜。
Anthropic的成功证明了一件事:在AI领域,消费者规模和营收规模完全是两码事。 直接插手企业最核心的工作流,切分最肥厚的人力预算,是Agent时代最强的现金牛。
此前Cursor、OpenAI、阿里、腾讯也都相继推出编程Agent,可以预见,编程模型/Agent将会是4月或第二季度AI商业化的竞争关键。
谁在为繁荣买单?
AI商业漏洞的暴露与修补
行业越火爆,旧有商业模式里隐藏的漏洞就有可能暴露得越大。3月份的几个标志性大事件,都是AI厂商因为收支不平衡而做的割舍。
1. Anthropic 封杀第三方工具:终结“算力薅羊毛”时代
虽然Anthropic已经赚得盆满钵满,但他们在4月4日做出了一个极其强硬、甚至得罪开发者社区的决定:Claude的包月订阅套餐不再覆盖通过第三方工具(如OpenClaw)的API调用。所有想用第三方Agent的用户,必须老老实实转为按实际使用量付费(API Key模式)。
这是因为过去几个月,大家只需要花费200美元开通一个高阶的Claude的包月账号,然后将账号授权给本地的OpenClaw,就可以不间断地调用Claude帮忙写代码。
在Anthropic看来这个局面就有点收不住了:用户花了200美元的月费,却跑出了相当于1000到5000美元的API真实算力成本。所以杜绝被薅羊毛,是AI商业化走向成熟的一步。
其实在API按量计费和订阅制付费之间,现在有很多大模型针对编程开发场景推出了第三种收费模式——Coding Plan(编程套餐)。这是一种针对开发者需求的“区间打包价”,费用和Token限制高出基础订阅制,但也没有API按量计费那么无上限,成本相对可控。
不过随着算力成本上涨,这种编程套餐也在纷纷涨价或者“限购”。比如阿里云百炼4月13日起最便宜的Lite套餐就要停售了,智谱的Coding Plan 2月时也涨价了30%。
看过Anthropic的“教训”,也许按量计费才是更合理的收费方式。

2. Sora 黯然离场:视频大模型的“成本诅咒”
3月24日,曾经创造了“AI界iPhone时刻”、惊艳了全球的视频生成模型Sora,被OpenAI正式宣告关停。
外界对此有诸多猜测,比如版权官司的重压、比如Grok Imagine等竞品的围剿。但真正压垮Sora的,依然是因为:算力太贵了,且无法商业闭环。
据估算,Sora每天的运营亏损高达上百万美元。如果在这种天价成本下,Sora能替广告公司或者好莱坞省下大笔制作费,那这笔钱烧得也算值。但Sora生成的视频在物理规律的一致性、精确控制上依然存在巨大缺陷,“抽卡”成功率还低于即梦、可灵等其他竞品,无法成为稳定可控的生产力工具。C端用户只愿意看个新鲜,不愿意为每天生成几个搞笑短片支付高昂的订阅费;B端企业又觉得它不够精确,无法投入商用。
在这种成本倒挂且缺乏清晰回报的死局面前,哪怕是财大气粗的OpenAI,也不得不选择断臂求生,将有限的算力资源集中到更能赚钱的GPT核心模型和编程场景上。
Sora的退场,给所有试图在多模态领域大力出奇迹的厂商泼了一盆冷水:如果算不平商业变现的账,再惊艳的技术Demo也只是过眼云烟。
但中国视频模型的节奏似乎没有受到影响。就在Sora关停第二天,快手宣布可灵AI的年化预计收入2.4亿美元。4月刚刚发布、多项评分超越Seedance2.0的视频生成模型Happy Horse,4月底就要开放API,它也将是视频生成领域的又一个有力竞争者。
算得平账,才能留在牌桌上
回顾龙虾余温中的3月,6款国产Agent密集上工、中国模型强势霸榜API调用量、Anthropic依靠B端编程业务完成营收反超,以及Sora因成本重压的黯然退场,都在指向一点:
AI行业已经彻底结束了“跑分炫技”的流量红利期,正式迈入了“效率验证”与“价值付费”阶段。
在这个新阶段,无论是开源还是闭源,无论是做底层大模型还是做Agent,市场的钱袋子已经做出了极其理性的分化,未来只为两种极致的价值买单:
而当计费模式越来越精细,用户也开始变得极度现实。随之而来的,是行业对“劣质Agent”的抛弃。
Google-MIT的最新联合研究《Towards a Science of Scaling Agent Systems》表示,Token消耗量大,不等于AI更聪明。
研究表明,当底层基础模型的准确率低于某个特定阈值(约45%)时,盲目地引入多智能体协同(即让好几个Agent一起配合干活),不仅不会提高效率,反而会使整体性能下降39%到70%。更要命的是,它会导致Token消耗出现高达515%的冗余激增。
翻译成商业大白话就是:如果你用的底层大模型本身是个“半吊子”,逻辑推理能力不行,一旦你让它去执行复杂的多步骤任务,它就会在后台陷入“不断出错-疯狂试错-死循环”的泥潭,不仅没帮你把活干完,反而把钱烧得一干二净。
所以并非最能卷价格的模型最有优势,价格只是竞争的一部分。
就像智谱在财报里提出的商业价值公式一样:“AGI商业价值 = 智能上界 × Token 消耗规模”。这个公式的可取之处在于:它承认了 Token 规模的重要性,但把智能放在了第一位——效率才是放大器。AI需要提升“智能密度”,即用更少的 Token 完成更复杂的任务,以此作为核心竞争壁垒。
小米AI负责人罗福莉也表示:“我会建议所有LLM公司,在搞清楚‘coding plan怎么定价不亏钱’之前,不要盲目打价格战。”
在接下来的Agent集中PK中,只有那些能清晰证明自身 ROI(投资回报率)、切实替代人力外包成本的 Agent,才能拿到持续付费的商业机会。



评论