文 | 未来商业观察 子恒
编辑 | 方远

好用即原罪
2025年12月1日,豆包手机助手技术预览版发布的当天。
3499元的努比亚M153,首批3万台一夜售罄,二手价翻了四倍,被炒到12900元。中兴通讯A股应声涨停,市值单日飙升超200亿。
一个能替你比价、点外卖、自动整理旅行攻略的AI助手,只在付款等关键环节需要人工介入。资本市场和消费者用真金白银投了票,"AI替人操作手机"的需求是真实的。
但接下来发生的事,谁也没想到。仅隔一天,微信率先"亮起红灯"。
用户在M153上用豆包助手操作微信时,出现异常退出,甚至无法登录。
微信是中国移动互联网的基础设施级应用,它的态度就是行业的风向标。微信动手了,等于告诉所有App:可以跟上了。
围剿的号角响了。在接下来几天时间里,一场针对豆包手机助手的围追堵截上演了。
淘宝登录页面显示"登录环境存在异常";支付宝弹出"访问被拒绝";拼多多提示"暂时无法登录";农业银行、建设银行弹窗警告"检测到设备正使用屏幕共享"。
四类应用,四种措辞,但本质一样:它们把AI助手的操作判定为"非本人行为"。在平台的安全逻辑里,AI替你操作和黑客替你操作,没有区别。
面对围剿,字节选择适时低头,因为他已经意识到这不是一个技术问题,可以被人工修复。
12月5日,豆包手机助手主动下线金融类App操作能力,措辞从发布时的"技术预览"变成了"审慎起见"。

腾讯对此"旗帜鲜明地反对"。2026年1月,马化腾在腾讯年会上公开点名:"用外挂方式把用户手机和电脑屏幕录屏传到云端,极不安全、不负责任。"
注意他的用词。不是"安全隐患",不是"技术争议",是"外挂"。当行业第一人用"外挂"来定义AI助手时,这已经不是安全争论,是立场宣告。
技术层面确实有争议空间。豆包手机助手跨应用操作能力的实现,依赖安卓系统的INJECT_EVENTS权限,这原本是用于辅助视障人群的系统级权限。
而豆包直接拿它来做商品比价、自动领券下单,被各家App判定为"非真人操作",触发安全机制属于情理之中。
但这,绝非平台联手封杀的核心缘由。让平台坐不住的是,AI助手跳过了开屏广告和首页推荐流,直接调用App核心功能。
用户对豆包说"买最便宜的可乐",AI自动完成比价和支付。直接导致淘宝的竞价排名、首页推荐、开屏广告,全部失效。
所以,平台围剿豆包,不是因为AI不安全,而是因为AI太好用了。
周鸿祎说得更直接:"淘宝、美团靠用户停留和广告赚钱,现在AI帮用户直接完成任务,不用看广告,不用刷首页,APP核心KPI彻底作废。"
KPI彻底作废。这六个字,比任何安全白皮书都诚实。
但护城河被冲垮的恐惧不只属于字节的对手。字节自己也被困住了。豆包手机助手没有系统底层权限,它"寄生"在别人的花园里,别人随时可以关门。
那有没有一种路线,从一开始就不用敲别人的门?
房东与房客
3月6日,豆包被围剿三个月后,小米开启了Xiaomi miclaw的封测。雷军在转发公告时只写了四个字:"手机龙虾"。
这四个字背后是一套和豆包完全不同的逻辑。豆包手机助手的工作方式是截屏、发给云端大模型、模型"看懂"屏幕后返回操作指令、手机执行、再截屏。
这本质上是一个从外面看屏幕的"房客",进出每一道门都要看门人同意。而miclaw反客为主,它以系统应用身份运行,通过API直接调用系统级权限,是自己拿着钥匙的"房东"。
路线选择决定了和App生态的关系。房客会被赶走,房东不会。
小米显然从豆包踩过的雷里学到了东西。miclaw摒弃了模拟点击方案,改用Intent驱动和AppTool SDK。
这是行业通用的跨应用通信方式,理论上不会被判定为"外挂"。
权限管理也做了分级:高敏感操作每次弹窗确认,60秒超时自动拒绝。前者回应了淘宝和微信的封杀理由,后者回应了马化腾"极不安全"的定性。
技术方案的每一步,都在回答豆包已经付过学费的问题。
能力上,miclaw的牌面也不小:封装超过50项系统工具,执行20步复杂操作仍能保持连贯。更关键的是生态联动。
小米深耕IoT多年,米家接入设备超过10亿台,miclaw第一次让这个庞大的设备矩阵被AI统一调度。从手机到音箱到空调到汽车,一个指令穿透全链。
但翻过来看,miclaw的底层模型MiMo-V2-Flash采用MoE架构,虽号称3090亿参数,实际活跃参数为150亿,核心推理仍跑在云端。
所谓"端侧Agent",关键计算还是在服务器上完成。响应速度、隐私保护、离线可用性,都是未解之题。
小米绕开了"被封杀",但它的方案有一个天然的边界:只能在自家手机上运行。首批封测仅限小米17系列5款机型。
换句话说,你想用这个AI,得先买小米的手机。这也不是小米一家的选择。

OPPO内部的判断更直接。OPPO姜昱辰说,GUI Agent也就是豆包采用的那套视觉识别模拟操作,在OPPO看来是"兜底方案"。
OPPO更倾向通过Agent to Agent的方式实现生态互联。
A2A原本是由谷歌提出的一个概念,在这种方式下,人只需要提出最终目标,AI 智能体之间便可自主沟通、分工、协作,全程无需人工干预便可自动完成。
但尴尬的是,OPPO自身并没有落地案例。
当一个行业里所有人都在否定对手的方案、却拿不出自己的成熟替代时,说明这个问题本身还没有答案。
字节其实一开始想走更轻的路,做纯大模型供应商,把豆包嵌入主流手机厂商的系统里。但华为、小米、OPPO、vivo全部拒绝了。
不是模型不好,而是没有厂商愿意把系统级入口让给外人。毕竟在AI手机时代,系统级入口代表的就是流量分配权。这便是字节折戟沉沙的核心原因。
所以五家厂商各建各的围墙。华为"全栈自研",麒麟芯片加盘古大模型加鸿蒙系统三位一体;小米围绕人车家生态推MiMo;OPPO以记忆能力为核心;vivo走端侧先行路线;荣耀CEO赵明说要做"平台级AI终端",瞄向"手机自动驾驶"。
五种策略,五条路,没有一条是互通的。
小米绕开了豆包的困境,但制造了新的困境。用户换一个手机品牌,就要换一套AI。问题没有消失,只是从App层面推到了操作系统层面。
用户对这一切的反应,比所有人预期的都冷。
QuestMobile数据显示,截至2025年9月,六大手机厂商AI助手的用户规模合计5.35亿。听起来庞大。但月人均使用时长只有5.3分钟。
Omdia的调查更扎眼:只有27%的消费者会因为AI功能考虑换手机品牌,排在硬件规格和性价比之后。
围墙建了不少,住进来的人并不多。
厂商在争夺AI入口的控制权,用户却还没觉得这个入口有什么用。5.35亿用户是装机量的惯性,5.3分钟才是投票结果。
一念天堂,一念地狱。在PC端,同样叫AI Agent则是一个完全不同的故事。
三条路,同一堵墙
OpenClaw,一个开源的PC端AI Agent框架。自2025年11月诞生,于4个月后以25.2万颗星登顶GitHub历史第一,超越React和Linux,成为史上增速最快的开源项目。
它带火的不只是代码,还拉动了硬件销售,甚至直接催生了一条服务产业链。
Mac mini今年1月销量暴增65%。闲鱼上的代装服务高达500元,海外平台更是挂出6000美元的天价上门安装费。
PC端的AI Agent绝不是浮在空中的概念,已经是可以落地的生意了。
一半火焰一半海水。同样都是AI Agent,手机端与PC端却走向了两个极端。导致如此现象的答案藏在一个前提里:PC端没有围墙花园。
Agent可以自由操作任何软件,不需要任何App的"许可"。而手机端恰恰缺的就是这个前提。
IDC预测,2026年中国"新一代AI手机"出货量将达1.47亿台,占整体市场的53%。但同一份报告也说,整体智能手机市场将同比下降2.2%,萎缩至2.78亿台。
AI手机占了一半以上,市场反而在缩——如果AI是驱动力,这个数字不该往下走。
53%的占比更像一场命名游戏:不是AI让手机更好卖了,而是卖出去的手机都被叫成了"AI手机"。

隐私是所有人都绕不开的话题。马化腾年会批评后,豆包当晚通过官方微博回应,发布《隐私安全白皮书》,强调端侧处理优先,云端数据假名化,密钥一次会话后销毁。技术承诺做得很足。
但平台在意的不是"数据安不安全",而是"谁有权让AI进入我的App"。用户授权了豆包操作微信,但微信没授权。
谁说了算?这不是加密技术能回答的问题。
法律界也给不出现成答案。对外经贸大学教授许可指出:"在很多情况下,用户权益和平台权益都需要考虑,需要双重授权甚至多重授权。"
当技术跑在法律前面,规则真空期就是各方抢位的窗口期——谁先占住系统入口、谁先谈好App合作协议,谁就在事实上定义了规则。
联想杨元庆在CES上的表态更直白:"硬件厂商不会成为模型厂商的代工厂。"这话不只是说给字节听的。
五大厂商拒绝把豆包嵌入自家系统,杨元庆拒绝让联想沦为模型公司的管道——拒绝的对象不同,逻辑相同:系统入口是自己的,不让。
三条路线的困境由此清晰。豆包覆盖面最广,但App随时可以封杀;谷歌和三星2月发布AppFunctions框架,走"先谈妥再落地"的路线,规范但慢;小米miclaw话语权最高,但第三方核心应用的接入同样没有答案。
CCF论坛给这场博弈定了性:冲突的本质是流量入口与数据主权的争夺。三条路线各有瓶颈,但瓶颈的形状相同,都卡在"第三方App愿不愿意配合"上。
六大厂商的智能体用户已经达到5.35亿,但每人每月只用5分钟。
当系统级Agent成为每部手机的标配,用户打开App的方式将被AI调度逐步替代——这不是推测,PC端已经在发生了。
移动端Agent的终局,或许不在于哪条技术路线胜出,而在于谁先建立操作权的规则。
掌握这个入口的一方,掌握的不是一个功能,而是下一个十年的流量分配权。


评论