文|刀客doc
谷歌这次真的紧张了。
一个月前,欧盟委员会给谷歌列出了一份要求:搜索市场长期由谷歌一家主导,后来者很难获得公平竞争机会。
欧盟认为,按照《数字市场法》,谷歌既然已经是守门人,就不能只把搜索市场的大门握在自己手里。它需要向其他搜索引擎开放一部分搜索数据,包括排名、查询、点击和浏览数据,让竞争对手也有机会改进自己的服务。
昨天,谷歌的回应来了,就是俩字:不行。
谷歌的姿态罕见强硬。
据路透社报道,谷歌科学家谢尔盖·瓦西尔维茨基向欧盟反垄断监管机构发出警告:如果欧盟要求谷歌向 OpenAI 等竞争对手开放搜索引擎数据,欧洲用户的隐私可能会被暴露。
瓦西尔维茨基自 2012 年起担任谷歌科学家,是谷歌内部长期研究搜索、算法和数据安全的核心人物。他将会见欧盟反垄断官员,提出一套范围更广、保护措施更完善的替代方案。
一
过去很多年,人们谈到谷歌的强大,习惯把原因归结它强大的数据和技术。
不过,谷歌还有一个更容易被低估的资产:信号。
怎么理解呢?
比方说,一个人搜索了“北京到上海机票”,这是搜索数据。他在页面停留了多久、有没有返回、有没有继续搜索“上海酒店”“虹桥机场到市区”,这些是行为数据。
但谷歌真正关心的是透过这些孤立的记录,看到这个人是不是已经进入了明确的出行决策?是在随便看看,还是已经接近购买?
数据是行为留下来的客观记录,信号可以推测用户的主观意图。
进入AI时代,数据的边际价值开始下降。因为很多平台都有数据,很多公司也可以购买数据、抓取内容、训练模型。真正拉开差距的,是谁能从这些数据里判断用户的真实需求。
同样是搜索“北京到上海机票”,有人只是查价格,有人准备马上出行,有人在做差旅报销,有人在比较高铁和飞机。
数据表面上相似,背后的意图完全不同。
AI系统的价值,就在于把这些相似行为拆开,判断谁只是浏览,谁正在犹豫,谁已经接近交易。
所以AI时代,平台的核心能力会从拥有数据,转向理解意图。
数据仍然重要,不过意图识别才是把原材料变成商业判断、推荐结果和广告定价的过程。
意图识别这种能力并非简单的数据规模问题。
竞争对手可以抓取网页,可以训练大模型,可以买浏览器入口,也可以做一个看起来体验不错的新搜索框。但它很难复制谷歌几十年来积累的用户反馈回路。
因为网页内容是公开的,用户行为反馈不是公开的。
搜索结果可以被模仿,搜索过程中的意图变化很难被模仿。
页面可以被抓取,几十亿人每天如何点击、停留、返回、换词、再搜索的经验,无法凭空生成。
这也是谷歌搜索的一大护城河。
这套判断一旦进入广告系统,就会变成更高的转化率、更精准的竞价、更好的排序质量,也会变成广告主愿意为谷歌支付溢价的理由。
谷歌最不害怕的是罚款。毕竟是财大气粗。过去十多年,它在欧洲已经吃过很多反垄断罚单,金额很大,但对一家年收入数千亿美元、现金流极强的公司来说,罚款更多是成本项,谷歌也已经习惯了。
谷歌也不一定最怕业务的拆分。拆分当然会带来资本市场和组织上的巨大冲击,但那是一个漫长、复杂、充满司法拉扯的过程,真正落地并不容易。
但这次欧盟的要求,谷歌可能真的紧张了。
因为触碰了谷歌最核心的一层资产:谷歌如何通过长期用户行为反馈,判断意图、衡量搜索质量、训练排序系统、优化广告匹配。
二
为什么这件事在今天突然变得更重要?
因为 AI 搜索来了。
以前搜索引擎之间竞争,大家比的是索引规模、排序算法、网页质量、入口分发。
现在呢?
OpenAI、Perplexity、微软 Copilot、未来各类智能体,都想把用户从传统搜索框里拽出来。
谷歌的传统搜索形态确实收到了不小的挑战。
但往底下看,AI 搜索还是绕不开一个问题:它怎么知道自己的答案是对的?怎么判断一个问题背后是知识需求、消费需求、医疗需求,还是交易需求?
大模型可以生成漂亮的话,但真实用户行为会告诉系统,哪些话有用,哪些话只是看起来有用。
如果 OpenAI 只是做一个聊天框,谷歌可以用 Gemini、Chrome、Android、默认搜索入口去对抗。
如果 OpenAI 未来能合法拿到一部分谷歌搜索行为数据呢?
事情就变了。
AI 搜索公司可以用这些数据改进检索、训练排序、校准答案、判断商业意图。它们会更快接近谷歌过去几十年积累出来的搜索经验。
谷歌当然不愿意。
这就像一个老厨师开了几十年饭馆,靠每天观察客人点什么、剩什么、回来几次、抱怨什么,终于形成了一套自己的味觉判断。现在监管者说,你太强了,把这些客人的反馈数据拿出来,给隔壁新开的饭馆也用一下。
老厨师一定会急。
三
谷歌这次把隐私作为挡箭牌,是一步很聪明的棋。
在欧洲的监管框架里,隐私和反垄断是最大的两个议题。
欧盟这些年一边搞 GDPR,一边搞 DMA。前者强调保护个人数据,后者强调打开平台竞争。平时这两个目标可以并行,到了搜索数据这里,就开始互相打架。
欧盟想让谷歌开放数据,扶持竞争对手。
谷歌反过来问欧盟:你要公平竞争,还是要个人隐私?
这个问题很难回答。
搜索数据跟普通广告曝光数据不一样。
一个人的搜索框,往往更接近个人的隐私。
比如一个人可能不会在社交平台公开说自己生病了,但会搜索一些症状的关键词。
他可能不会公开说自己想离婚,但会搜索财产分割。
即使拿掉姓名、账号、IP 地址,只要保留查询词、点击、时间、地理、浏览路径,仍然可能拼出一个人的基本画像。
尤其到了 AI 时代,重识别能力更强。
过去要重新识别一个匿名用户,需要人工推断,需要外部数据库,需要统计模型。
现在大模型可以处理长文本、长序列、复杂语义,能把很多零散线索串起来。
一个人连续搜索罕见病、某小区附近医院、某个公司岗位、某条航班、某个孩子学校活动。这些单点都匿名,连起来就可能成为身份指纹。
谷歌称,自己的红队两个小时内重新识别用户,具体测试细节我们没有看到,不能完全照单全收。但它指出的风险是真实存在的。
这就是欧盟两难的地方。
四
欧盟当然也不是闲着没事找谷歌麻烦。
它一直想解决一个问题:搜索市场为什么这么多年没有真正竞争?
微软投了很多钱,Bing 仍然很难撼动谷歌。
DuckDuckGo有隐私标签,但规模有限。
Brave、Neeva、You.com、Perplexity 都有新想法,但很难突破主流用户习惯。
原因在于搜索市场有很强的飞轮效应。
用户越多,数据越多,进而结果越准,进而又用户越多。
广告主跟着用户走,收入越高,研发和分发投入越大。
最后形成一个越来越正向的价值循环。
如果只要求谷歌给用户一个选择屏,让大家自己选搜索引擎,意义不大。大多数用户懒得换,换了也可能发现新搜索不够好,再换回谷歌。
如果只罚谷歌几十亿欧元,谷歌也能承受。
罚款对它来说是痛点,但不是命门。
在欧盟看来,真正能改变竞争态势的办法,就是拆掉谷歌的一部分数据飞轮。
欧盟的态度是:你谷歌作为守门人,不能把用户行为反馈全部锁在自己系统里,因为这些数据已经影响了整个搜索市场的竞争能力。
这个逻辑很激进的。
一旦成立,未来不只搜索数据可能被要求开放。
地图数据、购物数据、视频观看数据、广告点击数据、应用商店数据,都可能被竞争对手用类似理由要求打开。
尤其是当下的AI公司。
OpenAI 要做搜索,不能只靠模型聪明。
需要知道用户对答案的真实反应,需要知道商业查询怎么变现,需要知道哪些内容只是噪音。
如果能拿到谷歌的一部分搜索数据,ChatGPT在广告业务上的追赶速度会快很多。尽管他的布局速度以及很快了。
五
谷歌搜索广告的估值,长期建立在几个假设上:
第一,搜索仍然是最高意图入口。
第二,谷歌长期控制这个入口。
第三,竞争对手很难复制搜索质量。
搜索数据的开放会改变投资者对 Alphabet 的长期想象。
罚款不可怕。
合规成本也不可怕。
可怕的是监管者开始把谷歌内部数据资产,重新定义为市场竞争所需的公共基础设施。
如果这个趋势扩大,谷歌的护城河会被一点点稀释。
当然我觉得,最后方案大概率会折中。
欧盟不会轻易放弃数据共享,因为 DMA 已经把方向定下来了。
谷歌也很难完全挡住,因为它已经被定义为守门人。
如果欧盟最后给的是高度聚合、强延迟、低粒度数据,再配上严格沙盒和审计机制,这件事的象征意义会大于实际意义。
竞争对手会说自己赢了,谷歌会说自己服从监管,市场格局不会立刻变化。
如果欧盟最后要求较高粒度、较高频率、较低价格的数据共享,那就不一样了。
AI 搜索公司会真正拿到可用燃料,谷歌搜索经验会部分外溢,长期护城河会受到实质冲击。
所以这件事,要看数据开放到什么程度。数据这种东西,差一层粒度,价值差十倍。


评论