欧盟要求开放一部分搜索数据，谷歌这次是真怕了|界面新闻

文｜刀客doc

谷歌这次真的紧张了。

一个月前，欧盟委员会给谷歌列出了一份要求：搜索市场长期由谷歌一家主导，后来者很难获得公平竞争机会。

欧盟认为，按照《数字市场法》，谷歌既然已经是守门人，就不能只把搜索市场的大门握在自己手里。它需要向其他搜索引擎开放一部分搜索数据，包括排名、查询、点击和浏览数据，让竞争对手也有机会改进自己的服务。

昨天，谷歌的回应来了，就是俩字：不行。

谷歌的姿态罕见强硬。

据路透社报道，谷歌科学家谢尔盖·瓦西尔维茨基向欧盟反垄断监管机构发出警告：如果欧盟要求谷歌向 OpenAI 等竞争对手开放搜索引擎数据，欧洲用户的隐私可能会被暴露。

瓦西尔维茨基自 2012 年起担任谷歌科学家，是谷歌内部长期研究搜索、算法和数据安全的核心人物。他将会见欧盟反垄断官员，提出一套范围更广、保护措施更完善的替代方案。

一

过去很多年，人们谈到谷歌的强大，习惯把原因归结它强大的数据和技术。

不过，谷歌还有一个更容易被低估的资产：信号。

怎么理解呢？

比方说，一个人搜索了“北京到上海机票”，这是搜索数据。他在页面停留了多久、有没有返回、有没有继续搜索“上海酒店”“虹桥机场到市区”，这些是行为数据。

但谷歌真正关心的是透过这些孤立的记录，看到这个人是不是已经进入了明确的出行决策？是在随便看看，还是已经接近购买？

数据是行为留下来的客观记录，信号可以推测用户的主观意图。

进入AI时代，数据的边际价值开始下降。因为很多平台都有数据，很多公司也可以购买数据、抓取内容、训练模型。真正拉开差距的，是谁能从这些数据里判断用户的真实需求。

同样是搜索“北京到上海机票”，有人只是查价格，有人准备马上出行，有人在做差旅报销，有人在比较高铁和飞机。

数据表面上相似，背后的意图完全不同。

AI系统的价值，就在于把这些相似行为拆开，判断谁只是浏览，谁正在犹豫，谁已经接近交易。

所以AI时代，平台的核心能力会从拥有数据，转向理解意图。

数据仍然重要，不过意图识别才是把原材料变成商业判断、推荐结果和广告定价的过程。

意图识别这种能力并非简单的数据规模问题。

竞争对手可以抓取网页，可以训练大模型，可以买浏览器入口，也可以做一个看起来体验不错的新搜索框。但它很难复制谷歌几十年来积累的用户反馈回路。

因为网页内容是公开的，用户行为反馈不是公开的。

搜索结果可以被模仿，搜索过程中的意图变化很难被模仿。

页面可以被抓取，几十亿人每天如何点击、停留、返回、换词、再搜索的经验，无法凭空生成。

这也是谷歌搜索的一大护城河。

这套判断一旦进入广告系统，就会变成更高的转化率、更精准的竞价、更好的排序质量，也会变成广告主愿意为谷歌支付溢价的理由。

谷歌最不害怕的是罚款。毕竟是财大气粗。过去十多年，它在欧洲已经吃过很多反垄断罚单，金额很大，但对一家年收入数千亿美元、现金流极强的公司来说，罚款更多是成本项，谷歌也已经习惯了。

谷歌也不一定最怕业务的拆分。拆分当然会带来资本市场和组织上的巨大冲击，但那是一个漫长、复杂、充满司法拉扯的过程，真正落地并不容易。

但这次欧盟的要求，谷歌可能真的紧张了。

因为触碰了谷歌最核心的一层资产：谷歌如何通过长期用户行为反馈，判断意图、衡量搜索质量、训练排序系统、优化广告匹配。

二

为什么这件事在今天突然变得更重要？

因为 AI 搜索来了。

以前搜索引擎之间竞争，大家比的是索引规模、排序算法、网页质量、入口分发。

现在呢？

OpenAI、Perplexity、微软 Copilot、未来各类智能体，都想把用户从传统搜索框里拽出来。

谷歌的传统搜索形态确实收到了不小的挑战。

但往底下看，AI 搜索还是绕不开一个问题：它怎么知道自己的答案是对的？怎么判断一个问题背后是知识需求、消费需求、医疗需求，还是交易需求？

大模型可以生成漂亮的话，但真实用户行为会告诉系统，哪些话有用，哪些话只是看起来有用。

如果 OpenAI 只是做一个聊天框，谷歌可以用 Gemini、Chrome、Android、默认搜索入口去对抗。

如果 OpenAI 未来能合法拿到一部分谷歌搜索行为数据呢？

事情就变了。

AI 搜索公司可以用这些数据改进检索、训练排序、校准答案、判断商业意图。它们会更快接近谷歌过去几十年积累出来的搜索经验。

谷歌当然不愿意。

这就像一个老厨师开了几十年饭馆，靠每天观察客人点什么、剩什么、回来几次、抱怨什么，终于形成了一套自己的味觉判断。现在监管者说，你太强了，把这些客人的反馈数据拿出来，给隔壁新开的饭馆也用一下。

老厨师一定会急。

三

谷歌这次把隐私作为挡箭牌，是一步很聪明的棋。

在欧洲的监管框架里，隐私和反垄断是最大的两个议题。

欧盟这些年一边搞 GDPR，一边搞 DMA。前者强调保护个人数据，后者强调打开平台竞争。平时这两个目标可以并行，到了搜索数据这里，就开始互相打架。

欧盟想让谷歌开放数据，扶持竞争对手。

谷歌反过来问欧盟：你要公平竞争，还是要个人隐私？

这个问题很难回答。

搜索数据跟普通广告曝光数据不一样。

一个人的搜索框，往往更接近个人的隐私。

比如一个人可能不会在社交平台公开说自己生病了，但会搜索一些症状的关键词。

他可能不会公开说自己想离婚，但会搜索财产分割。

即使拿掉姓名、账号、IP 地址，只要保留查询词、点击、时间、地理、浏览路径，仍然可能拼出一个人的基本画像。

尤其到了 AI 时代，重识别能力更强。

过去要重新识别一个匿名用户，需要人工推断，需要外部数据库，需要统计模型。

现在大模型可以处理长文本、长序列、复杂语义，能把很多零散线索串起来。

一个人连续搜索罕见病、某小区附近医院、某个公司岗位、某条航班、某个孩子学校活动。这些单点都匿名，连起来就可能成为身份指纹。

谷歌称，自己的红队两个小时内重新识别用户，具体测试细节我们没有看到，不能完全照单全收。但它指出的风险是真实存在的。

这就是欧盟两难的地方。

四

欧盟当然也不是闲着没事找谷歌麻烦。

它一直想解决一个问题：搜索市场为什么这么多年没有真正竞争？

微软投了很多钱，Bing 仍然很难撼动谷歌。

DuckDuckGo有隐私标签，但规模有限。

Brave、Neeva、You.com、Perplexity 都有新想法，但很难突破主流用户习惯。

原因在于搜索市场有很强的飞轮效应。

用户越多，数据越多，进而结果越准，进而又用户越多。

广告主跟着用户走，收入越高，研发和分发投入越大。

最后形成一个越来越正向的价值循环。

如果只要求谷歌给用户一个选择屏，让大家自己选搜索引擎，意义不大。大多数用户懒得换，换了也可能发现新搜索不够好，再换回谷歌。

如果只罚谷歌几十亿欧元，谷歌也能承受。

罚款对它来说是痛点，但不是命门。

在欧盟看来，真正能改变竞争态势的办法，就是拆掉谷歌的一部分数据飞轮。

欧盟的态度是：你谷歌作为守门人，不能把用户行为反馈全部锁在自己系统里，因为这些数据已经影响了整个搜索市场的竞争能力。

这个逻辑很激进的。

一旦成立，未来不只搜索数据可能被要求开放。

地图数据、购物数据、视频观看数据、广告点击数据、应用商店数据，都可能被竞争对手用类似理由要求打开。

尤其是当下的AI公司。

OpenAI 要做搜索，不能只靠模型聪明。

需要知道用户对答案的真实反应，需要知道商业查询怎么变现，需要知道哪些内容只是噪音。

如果能拿到谷歌的一部分搜索数据，ChatGPT在广告业务上的追赶速度会快很多。尽管他的布局速度以及很快了。

五

谷歌搜索广告的估值，长期建立在几个假设上：

第一，搜索仍然是最高意图入口。

第二，谷歌长期控制这个入口。

第三，竞争对手很难复制搜索质量。

搜索数据的开放会改变投资者对 Alphabet 的长期想象。

罚款不可怕。

合规成本也不可怕。

可怕的是监管者开始把谷歌内部数据资产，重新定义为市场竞争所需的公共基础设施。

如果这个趋势扩大，谷歌的护城河会被一点点稀释。

当然我觉得，最后方案大概率会折中。

欧盟不会轻易放弃数据共享，因为 DMA 已经把方向定下来了。

谷歌也很难完全挡住，因为它已经被定义为守门人。

如果欧盟最后给的是高度聚合、强延迟、低粒度数据，再配上严格沙盒和审计机制，这件事的象征意义会大于实际意义。

竞争对手会说自己赢了，谷歌会说自己服从监管，市场格局不会立刻变化。

如果欧盟最后要求较高粒度、较高频率、较低价格的数据共享，那就不一样了。

AI 搜索公司会真正拿到可用燃料，谷歌搜索经验会部分外溢，长期护城河会受到实质冲击。

所以这件事，要看数据开放到什么程度。数据这种东西，差一层粒度，价值差十倍。