技术深度解析
答案劫持的架构
核心机制出奇地简单:用于搜索的大语言模型(LLM)现在会从多个来源生成合成答案,然后在该答案块内直接嵌入付费广告。在Google SGE中,广告以“赞助商”摘要的形式出现在自然结果上方,通常带有指向广告商网站的链接,但没有指向原始内容来源的链接。OpenAI的SearchGPT也如法炮制,将产品推荐或服务广告插入对话式答案中。其技术流程包含三个阶段:
1. 检索增强生成(RAG):模型从网络索引中检索排名前5-10的文档,按相关性排序并提取关键句子。创作者的內容在此被消耗。
2. 答案合成:LLM将提取的内容重写为连贯的答案,通常丢失署名。模型的训练目标是最大化用户满意度(答案完整性),而非发布者署名。
3. 广告注入:独立的广告服务器决定是否在答案块中插入付费展示。该决策基于查询意图(例如,“最佳编程笔记本电脑”会触发产品广告)和广告商出价。
关键的技术细节在于:广告在用户点击任何链接之前就已展示。创作者的內容被用作原材料,但变现事件(广告展示)完全发生在AI平台生态系统内部。这与传统搜索有本质区别——传统搜索中,广告虽与自然结果并列展示,但点击仍会流向发布者。
“零点击”数据
一家主要SEO分析公司在2024年进行的研究发现,对于信息类查询,Google SGE使原始来源的点击率(CTR)相比传统搜索结果下降了62%。对于交易类查询(例如,“购买跑鞋”),CTR下降41%,因为用户仍需完成购买。下表展示了不同查询类型的影响:
| 查询类型 | 传统搜索CTR | SGE CTR | 变化幅度 |
|---|---|---|---|
| 信息类(例如,“如何修理漏水水龙头”) | 34% | 12% | -64.7% |
| 交易类(例如,“最佳降噪耳机”) | 28% | 16% | -42.9% |
| 导航类(例如,“维基百科艾伦·图灵”) | 52% | 38% | -26.9% |
| 本地类(例如,“附近披萨店”) | 45% | 33% | -26.7% |
数据要点: 信息类内容——博客、教程网站和新闻媒体的“面包与黄油”——受到的冲击最为严重。AI答案对大多数用户而言“足够好”,消除了点击的必要。此类内容的创作者面临生存威胁,除非他们转向AI难以轻易摘要的内容。
暴露问题的GitHub仓库
对于开发者和技术型创作者而言,开源项目'search-hijack-detector'(GitHub上12,000+星标)提供了一个工具,可测量某个URL在AI搜索答案中被用作来源但未获署名的频率。该工具抓取Google SGE和SearchGPT的响应,提取引用的来源,并与原始内容进行比较。该仓库的早期数据显示,73%的AI答案引用是“孤儿引用”——来源URL被提及但未添加超链接,使用户几乎无法点击进入。
关键参与者与案例研究
谷歌:在位者的困境
Google的SGE是最激进的实施方案。通过将广告直接嵌入AI答案,谷歌保护了其超过2000亿美元的搜索广告业务,同时蚕食了为其索引提供内容的发布者。该公司推出了“发布者补偿计划”,向部分新闻媒体支付其内容在SGE中被使用的费用,但支付金额不透明且据称很低——一家主要出版商披露,其整个档案被无限使用的月费为15,000美元,仅为其从自然流量中获得的收入的一小部分。
OpenAI:颠覆者的剧本
OpenAI的SearchGPT于2024年底推出,采取了不同的方法:它提供“引用API”,允许发布者选择加入,并在其内容被用于答案时分享广告收入。收入分成比例为发布者30%,OpenAI保留70%。早期采用者如食谱网站'SimplyRecipes'报告称,来自SearchGPT引用的收入相比之前的谷歌广告收入增长了15%,但这仅仅是因为其来自谷歌的流量已经下降了40%。净效果是从高流量、低利润的模式转向低流量、高利润的引用收入模式。
成功转型的创作者:“量化工程师”
一个成功适应的案例是YouTube频道和博客“量化工程师”,由一位前谷歌工程师运营。他不再制作通用的“如何做”编程教程,而是专注于原创基准数据——在他自建的定制测试套件上比较AI编程助手的性能。由于他的数据独一无二,无法从其他来源合成,因此AI模型在摘要其内容时不得不引用其来源,从而为他带来了可观的引用流量和收入。