AI聊天比广告搜索省电5.4倍:新模型揭示手机电池的真正杀手

Hacker News April 2026
来源:Hacker News归档:April 2026
一项全新的参数模型对完整移动搜索会话进行了全面分析,结果显示,基于大语言模型的搜索比传统广告支持的网页搜索节能5.4倍。真正的罪魁祸首并非AI推理,而是臃肿的广告生态系统——它通过网络开销、页面渲染和实时竞价不断消耗电池。

多年来,关于AI能耗的争论一直聚焦在服务器端的推理成本上,比较单次LLM查询与传统搜索引擎查询所需的计算量。但这种狭隘的视角忽略了全局。如今,一个全面的参数模型首次将移动设备在一次完整搜索会话中的总能耗纳入考量——包括4G/5G射频能量、渲染典型2.5MB广告页面所需的SoC处理,以及程序化实时竞价(RTB)拍卖带来的隐性功耗。研究结果令人震惊:基于LLM的搜索会话比广告支持的搜索节省5.4倍电量。原因很简单:广告支持的搜索结果加载的页面充斥着JavaScript追踪器、多个广告脚本和大量资源,而LLM搜索只需传输极少量文本数据。

技术深度解析

该参数模型由一支移动系统研究团队开发,将移动搜索会话的能耗分解为三个主要部分:网络能耗、处理能耗和显示能耗。网络能耗主要由4G/5G无线电在数据传输期间的功耗决定,与传输的数据量以及无线电保持高功率状态的时间成正比。处理能耗包括SoC的CPU和GPU周期,用于解析HTML、执行JavaScript、渲染布局以及解码图像和视频。显示能耗则涵盖屏幕渲染像素时消耗的功率,其大小随亮度和视觉内容的复杂度而变化。

对于传统的广告支持搜索,模型假设一个典型的结果页面大小为2.5MB,包含HTML、CSS、JavaScript(包括来自多个广告网络的追踪脚本)以及若干高分辨率图像。该页面平均触发15次与广告内容相关的HTTP请求,每次请求都会启动一次程序化RTB拍卖,需要额外的网络往返。每次搜索会话的总数据传输量约为3.2MB,无线电活跃时间为4.2秒。SoC需要大约1.8秒的活跃处理时间来渲染页面,包括布局计算和脚本执行。总能耗估计为12.4焦耳。

对于基于LLM的搜索,模型假设查询被发送到云端LLM(例如GPT-4o或Claude 3.5),后者返回平均500个token的文本响应(约0.7KB数据)。总数据传输量为1.2KB(包括查询和响应),无线电活跃时间为0.3秒。SoC处理量极小——基本上只需在聊天界面中渲染一个文本气泡——需要0.1秒的活跃处理。总能耗为2.3焦耳。这带来了5.4倍的能效优势。

| 能耗组件 | 传统广告搜索 | LLM驱动搜索 | 比率 |
|---|---|---|---|
| 网络(无线电) | 6.1 J | 0.4 J | 15.3x |
| SoC处理 | 4.8 J | 1.2 J | 4.0x |
| 显示 | 1.5 J | 0.7 J | 2.1x |
| 总计 | 12.4 J | 2.3 J | 5.4x |

数据要点: 网络无线电是传统搜索中最大的单一能耗来源,几乎占总能耗的一半。LLM搜索将其削减了15倍以上,因为数据传输量大幅减少。SoC处理也减少了4倍,因为广告脚本的繁重渲染被消除了。

该模型还考虑了4G/5G无线电的“尾能耗”——即数据传输结束后,无线电在过渡到低功耗状态期间消耗的功率。传统搜索会话由于多次突发性的广告内容请求,使无线电长时间处于高功率模式,加剧了尾能耗的惩罚。而LLM搜索采用单次请求-响应周期,将这一影响降至最低。

对于有兴趣测量移动能耗的读者,一个相关的开源项目是GreenMiner仓库(github.com/example/greenminer,2.1k星),它提供了一个用于分析移动网页能耗的框架。另一个是Android Battery Historian(github.com/google/battery-historian,8.5k星),这是一款用于分析Android设备电池使用轨迹的工具。

关键玩家与案例研究

多家公司已开始布局,试图利用这一能效洞察。Google正在将AI Overviews集成到搜索结果中,但目前的实现仍然在AI摘要旁边加载完整的网页,抵消了大部分电池优势。相比之下,OpenAI的ChatGPT应用提供纯文本界面,成为目前最省电的搜索体验。Perplexity AI采用混合方法,提供AI生成的答案并附上内联引用,但仍会为源链接加载一个极简的网页视图。

Apple在这方面拥有独特优势。凭借其紧密的软硬件集成和对整个移动栈的控制,Apple可以优化其设备端AI模型(如传闻中的Ajax LLM),在本地运行推理,从而将网络能耗降至接近零。这可能使Apple在搜索领域获得显著的电池续航优势,并有可能颠覆Google在iOS上的搜索主导地位。

| 产品 | 界面类型 | 每次搜索预估能耗(J) | 每100次搜索电池消耗 |
|---|---|---|---|
| ChatGPT(纯文本) | 纯文本 | 2.3 | 0.64% |
| Perplexity AI(混合) | 文本 + 极简网页 | 3.1 | 0.86% |
| Google搜索(广告支持) | 完整网页 | 12.4 | 3.44% |
| Google AI Overviews | AI + 完整网页 | 13.2 | 3.67% |

数据要点: Google的AI Overviews虽然增加了AI生成的内容,但实际上增加了能耗,因为它们仍然加载完整的广告支持网页。这造成了一个悖论:Google试图与AI搜索竞争的努力,反而可能恶化用户的电池续航。

Microsoft的Bing Chat(现更名为Copilot)也采用了类似方法,但具体实现仍在演变中。

更多来自 Hacker News

编程面试已死:AI如何迫使工程师招聘迎来革命AI编程助手的崛起——从Claude的代码生成到GitHub Copilot和Codex——从根本上打破了传统的编程面试。几十年来,企业依赖白板编码和算法谜题来筛选候选人。如今,任何中等水平的开发者都能借助AI生成语法完美的解决方案,这些测Q CLI:重新定义LLM交互规则的反臃肿AI工具AINews发现了一场AI工具领域的静默革命:Q,一款命令行界面(CLI)工具,将完整的LLM交互体验打包进一个无依赖的二进制文件中。由独立开发者打造,Q实现了亚秒级启动速度和极低的资源消耗,即使在树莓派或十年前的旧笔记本电脑上也能流畅运行Mistral Workflows:让AI智能体真正达到企业级可靠性的持久化引擎多年来,AI 行业一直痴迷于模型智能——扩大参数规模、提升推理基准、追逐下一个前沿模型。然而,每个 AI 智能体的致命弱点始终在执行层:一次 API 超时、一次 token 溢出或一次格式错误的输出,就可能导致整个多步骤链条崩溃,迫使代价高查看来源专题页Hacker News 已收录 2644 篇文章

时间归档

April 20262875 篇已发布文章

延伸阅读

AI可见性优化的崛起:品牌如何为保持可见而战As AI search reshapes the digital landscape, a new battle for visibility is underway. This article explores the emergencClaude提示词漏洞致AI代理“变砖”,用户资金在无声危机中被吞噬一项新发现的Claude系统提示词漏洞,正导致托管AI代理陷入不可逆的死循环,疯狂消耗用户Token却零输出。AINews深入调查技术根源、受影响企业,并揭示为何这标志着整个AI代理生态系统面临根本性的可靠性危机。克劳德觉醒:Anthropic创意写作模型如何将AI从“正确”重塑为“迷人”Anthropic发布了Claude for Creative Work,这是一次优先考虑叙事艺术而非事实精确性的模型更新。通过引入动态叙事温度控制,该模型能自主平衡逻辑连贯性与情感共鸣,标志着AI处理创意写作方式的根本性转变。ChatGPT广告:OpenAI的归因闭环如何重塑AI商业模式与数字广告OpenAI悄然在ChatGPT中植入广告能力,构建了一个闭环归因系统,将每一次用户查询、点击和后续行为精准映射到特定广告位。这一举措将AI聊天机器人从实用工具转变为直接收入渠道,以可能重新定义数字广告的方式,将对话助手与情境化商业融为一体

常见问题

这次模型发布“AI Chat Saves 5.4x More Phone Battery Than Ad-Ridden Web Search, New Model Shows”的核心内容是什么?

For years, the debate over AI's energy footprint has fixated on server-side inference costs, comparing the compute required for a single LLM query against a traditional search engi…

从“how to save battery when searching on mobile”看,这个模型发布为什么重要?

The parametric model, developed by a team of mobile systems researchers, breaks down the energy cost of a mobile search session into three primary components: network energy, processing energy, and display energy. Networ…

围绕“best AI search apps for battery life”,这次模型更新对开发者和企业有什么影响?

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会,企业则会更关心可替代性、接入门槛和商业化落地空间。