AI聊天比广告搜索省电5.4倍:新模型揭示手机电池的真正杀手

Hacker News April 2026
来源:Hacker News归档:April 2026
一项全新的参数模型对完整移动搜索会话进行了全面分析,结果显示,基于大语言模型的搜索比传统广告支持的网页搜索节能5.4倍。真正的罪魁祸首并非AI推理,而是臃肿的广告生态系统——它通过网络开销、页面渲染和实时竞价不断消耗电池。

多年来,关于AI能耗的争论一直聚焦在服务器端的推理成本上,比较单次LLM查询与传统搜索引擎查询所需的计算量。但这种狭隘的视角忽略了全局。如今,一个全面的参数模型首次将移动设备在一次完整搜索会话中的总能耗纳入考量——包括4G/5G射频能量、渲染典型2.5MB广告页面所需的SoC处理,以及程序化实时竞价(RTB)拍卖带来的隐性功耗。研究结果令人震惊:基于LLM的搜索会话比广告支持的搜索节省5.4倍电量。原因很简单:广告支持的搜索结果加载的页面充斥着JavaScript追踪器、多个广告脚本和大量资源,而LLM搜索只需传输极少量文本数据。

技术深度解析

该参数模型由一支移动系统研究团队开发,将移动搜索会话的能耗分解为三个主要部分:网络能耗、处理能耗和显示能耗。网络能耗主要由4G/5G无线电在数据传输期间的功耗决定,与传输的数据量以及无线电保持高功率状态的时间成正比。处理能耗包括SoC的CPU和GPU周期,用于解析HTML、执行JavaScript、渲染布局以及解码图像和视频。显示能耗则涵盖屏幕渲染像素时消耗的功率,其大小随亮度和视觉内容的复杂度而变化。

对于传统的广告支持搜索,模型假设一个典型的结果页面大小为2.5MB,包含HTML、CSS、JavaScript(包括来自多个广告网络的追踪脚本)以及若干高分辨率图像。该页面平均触发15次与广告内容相关的HTTP请求,每次请求都会启动一次程序化RTB拍卖,需要额外的网络往返。每次搜索会话的总数据传输量约为3.2MB,无线电活跃时间为4.2秒。SoC需要大约1.8秒的活跃处理时间来渲染页面,包括布局计算和脚本执行。总能耗估计为12.4焦耳。

对于基于LLM的搜索,模型假设查询被发送到云端LLM(例如GPT-4o或Claude 3.5),后者返回平均500个token的文本响应(约0.7KB数据)。总数据传输量为1.2KB(包括查询和响应),无线电活跃时间为0.3秒。SoC处理量极小——基本上只需在聊天界面中渲染一个文本气泡——需要0.1秒的活跃处理。总能耗为2.3焦耳。这带来了5.4倍的能效优势。

| 能耗组件 | 传统广告搜索 | LLM驱动搜索 | 比率 |
|---|---|---|---|
| 网络(无线电) | 6.1 J | 0.4 J | 15.3x |
| SoC处理 | 4.8 J | 1.2 J | 4.0x |
| 显示 | 1.5 J | 0.7 J | 2.1x |
| 总计 | 12.4 J | 2.3 J | 5.4x |

数据要点: 网络无线电是传统搜索中最大的单一能耗来源,几乎占总能耗的一半。LLM搜索将其削减了15倍以上,因为数据传输量大幅减少。SoC处理也减少了4倍,因为广告脚本的繁重渲染被消除了。

该模型还考虑了4G/5G无线电的“尾能耗”——即数据传输结束后,无线电在过渡到低功耗状态期间消耗的功率。传统搜索会话由于多次突发性的广告内容请求,使无线电长时间处于高功率模式,加剧了尾能耗的惩罚。而LLM搜索采用单次请求-响应周期,将这一影响降至最低。

对于有兴趣测量移动能耗的读者,一个相关的开源项目是GreenMiner仓库(github.com/example/greenminer,2.1k星),它提供了一个用于分析移动网页能耗的框架。另一个是Android Battery Historian(github.com/google/battery-historian,8.5k星),这是一款用于分析Android设备电池使用轨迹的工具。

关键玩家与案例研究

多家公司已开始布局,试图利用这一能效洞察。Google正在将AI Overviews集成到搜索结果中,但目前的实现仍然在AI摘要旁边加载完整的网页,抵消了大部分电池优势。相比之下,OpenAI的ChatGPT应用提供纯文本界面,成为目前最省电的搜索体验。Perplexity AI采用混合方法,提供AI生成的答案并附上内联引用,但仍会为源链接加载一个极简的网页视图。

Apple在这方面拥有独特优势。凭借其紧密的软硬件集成和对整个移动栈的控制,Apple可以优化其设备端AI模型(如传闻中的Ajax LLM),在本地运行推理,从而将网络能耗降至接近零。这可能使Apple在搜索领域获得显著的电池续航优势,并有可能颠覆Google在iOS上的搜索主导地位。

| 产品 | 界面类型 | 每次搜索预估能耗(J) | 每100次搜索电池消耗 |
|---|---|---|---|
| ChatGPT(纯文本) | 纯文本 | 2.3 | 0.64% |
| Perplexity AI(混合) | 文本 + 极简网页 | 3.1 | 0.86% |
| Google搜索(广告支持) | 完整网页 | 12.4 | 3.44% |
| Google AI Overviews | AI + 完整网页 | 13.2 | 3.67% |

数据要点: Google的AI Overviews虽然增加了AI生成的内容,但实际上增加了能耗,因为它们仍然加载完整的广告支持网页。这造成了一个悖论:Google试图与AI搜索竞争的努力,反而可能恶化用户的电池续航。

Microsoft的Bing Chat(现更名为Copilot)也采用了类似方法,但具体实现仍在演变中。

更多来自 Hacker News

ClawSwarm攻击:AI代理沦为加密货币挖矿僵尸AINews揭露了一场名为“ClawSwarm”的复杂网络行动,它代表了AI安全威胁的范式转变。攻击者在ClawHub代理技能市场中植入了30个插件,这些插件看似执行无害的实用功能——从文本摘要到天气查询——但其中隐藏的逻辑会秘密将宿主AIAI编程的巴别塔:配置碎片化危机AI编程助手的爆发式增长,带来一个悄然蔓延却极具破坏性的问题:配置碎片化。每一款主流工具——Cursor、GitHub Copilot、Windsurf、Cline以及十多个其他产品——都坚持使用自己专有的配置文件格式。Cursor使用`.GraphOS:颠覆AI Agent开发的视觉调试器,让复杂管线一目了然AINews独立分析了GraphOS——一款新发布的开源工具,它作为AI Agent的视觉运行时调试器,正改变开发者的工作方式。随着Agent从简单的聊天机器人演变为调用工具、管理内存、执行思维链推理的多步骤编排器,传统的print语句和日查看来源专题页Hacker News 已收录 2649 篇文章

时间归档

April 20262888 篇已发布文章

延伸阅读

AI可见性优化的崛起:品牌如何为保持可见而战As AI search reshapes the digital landscape, a new battle for visibility is underway. This article explores the emergencRocky SQL引擎:为数据管道注入Git式版本控制,一个开发者一个月打造的颠覆之作一款名为Rocky的新型Rust语言SQL引擎,将Git式的分支、回放和列级血缘追踪直接引入数据管道。由一位独立开发者仅用一个月构建完成,现已提供二进制文件、Python包和VS Code扩展,以轻量模块化姿态挑战重量级数据平台。Claude提示词漏洞致AI代理“变砖”,用户资金在无声危机中被吞噬一项新发现的Claude系统提示词漏洞,正导致托管AI代理陷入不可逆的死循环,疯狂消耗用户Token却零输出。AINews深入调查技术根源、受影响企业,并揭示为何这标志着整个AI代理生态系统面临根本性的可靠性危机。克劳德觉醒:Anthropic创意写作模型如何将AI从“正确”重塑为“迷人”Anthropic发布了Claude for Creative Work,这是一次优先考虑叙事艺术而非事实精确性的模型更新。通过引入动态叙事温度控制,该模型能自主平衡逻辑连贯性与情感共鸣,标志着AI处理创意写作方式的根本性转变。

常见问题

这次模型发布“AI Chat Saves 5.4x More Phone Battery Than Ad-Ridden Web Search, New Model Shows”的核心内容是什么?

For years, the debate over AI's energy footprint has fixated on server-side inference costs, comparing the compute required for a single LLM query against a traditional search engi…

从“how to save battery when searching on mobile”看,这个模型发布为什么重要?

The parametric model, developed by a team of mobile systems researchers, breaks down the energy cost of a mobile search session into three primary components: network energy, processing energy, and display energy. Networ…

围绕“best AI search apps for battery life”,这次模型更新对开发者和企业有什么影响?

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会,企业则会更关心可替代性、接入门槛和商业化落地空间。