算力通证化:AI推理即公共设施如何重塑计算经济

Hacker News March 2026
来源:Hacker News归档:March 2026
人工智能产业正经历一场根本性变革:计算力正被商品化为可度量、可交易的代币。这场转型将AI推理变为电力般的公共设施,代币则成为通用的消费与价值转移单位。在降低尖端模型使用门槛的同时,这一新经济层也引发了关于技术依赖与生态垄断的深刻拷问。

人工智能的竞争前沿已从纯粹模型能力竞赛,决定性转向围绕新经济原语——AI推理代币的生态战争。核心硬件制造商与云服务商正联手将AI算力重塑为标准化的计量公共设施。这意味着一场深刻的商业模式革命:从销售离散硬件或软件许可,转向运营持续的服务经济。对开发者而言,这种“代币即电力”模式极大降低了部署尖端大语言模型或视频生成智能体的初始门槛,实现真正的按使用付费。然而,这也可能催生对“代币工厂”的新型依赖与锁定风险——这些掌控算力分配与定价权的实体,或将成为下一代AI基础设施的隐形主宰。这场变革背后,是硬件层(如英伟达GPU)、协议层(如Akash Network)与应用层(如Together AI)的复杂博弈,其终局将是构建一个去中心化的“AI预言机网络”,使AI成为智能合约中可信任、可组合的底层模块。

技术深潜

AI算力通证化不仅是计费方式的创新,更是建立在密码学证明、去中心化网络与标准化接口堆栈上的架构革命。其核心在于,系统必须证明已完成特定、可验证的有用计算工作(对定义模型的推理)。这远非中心化账本追踪的简单API调用可比。

基础技术是可验证计算密码学证明的结合。GizaEZKL等项目正率先使用零知识证明(ZKPs)zk-SNARKs,为特定机器学习模型(如Llama 3 70B)在给定输入上的正确执行生成密码学证明,同时不泄露模型权重或输入数据。支持神经网络推理ZK证明生成的`ezkl` GitHub仓库已获超2,500星标,彰显开发者对可验证AI的强烈兴趣。该证明随后被锚定至区块链上的代币交易,形成不可篡改、可审计的算力消耗记录。

另一关键层是计算单元的标准化。与异构的云计算单元(vCPU、GPU)不同,AI推理代币需要“智能工作”的标准化度量。这通常定义为代币-秒FLOP-秒,并根据模型规模与架构加权。例如,从700亿参数模型生成1000个代币,相比从70亿参数模型生成,构成不同且更昂贵的工作单元。行业正汇聚于MLPerf Inference等基准来定义这些标准化单元。下表展示了不同供应商如何打包和定价其通证化算力,尽管市场尚未完全标准化。

| 供应商 / 协议 | 计算单位 | 底层技术 | 验证方法 | 目标延迟 |
|---|---|---|---|---|
| Akash Network | GPU-小时(租赁) | 消费级GPU(RTX 4090) | 经济罚没 + 信誉机制 | 100毫秒 - 2秒 |
| Ritual | Infernet节点任务 | 专用AI节点 | 乐观证明 + ZK欺诈证明 | <500毫秒 |
| Together AI | 按代币付费API | 专有集群 | 中心化证明 | <100毫秒 |
| Bittensor | 子网激励 | 网络节点 | 节点共识与验证 | 可变 |

数据洞察: 技术格局呈现出去中心化密码学验证网络(Ritual、Akash)到中心化但代币可访问API(Together)的谱系。延迟与验证严格度存在明显权衡:更快、更便宜的推理往往伴随对已完成工作的密码学保证较弱。

终局是构建AI预言机网络:一个节点在链下执行推理、在链上提交证明的去中心化系统,使AI成为智能合约中无需信任、可组合的底层模块。这将催生全新应用,例如基于AI对新闻情绪分析自动清算的DeFi贷款,或由动态拍卖模型推理驱动的非玩家角色游戏。

关键参与者与案例研究

推动AI算力通证化的联盟包括去中心化物理基础设施(DePIN)网络、云供应商和模型开发商,各方策略各异。

去中心化计算网络正在铺设基础轨道。被称为“算力界Airbnb”的Akash Network,已成功从通用云扩展至AI专用GPU市场。其Supercloud计划允许用户部署GPU集群并赚取AKT代币。Ritual则采取更AI原生的路径,构建专注于托管和提供模型的“推理网”,通过质押与罚没机制确保经济安全。其近期集成`Zama`项目的全同态加密(FHE)工具,旨在默认提供保密推理服务。

拥抱通证化的中心化供应商正在适应趋势。Together AI构建了最大的开源模型推理平台之一,虽然当前使用传统信用体系,但其架构已为直接代币支付层做好准备。更重要的是,领先GPU云供应商CoreWeave已探索将GPU小时通证化为NFT,创建算力期货二级市场。这连接了传统云世界与加密原生经济模型。

作为代币发行方的模型出版商代表了最具颠覆性的案例。试想Mistral AI01.AI发布下一代旗舰模型时,不仅通过API,更以模型代币形式发行。持有或质押该代币可获得推理费率折扣或对模型微调方向的治理权。这将模型本身转化为资本资产,使开发者、用户与模型创造者的激励保持一致。Bittensor已在网络层面率先实践这一概念。

更多来自 Hacker News

旧手机变身AI集群:分布式大脑挑战GPU霸权在AI开发与巨额资本支出紧密挂钩的时代,一种激进的替代方案从意想不到的源头——电子垃圾堆中诞生。研究人员成功协调了数百台旧手机组成的分布式集群——这些设备通常因无法运行现代应用而被丢弃——来执行大型语言模型的推理任务。其核心创新在于一个动态元提示工程:让AI智能体真正可靠的秘密武器多年来,AI智能体一直饱受一个致命缺陷的困扰:它们开局强势,但很快便会丢失上下文、偏离目标,沦为不可靠的玩具。业界尝试过扩大模型规模、增加训练数据,但真正的解决方案远比这些更优雅。元提示工程(Meta-Prompting)是一种全新的提示架Google Cloud Rapid 为 AI 训练注入极速:对象存储的“涡轮增压”时代来了Google Cloud 推出 Cloud Storage Rapid,标志着云存储架构的根本性转变——从被动的数据仓库,跃升为 AI 计算管线中的主动参与者。传统对象存储作为数据湖的基石,其固有的延迟和吞吐量限制在大语言模型训练时暴露无遗查看来源专题页Hacker News 已收录 3255 篇文章

时间归档

March 20262347 篇已发布文章

延伸阅读

代币经济革命:AI代币如何重塑价值、访问与机器交易AI代币正从单纯的计费单位,演变为AI经济中价值交换的基础媒介。这一转变正在重写访问规则、激励机制与自主代理交易,掀起一场静默而强大的风暴,将定义未来十年的AI发展。旧手机变身AI集群:分布式大脑挑战GPU霸权一项开创性实验证明,数百台废弃智能手机通过精密负载均衡架构连接,能够以接近入门级GPU服务器的推理速度集体运行大型语言模型。这一突破将电子垃圾转化为低成本、可行的AI算力资源,直接挑战行业对高端硬件的依赖。元提示工程:让AI智能体真正可靠的秘密武器AINews独家揭秘一项突破性技术——元提示工程(Meta-Prompting),它通过在AI智能体指令中嵌入自我监控层,实现推理路径的实时审计与纠错。这一创新彻底解决了长期困扰业界的任务漂移与上下文遗忘问题,将智能体从被动执行者转变为主动Google Cloud Rapid 为 AI 训练注入极速:对象存储的“涡轮增压”时代来了Google Cloud 正式发布 Cloud Storage Rapid,一款专为 AI 和分析工作负载打造的“涡轮增压”对象存储服务。通过大幅降低延迟、提升吞吐量,它直击长期困扰大规模模型训练与实时推理的 I/O 瓶颈,让存储从被动仓库

常见问题

这次模型发布“Tokenizing Intelligence: How AI Inference as a Utility Is Reshaping the Compute Economy”的核心内容是什么?

The competitive frontier in artificial intelligence has decisively moved from a pure model capability race to an ecosystem battle centered on a new economic primitive: the AI infer…

从“how do AI inference tokens work technically”看,这个模型发布为什么重要?

The tokenization of AI compute is not merely a billing innovation; it is an architectural revolution built on a stack of cryptographic proofs, decentralized networks, and standardized interfaces. At its core, the system…

围绕“best decentralized AI compute network 2024”,这次模型更新对开发者和企业有什么影响?

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会,企业则会更关心可替代性、接入门槛和商业化落地空间。