Imece的FLOP代币:将闲置GPU变为全民AI推理网络

Hacker News May 2026
来源:Hacker NewsAI infrastructure归档:May 2026
一个名为Imece的开源项目,通过汇聚全球志愿者的闲置GPU,构建去中心化AI推理网络。其FLOP代币将浮点运算转化为可交易数字资产,旨在大幅降低模型部署成本,挑战AWS和Azure的霸主地位。

Imece代表了对中心化AI基础设施模式的彻底颠覆。它不向云巨头租用昂贵的集群,而是构想一个全球性的点对点网络:任何拥有消费级GPU的人——从游戏玩家的RTX 4090到办公室电脑的集成显卡——都可以贡献算力用于AI推理,并赚取FLOP代币作为回报。其核心创新在于一个经济层,将计算工作(以浮点运算衡量)代币化为一种可互换的数字资产,从而为推理能力创建一个自我调节的市场。该项目解决了编排异构、不可靠节点的艰巨技术挑战,同时通过密码学验证和冗余机制确保结果正确性。早期基准测试表明,对于延迟容忍型任务,Imece的成本优势极为显著,但代价是更高的延迟和更低的可靠性。

技术深度解析

Imece的架构建立在三个层次之上:计算编排层验证层经济结算层。编排层使用修改版的Ray分布式计算框架,将推理请求分片到各个参与节点。当用户提交提示词时,网络将模型拆分为更小的子图(利用模型并行技术),并将每个子图分配给不同的GPU。这让人联想到Petals(一个去中心化的BERT推理网络)的工作方式,但Imece通过ONNX Runtime或TensorRT-LLM后端,将这种方法推广到任何基于Transformer的模型。

验证层是最具独创性也最具争议的部分。Imece采用了一种带密码学承诺的冗余执行方案:每个推理任务至少发送给三个独立节点。每个节点计算结果,并提交其输出的哈希值以及一个正确执行的零知识证明(使用针对矩阵乘法定制的轻量级zk-SNARK电路)。然后网络比较这些哈希值;如果其中两个匹配,则接受该结果。这提供了针对最多三分之一恶意节点的拜占庭容错能力。然而,开销是巨大的——在消费级GPU上,为7B参数模型的一次前向传播生成zk-SNARK目前需要12-18秒,显著增加了延迟。

为了解决这个问题,团队在GitHub上开源了一个名为`imece-zkp`的自定义证明聚合库(目前获得890颗星),该库将多个推理证明批量打包成一个简洁证明。早期基准测试显示,对于64或更大批次,每个请求的开销降至2秒以下。尽管如此,对于聊天机器人等实时应用,这种延迟仍然过高。该项目正在探索一种基于信任的层级系统,其中高信誉节点可以跳过低风险任务的ZK证明,接受一种概率安全模型。

| 指标 | Imece(3节点ZK) | Imece(信任层级) | AWS SageMaker(g5.2xlarge) |
|---|---|---|---|
| 每次Llama 3.1 8B请求延迟 | 14.2秒 | 3.1秒 | 1.8秒 |
| 每100万Token成本 | 0.42美元 | 0.18美元 | 2.50美元 |
| 吞吐量(Token/秒) | 45 | 210 | 380 |
| 节点可靠性(正常运行时间) | 72% | 88% | 99.95% |

数据要点: Imece的成本优势惊人——对于批量任务,比AWS便宜高达93%——但代价是延迟高出5-8倍,可靠性显著降低。信任层级缩小了差距,但引入了安全权衡。

经济层使用FLOP代币,这是一种在侧链上(使用Polygon CDK实现低费用)兼容ERC-20的代币。一个FLOP代币代表10^15次浮点运算(1 petaFLOP)的已验证推理工作。代币供应根据网络总计算能力算法性地扩展,并内置衰减函数以防止恶性通货膨胀。贡献者通过每次验证的推理赚取FLOP代币,而消费者则通过销毁代币来提交请求。一个联合曲线机制根据供需动态调整代币价格,目标是稳定在每FLOP 0.001美元(即每1 petaFLOP 1美元)。

关键参与者与案例研究

Imece由一个化名团队创立,领导人是“0xSatoshi”(去中心化计算领域的知名人物,曾参与Golem项目)和Dr. Elena Voss(前NVIDIA研究科学家,曾从事GPU虚拟化工作)。该项目已从包括Polychain Capital和Variant Fund在内的Web3风投基金联盟获得250万美元的种子轮融资。

该项目直接与几个成熟的参与者竞争:

- Golem:最古老的去中心化计算网络,但专注于通用CPU/GPU任务,而非AI推理优化。Golem的代币(GLM)市值为1.8亿美元,但其AI推理支持非常初级——需要手动设置Docker容器。
- Akash Network:一个支持GPU租赁的去中心化云市场。Akash处理原始计算租赁,但缺乏Imece提供的推理特定优化和验证层。Akash的GPU提供商每小时的RTX 4090收入约为0.50美元,而Imece的FLOP代币等价收入约为0.35美元/小时。
- Together AI:一个中心化推理API,聚合来自数据中心的GPU容量。Together AI提供更低的延迟(Llama 3.1 8B低于100毫秒),但价格为每百万Token 0.50美元——大约是Imece成本的3倍。

| 平台 | 去中心化? | AI推理专注? | 每百万Token平均成本(Llama 3.1 8B) | 延迟(P50) | 节点数 |
|---|---|---|---|---|---|
| Imece | 是 | 是 | 0.18–0.42美元 | 3–14秒 | ~2,500(测试版) |
| Golem | 是 | 否 | 不适用(仅CPU) | 不适用 | ~800 |
| Akash | 是 | 部分 | 0.50–1.20美元 | 5–30秒 | ~1,200个GPU |
| Together AI | 否 | 是 | 0.50美元 | 0.12秒 | 10,000+(数据中心) |

数据要点: Imece占据了一个独特的利基市场——完全去中心化且针对推理优化——但其延迟和可靠性远落后于中心化替代方案。对于非实时使用场景,Imece的成本优势使其极具吸引力;但对于延迟敏感的应用程序,它仍然是一个小众选择。

更多来自 Hacker News

AI医生临床任务72%挂科:结构性缺陷大曝光AI医疗智能体的美好承诺,在现实面前撞得粉碎。一项覆盖Claude、GPT和Gemini三大模型、针对15项美国标准临床工作流的新基准测试显示,整体失败率高达72%。测试涵盖预授权处理、临床笔记生成、实验室结果解读、药物核对和出院小结撰写等奶酪大亨如何用多智能体AI编排系统拯救5亿美元帝国当一家历史悠久的加州奶酪公司创始人发现其5亿美元业务因损耗、配送错误和劳动力短缺而资金流失时,他没有求助于新的熟化技术或物流顾问。相反,他委托开发了一套多智能体AI系统。结果,这个案例研究悄然成为科技行业之外企业AI应用最常被引用的典范。该AI 导致失业潮?黄仁勋斥为“懒人思维”,但数据揭示更残酷真相英伟达CEO黄仁勋,这家全球市值最高AI基础设施公司的掌舵者,近期驳斥了“AI将引发大规模失业”的观点,称其为“懒人叙事”。他的论据基于历史先例,认为如同工业革命或互联网时代一样,AI将重塑而非消灭工作岗位。然而,这一视角对于一家市值高达3查看来源专题页Hacker News 已收录 4033 篇文章

相关专题

AI infrastructure270 篇相关文章

时间归档

May 20262987 篇已发布文章

延伸阅读

家庭GPU革命:分布式计算如何重塑AI基础设施民主化格局一场静默的革命正在全球科技爱好者的地下室与游戏房中酝酿。受SETI@home精神遗产启发,新兴分布式计算平台正汇聚闲置消费级GPU算力,为AI时代构建去中心化的超级计算机。这场运动有望打破超大规模云服务商的垄断,让计算资源回归大众。Token计费基础设施:压垮AI经济学的隐形瓶颈当AI行业痴迷于模型规模和推理速度时,一个看似平凡却致命的问题正在浮现:Token计费基础设施。我们的分析显示,追踪、定价和管理Token消耗正成为AI应用扩展的隐性税负,威胁着单位经济模型,并迫使企业从根本上重新思考商业模式。挪威2PB华为全闪存部署:AI训练的性能优先,政治靠边挪威,一个北约成员国,悄然部署了2PB华为全闪存存储,用于大语言模型训练。这一决定打破了西方供应链的常规,标志着AI基础设施采购从政治驱动转向性能驱动。当训练万亿参数模型时,存储子系统的极端I/O需求让传统方案力不从心,而华为的闪存架构凭借YieldOS-Lite:生产环境亟需的LLM推理治理模拟驾驶舱YieldOS-Lite是一款开源工具,专门模拟大语言模型推理系统的控制平面与治理逻辑。当企业不再满足于实验性LLM应用时,这个“模拟驾驶舱”让开发者能够在正式上线前,对速率限制、预算上限和多模型路由策略进行原型设计与压力测试。

常见问题

这次模型发布“Imece's FLOP Token Turns Idle GPUs Into a People's AI Inference Network”的核心内容是什么?

Imece represents a radical departure from the centralized AI infrastructure model. Instead of renting expensive clusters from cloud giants, it envisions a global, peer-to-peer netw…

从“How Imece FLOP token works for GPU mining”看,这个模型发布为什么重要?

Imece's architecture is built on three layers: a compute orchestration layer, a verification layer, and an economic settlement layer. The orchestration layer uses a modified version of the Ray distributed computing frame…

围绕“Imece vs Golem vs Akash decentralized compute comparison”,这次模型更新对开发者和企业有什么影响?

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会,企业则会更关心可替代性、接入门槛和商业化落地空间。