Flourish押注大脑算法,欲破AI的能源诅咒

June 2026
归档:June 2026
一家名为Flourish的初创公司正发起一场豪赌:通过模仿大脑的神经动力学来解决AI的能源危机。其目标是彻底取代基于Transformer的模型,转向脉冲神经网络与存内计算,挑战整个以GPU为核心的产业。成功将重新定义AI的未来;失败则可能成为该行业代价最惨重的错误。

Flourish,一家根植于神经科学与半导体工程的神秘初创公司,近日公布了一项激进战略,旨在打破AI领域的能源枷锁。该公司的核心论点是,当前范式——在日益庞大的GPU集群上扩展Transformer模型——正触及根本性的能源天花板。训练一次前沿模型可消耗超过1,000兆瓦时电力,而视频生成模型的推理成本更在飙升。Flourish的替代方案是回归第一性原理:人脑仅需约20瓦功率,就能完成需要GPU耗费兆瓦级电力才能实现的认知壮举。为复现这一奇迹,Flourish彻底放弃了注意力机制,转而构建基于脉冲神经网络(SNN)和突触可塑性的算法。这些算法利用事件驱动的稀疏计算,理论上可将能耗降低100至200倍。该公司还押注存内计算(IMC),直接在内存阵列中执行模拟矩阵运算,从而消除数据搬运带来的巨大能耗。目前Flourish仍处于实验室原型阶段,其模拟硬件的精度和可扩展性面临严峻挑战。若成功,它将颠覆整个AI硬件生态;若失败,则可能成为行业历史上最昂贵的教训。

技术深度解析

Flourish的技术路线是对统治现代AI的Transformer架构的一次彻底背离。其算法的核心是脉冲神经网络(SNN),它将神经元建模为离散事件发生器,而非连续激活函数。在SNN中,只有当神经元的膜电位超过阈值时才会发放一个脉冲,随后复位。这种事件驱动计算天然具有稀疏性——大多数神经元在任意时刻都处于静默状态——从而带来巨大的能耗节省。这与Transformer形成鲜明对比:在Transformer中,每个token都要与所有其他token进行密集的二次方计算,能耗与序列长度的平方成正比。

Flourish还实现了脉冲时序依赖可塑性(STDP),这是一种具有生物合理性的学习规则,突触权重根据前后脉冲的精确时序进行调整。这与反向传播有本质区别:反向传播需要全局梯度计算,能耗极高。STDP是局部的、无监督的,并且可以直接在硬件中实现,有望实现片上学习,无需海量数据传输。

在硬件方面,Flourish押注于存内计算(IMC)。传统的冯·诺依曼架构需要在内存与处理器之间搬运数据,这一过程消耗的能量比计算本身高出数个数量级。IMC利用内存阵列(例如电阻式RAM或相变存储器)直接在数据所在位置执行模拟矩阵-向量乘法。这消除了数据搬运,并实现了大规模并行。挑战在于,模拟计算存在噪声,易受器件差异影响,且难以扩展到训练所需的精度。

| 指标 | Transformer(GPT-4级别) | Flourish SNN + IMC(预估) |
|---|---|---|
| 单次推理能耗(10亿参数模型) | ~10焦耳 | ~0.05焦耳 |
| 训练能耗(10亿参数模型) | ~1,000兆瓦时 | ~10兆瓦时 |
| 延迟(实时语音) | ~50毫秒 | ~5毫秒 |
| 精度(权重) | FP16 | 4位模拟(有效) |
| 硬件成熟度 | 成熟(GPU) | 原型(实验室) |

数据要点: 预估的100至200倍能耗节省令人震惊,但代价是精度和成熟度。IMC的模拟特性意味着,要达到与数字Transformer相同的精度,是一项艰巨的工程挑战。

一个值得关注的开源项目是Lava(英特尔的神经形态框架),它在GitHub上拥有超过1,500颗星,为SNN提供了软件栈。另一个是snnTorch(超过2,000颗星),它将SNN集成到PyTorch中。这些代码库表明研究社区正在积极探索这一领域,但它们距离生产就绪仍有很长的路要走。

关键玩家与案例研究

Flourish并非孤军奋战,但其方法最为激进。神经形态计算领域包括几家主要参与者,各自采取不同策略。

英特尔的Loihi 2是已投产的最先进神经形态芯片。它采用数字SNN核心,专为事件驱动的低功耗推理而设计。然而,它并未实现存内计算;尽管采用了专用架构,但仍使用分离的内存和逻辑。Loihi 2在嗅觉感知和机器人控制等任务上表现出色,但尚未在大型语言模型上展现出有竞争力的性能。

IBM的NorthPole芯片是另一个竞争者,它将近存计算与专用神经网络架构相结合。它在图像分类基准测试(ResNet-50,能耗仅为GPU的十分之一)上实现了令人印象深刻的能效,但并非为Flourish所瞄准的动态、序列型任务而设计。

| 公司 | 架构 | 关键指标 | 目标应用 | 成熟度 |
|---|---|---|---|---|
| Flourish | SNN + IMC(模拟) | 200倍能耗节省(声称) | 通用AI(LLM、视频) | 实验室原型 |
| 英特尔 Loihi 2 | 数字SNN | 100倍能耗节省(推理) | 感知处理、机器人 | 商用(有限) |
| IBM NorthPole | 近存数字 | 10倍能耗节省(推理) | 图像分类、边缘AI | 研究原型 |
| Groq | 张量流处理器 | 10倍延迟降低 | LLM推理 | 商用 |

数据要点: Flourish是唯一一家尝试将模拟IMC用于通用AI的玩家,这提供了最高的潜在回报,但也伴随着最高的风险。英特尔和IBM采取了更为保守的路径,专注于更易制造但能效提升较小的数字实现。

该领域的一位关键人物是Carver Mead,这位加州理工学院教授在20世纪80年代创造了“神经形态工程”一词。他在模拟VLSI电路模拟神经系统方面的研究为Flourish的方法奠定了基础。然而,Mead本人曾警告说,模拟电路天生存在噪声,要达到大规模计算所需的精度是一项极其艰巨的挑战。

时间归档

June 20262146 篇已发布文章

延伸阅读

3200亿豪赌:安徽大佬如何改写中国AI算力版图一位安徽实业家押注3200亿元,打造超大规模AI算力集群。这不仅是资本赌局,更是一份算力军备竞赛的宣战书——试图将内陆省份推上AI基础设施的新前线。寒武纪生死局:中国AI芯片血海中的孤勇者曾被视作中国版英伟达的寒武纪,如今正为生存而战。本土AI芯片初创公司与科技巨头蜂拥入局,市场拥挤不堪。本文深入剖析其独特架构与全栈战略,在即将到来的行业洗牌中能否突围。The Square Chip vs. Round Wafer Paradox: Reshaping AI Hardware for the Next Five YearsAs AI chips grow larger and more square, the traditional round wafer's edge waste and yield bottlenecks become critical.芯片下沉:边缘AI硬件如何重写智能规则一场深刻的变革正在发生:AI芯片正从庞大的云端数据中心,迁移到小巧、低功耗的边缘设备。这股“芯片下沉”浪潮,正将智能眼镜、耳机和家用传感器变为自主智能中枢,永久改变我们构建、购买和交互AI的方式。

常见问题

这次公司发布“Flourish Bets Brain Algorithms Can Break AI's Energy Curse”主要讲了什么?

Flourish, a stealthy startup with roots in neuroscience and semiconductor engineering, has unveiled a radical strategy to break the energy stranglehold on AI. The company's core th…

从“Flourish brain algorithm energy efficiency comparison with Transformer”看,这家公司的这次发布为什么值得关注?

Flourish's technical approach is a radical departure from the Transformer architecture that dominates modern AI. The core of their algorithm is a spiking neural network (SNN) , which models neurons as discrete event gene…

围绕“Flourish in-memory computing chip specifications”,这次发布可能带来哪些后续影响?

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。