MT-LNN:液态神经网络承诺O(1)内存,无限上下文AI的新希望

GitHub June 2026
⭐ 2
来源:GitHub归档:June 2026
一款名为MT-LNN的全新开源原型提出了一种液态神经网络架构,其循环状态内存恒定,生成缓存复杂度为O(1),直接挑战Transformer在长上下文推理中的统治地位。由everest-an团队开发的这一早期基线模型,旨在大幅降低序列建模的内存开销,其进阶版本M1(AwareLiquid)已在积极研发中。

everest-an团队发布了MT-LNN,这是一个受大脑启发的液态神经网络的最小原型,直击现代AI最顽固的瓶颈之一:长序列生成过程中的内存扩展问题。与Transformer不同——其注意力机制对序列长度n需要O(n)或O(n²)的内存——MT-LNN维持一个固定大小的循环状态,从而实现O(1)的生成缓存。这一突破得益于一个受生物神经元启发的连续时间动力系统,其中隐藏状态通过一个学习到的常微分方程(ODE)演化。当前GitHub仓库(github.com/everest-an/o1)作为研究者的基线模型,而后续版本M1(AwareLiquid)承诺进一步优化。其意义不仅在于内存效率,更在于为AI架构的多元化探索开辟了一条全新路径。

技术深度解析

MT-LNN建立在液态时间常数网络(LTC)的原理之上,该网络最初由MIT CSAIL的研究人员提出。其核心创新是一个连续时间循环神经网络(RNN),其中隐藏状态的动态由神经ODE控制:

```
dh/dt = f(h, x, θ)
```

其中h是隐藏状态,x是输入,θ是学习参数。与使用离散时间步长的标准RNN(如LSTM、GRU)不同,LTC允许网络根据输入复杂度自适应调整时间分辨率——这种特性被称为“液态”,因为状态像流体一样平滑演化。这使得模型能够处理不规则采样的时间序列,并保持恒定的内存占用,无论序列长度如何。

架构细节:
- 循环状态: 一个固定大小的向量(例如512或1024维),通过ODE求解器(如欧拉法或龙格-库塔法)在每个时间步更新。
- O(1)生成缓存: 在自回归生成过程中,只需存储当前隐藏状态,无需像Transformer那样存储整个键值缓存。这是循环状态马尔可夫性质的直接结果。
- 训练: 在前向传播过程中求解ODE,梯度通过伴随方法(或通过求解器反向传播)计算。这比标准RNN计算成本更高,但允许更具表现力的动态。

与其他高效架构的对比:

| 模型 | 内存复杂度(生成) | 上下文长度 | 训练效率 | 关键限制 |
|---|---|---|---|---|
| Transformer (GPT-4) | O(n) KV缓存 | 最高128K tokens | 中等(O(n²)注意力) | 长上下文时内存呈二次增长 |
| Mamba (SSM) | O(1)状态 | 无限(理论上) | 高(并行扫描) | 对某些任务表现力不足 |
| RWKV | O(1)状态 | 无限 | 高(线性注意力) | 复杂推理能力较弱 |
| MT-LNN (LTC) | O(1)状态 | 无限(理论上) | 低(每步需ODE求解) | 训练慢,未在大规模上验证 |

数据要点: MT-LNN提供了与Mamba和RWKV相同的理论内存优势,但机制截然不同——连续动态 vs. 离散状态空间模型。代价是训练速度:ODE求解器本质上是顺序的,比Mamba中可并行化的扫描更慢。

开源背景: github.com/everest-an/o1仓库目前是一个极简基线,仅有约2颗星且无活跃分支。后续版本M1(AwareLiquid)正在开发中,但尚未发布任何代码或论文。这是一个研究阶段的项目,而非生产就绪的库。

关键参与者与案例研究

液态神经网络领域虽小但正在成长。Hasani等人(2021)的原始LTC论文在时间序列预测任务(如交通预测、自动驾驶)上展示了卓越性能。此后,出现了几个衍生项目:

- MIT CSAIL(Hasani、Lechner等): 学术起源者。他们在NCP(神经电路策略)上的工作表明,LTC仅需几千个参数即可用于无人机导航。
- Liquid AI: 由原始LTC作者创立的初创公司,专注于将液态网络商业化用于边缘AI和机器人技术。他们已筹集3750万美元种子资金(2023年),并正在开发专有的软硬件协同设计。
- everest-an: GitHub上的匿名/小团队开发者。他们的MT-LNN是对LTC原理的干净重实现,但聚焦于语言建模——这与典型的时间序列用例不同。

液态网络实现对比:

| 项目 | 开发者 | 专注领域 | 成熟度 | GitHub星数 |
|---|---|---|---|---|
| LTC(原始) | Hasani等人 | 时间序列、机器人技术 | 研究论文 | N/A(代码在GitHub上) |
| Liquid AI | Liquid AI Inc. | 边缘AI、硬件 | 初创公司(闭源) | N/A |
| MT-LNN | everest-an | 语言建模 | 早期原型 | 2 |
| M1 (AwareLiquid) | everest-an | 语言建模 | 开发中 | N/A |

数据要点: 液态网络生态系统较为分散。最有前景的商业实体是Liquid AI,但其重点在机器人技术和边缘推理,而非大型语言模型。everest-an的MT-LNN是一个小众实验,可能吸引探索Transformer替代方案的研究者,但它缺乏Mamba(3万+星)或RWKV(1万+星)那样的社区支持和基准测试。

行业影响与市场动态

更广泛的AI推理市场预计将从2024年的180亿美元增长到2030年的2000亿美元以上(来源:AINews基于云端和边缘支出的内部估算)。主导架构——Transformer——面临一个根本性的扩展问题:随着上下文窗口增长(例如Gemini 1.5 Pro的100万tokens),KV缓存变得过大,需要昂贵的高带宽内存(HBM),如HBM3e。

MT-LNN可能解决的市场痛点:
- 边缘AI: 智能手机、物联网设备和自动驾驶

更多来自 GitHub

ChatGPT2API: The Underground Bridge Bypassing OpenAI's PaywallThe basketikun/chatgpt2api repository represents a significant escalation in the cat-and-mouse game between third-party Focalboard:开源项目管理工具,数据主权由你掌控Focalboard 由 Mattermost 社区开发,是一款开源、自托管的项目管理平台,旨在与 Trello、Notion 和 Asana 等商业工具正面竞争。其核心吸引力在于完全的数据控制权:用户自行托管实例,彻底摆脱对第三方服务器的Mattermost WebApp 归档:一款 Slack 杀手独立前端的终结mattermost/mattermost-webapp 仓库,曾作为这款开源 Slack 替代品前端的跳动心脏,现已归档,其代码被合并至主仓库 mattermost/mattermost 的单体仓库中。该仓库拥有 2287 颗星,曾作为高查看来源专题页GitHub 已收录 2599 篇文章

时间归档

June 20261209 篇已发布文章

延伸阅读

ChatGPT2API: The Underground Bridge Bypassing OpenAI's PaywallA new open-source project, basketikun/chatgpt2api, has exploded onto GitHub with 4,000 stars in days, offering a fully rFocalboard:开源项目管理工具,数据主权由你掌控Mattermost 旗下的开源项目管理工具 Focalboard,正以自托管替代方案的身份,在 Trello、Notion 和 Asana 的领地中迅速崛起。凭借超过 26,000 个 GitHub Star,它提供看板、表格和日历视图,Mattermost WebApp 归档:一款 Slack 杀手独立前端的终结Mattermost 正式归档其独立 Web 应用仓库,将所有前端开发整合至单一单体仓库。这一举措标志着项目工程策略的关键转变,预示着更紧密的集成与更快的迭代,但也引发了对其模块化架构未来的疑问。Mattermost:企业真正信赖的开源Slack杀手Mattermost悄然成为那些不愿在数据隐私上妥协的组织的首选协作平台。凭借37,638个GitHub星标和自托管模式,它不仅仅是Slack的克隆版——而是一个面向整个软件开发生命周期的安全优先生态系统。

常见问题

GitHub 热点“MT-LNN: Liquid Neural Networks Promise O(1) Memory for Infinite Context AI”主要讲了什么?

The everest-an team has released MT-LNN, a minimal prototype of a brain-inspired liquid neural network that addresses one of the most persistent bottlenecks in modern AI: memory sc…

这个 GitHub 项目在“MT-LNN vs Mamba benchmark comparison”上为什么会引发关注?

MT-LNN is built on the principle of liquid time-constant networks (LTCs), originally proposed by MIT CSAIL researchers. The core innovation is a continuous-time recurrent neural network (RNN) where the hidden state dynam…

从“how to train liquid neural networks for NLP”看,这个 GitHub 项目的热度表现如何?

当前相关 GitHub 项目总星标约为 2,近一日增长约为 0,这说明它在开源社区具有较强讨论度和扩散能力。