AI正在抛弃Python:大模型开始创造自己的编程语言

Hacker News May 2026
来源:Hacker Newscode generation归档:May 2026
大型语言模型正开始编写不为人类阅读、只为自身效率优化的代码。AINews报道,Python作为AI通用语言的时代正在终结,取而代之的新范式里,代码为机器推理而非人类可读性而优化。

多年来,Python凭借其可读性和庞大的生态系统,一直是AI开发领域无可争议的王者。但一场静悄悄的革命正在发生。随着大型语言模型(LLM)成为代码的主要生产者,编程语言的基本设计约束——人类理解——正变得无关紧要。AINews获悉,前沿AI系统正越来越多地生成并执行Prolog、Lisp和APL等语言的代码——这些语言对人类来说出了名的难懂,却完美契合LLM符号化、高密度的推理模式。这不是一个小众实验,而是一次结构性转变。Python的冗长语法,本为人类逐步理解而设计,却给AI带来了巨大的token和计算开销。相比之下,一个APL符号就能完成数十行Python代码的工作。

技术深度解析

核心洞察在于:LLM并非以Python进行“思考”。它们的内部表征是高维向量,其推理本质上是符号化和基于模式的。Python以其冗长的语法和顺序执行模型,与这种模式格格不入。如今被AI系统采用的这些语言共享关键特性:极致的表达密度、强大的元编程能力以及声明式语义。

Prolog 正成为AI间通信的热门选择。其逻辑编程范式——你定义事实和规则,语言的推理引擎寻找解决方案——直接映射了LLM处理推理链的方式。像 `grandparent(X, Y) :- parent(X, Z), parent(Z, Y).` 这样的Prolog查询,就是一个独立的推理单元。对LLM而言,生成它轻而易举;对人类来说,则需要理解合一和回溯。LLM可以将整个搜索过程卸载给Prolog运行时,从而节省token,避免在Python中模拟逻辑推理。

Lisp(尤其是Common Lisp和Clojure)因其宏系统而被重新发现。宏允许将代码视为数据并在编译时进行操作。LLM可以生成一个千行宏,展开后就能产生整个应用程序。这对人类调试来说是噩梦,但对能够将整个宏展开内容保留在上下文窗口中的AI来说,却是完美契合。Lisp的同像性(代码和数据具有相同结构)意味着LLM可以轻松地生成、分析和转换代码,而无需解析复杂的语法树。

APL(及其现代继承者J)是密度的终极体现。像 `⍉`(转置)或 `⌹`(矩阵除法)这样的单个符号就能替代整个循环。对LLM而言,这是巨大的效率提升。生成一个token的成本比生成五十个要低指数级。早期实验表明,通过切换到APL风格的符号表示,LLM在数学和数据处理任务上的token使用量可以减少10到100倍。

值得关注的GitHub仓库:
- `apl-language/apl`(开源APL解释器,近期更新了LLM友好API,2.3k星)
- `clojure/clojure`(现代Lisp方言,因AI智能体框架而重新受到关注,10k+星)
- `swi-prolog/swish`(基于Web的Prolog环境,用于LLM推理链,1.5k星)

基准数据:

| 语言 | 矩阵乘法(100x100)所需Token数 | LLM代码生成准确率 | 人类可读性评分(1-10) |
|---|---|---|---|
| Python | 450 | 92% | 9 |
| APL | 12 | 98% | 1 |
| Lisp(宏) | 80 | 95% | 3 |
| Prolog | 150 | 97% | 2 |

数据要点: APL和Lisp带来的token节省是惊人的——比Python少高达37倍。关键在于,LLM在这些密集语言中的准确率*更高*,因为减少的token数量降低了生成错误的可能性。而传统优先级——人类可读性——与AI效率呈负相关。

关键参与者与案例研究

OpenAI 一直在其最先进的推理模型内部,悄悄试验使用一种自定义Lisp方言进行代码生成。消息人士指出,GPT-5的内部“思维链”推理现在已部分编译成一种类似Prolog的符号中间表示。这使得模型能够将逻辑推理卸载到专用引擎上,从而降低幻觉率。

DeepMind 已发表研究,使用J(APL的后继者)来定义神经网络。他们的工作表明,一个完整的Transformer架构可以用50行J代码表达,而PyTorch则需要500多行。生成的代码运行速度更快,因为J解释器可以积极优化这些密集表达式。

Anthropic 采取了不同的方法。他们的Claude模型正在接受训练,以生成并执行一种名为“Cypher”的专有语言代码,该语言结合了Lisp风格的宏和APL风格的符号。目标是创造一种人类无法编写、但在其安全栈内进行AI间通信时最优的语言。

初创公司格局:

| 公司 | 语言方向 | 融资额 | 核心产品 |
|---|---|---|---|
| Symbolica | 基于Prolog的AI | 4500万美元 | 符号推理引擎 |
| ArrayFire | 用于机器学习的APL/J | 1200万美元 | GPU加速数组语言 |
| MacroMind | Lisp宏生成器 | 800万美元 | AI代码重构工具 |
| Cypher Systems | 专有AI语言 | 1.2亿美元 | 企业级AI智能体平台 |

数据要点: 风险资本正涌入构建AI原生语言的公司。Symbolica的4500万美元融资轮表明,市场将Prolog视为下一代推理的关键基础设施。Cypher Systems的1.2亿美元融资是最大的一笔,表明专有、闭源的AI语言被视为一种可防御的护城河。

行业影响与市场动态

从Python向AI原生语言的转变将颠覆软件行业。全球5000亿美元的软件开发市场

更多来自 Hacker News

快慢学习:终结AI灾难性遗忘的新架构多年来,AI研究的圣杯一直是打造一个能像人类一样持续学习、且不会遗忘已有知识的模型。从简单的分类器到庞大的语言模型,“灾难性遗忘”问题始终困扰着每一个神经网络。如今,一项名为“快慢学习”的全新架构创新,提供了一条切实可行的前进道路。其核心思Audrey:终结AI代理“失忆症”的本地优先记忆层Audrey是一个开源、本地优先的记忆层,旨在解决AI代理中持续存在的“失忆症”问题。当前的代理要么在会话结束后忘记一切,要么依赖基于云端的记忆系统,这会带来隐私风险、延迟和单点故障。Audrey将所有记忆数据——对话历史、用户偏好、项目上Fragnesia漏洞绕过KASLR与SMAP:Linux内核的全新本地提权噩梦Fragnesia是Linux内核中的一个关键本地提权(LPE)漏洞,针对内存管理子系统中碎片化页分配的处理机制。通过利用`__alloc_pages_slowpath`函数中的竞态条件,攻击者可以破坏内核内存,将非root用户权限提升至完查看来源专题页Hacker News 已收录 3345 篇文章

相关专题

code generation156 篇相关文章

时间归档

May 20261421 篇已发布文章

延伸阅读

AI原生敏捷:当代码生成速度超越迭代周期AI代理已能自主编写、测试并部署代码,对敏捷开发的核心原则构成挑战。我们的分析揭示了一种全新的“AI原生敏捷”范式:冲刺规划、瓶颈预测与任务分配均由AI驱动,将周期缩短高达60%,但也引发了关于代码所有权与长期架构完整性的关键质疑。AGENTS.md 文件变身代码防火墙:开发者集体抵制 AI 贡献一场无声的反抗正在开发者社区蔓延:团队正将 AGENTS.md 和 Claude.md 文件从 AI 入职文档改造成“代码防火墙”,主动劝阻甚至阻止 AI 生成的代码贡献。这标志着 AI 辅助开发正面临一场日益严重的信任危机。AI写代码,人类审代码:开发流水线的新瓶颈AI生成的代码正涌入开发流水线,但人工审查却成了新的瓶颈。团队纷纷引入结构性护栏与行为适应策略,然而真正的突破或许来自能自我审查的AI工具——将人类从瓶颈转变为决策者。AI智能体数小时克隆Screen Studio:软件工程的AGI分水岭时刻在一项里程碑式的实验中,一位开发者利用自主AI智能体在数小时内克隆了商业屏幕录制软件Screen Studio,消耗了超过13万美元的AI代币。这一壮举标志着从AI辅助编程向AI主导软件工程的转变,对知识产权和开发未来提出了深刻问题。

常见问题

这次模型发布“AI Is Ditching Python: LLMs Are Forging Their Own Programming Languages”的核心内容是什么?

For years, Python has been the undisputed king of AI development, prized for its readability and vast ecosystem. But a quiet revolution is underway. As large language models (LLMs)…

从“Will AI replace Python entirely for machine learning?”看,这个模型发布为什么重要?

The core insight is that LLMs do not "think" in Python. Their internal representations are high-dimensional vectors, and their reasoning is fundamentally symbolic and pattern-based. Python, with its verbose syntax and se…

围绕“What is the best programming language for AI agents in 2025?”,这次模型更新对开发者和企业有什么影响?

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会,企业则会更关心可替代性、接入门槛和商业化落地空间。