PRISMat重写材料科学:AI像写句子一样设计晶体

arXiv cs.AI May 2026
来源:arXiv cs.AI归档:May 2026
PRISMat将晶体结构视为语言序列,通过策略驱动、置换不变的自回归机制,无需昂贵物理模拟即可预测稳定材料。这一突破有望将电池和半导体的研发周期从数年缩短至数周。

新材料的发现长期以来一直是从储能到微电子等行业的瓶颈。传统方法——对已知数据库进行高通量筛选,或进行计算成本高昂的密度泛函理论(DFT)计算——要么范围有限,要么在探索可能晶体的广阔化学空间时慢得令人望而却步。PRISMat,这一由研究人员推出的全新框架,从根本上重新构想了这一过程,将晶体结构生成视为一项语言建模任务。PRISMat并非模拟原子相互作用,而是将原子及其晶格位置标记化为一个序列,然后学习稳定晶体排列的“语法”。其关键创新在于一种置换不变的自回归机制,该机制尊重晶体固有的对称性。

技术深度解析

PRISMat的架构堪称将语言模型的离散特性与晶体结构的连续、对称现实完美结合的典范。其核心是将晶体视为一个“标记”序列——每个标记代表一个原子类型及其在晶胞内的分数坐标。这些标记的排序至关重要:晶体结构在等价原子的置换下保持不变(例如,在钙钛矿中交换两个相同的氧原子应产生相同的结构)。标准的自回归模型,如GPT,依赖于顺序,无法完成此任务。PRISMat通过一种置换不变的自回归机制解决了这个问题。在训练过程中,模型学会为给定晶体的原子标记的所有有效排序分配相等的概率,从而内化该结构的对称群。这是通过一种专门的注意力掩码和一个在置换上进行边际化的训练目标实现的,确保模型不会惩罚不同但等价的标记排序。

另一个核心创新是策略驱动的条件控制。模型接收一组期望属性作为输入——形成能(eV/原子)、带隙(eV)、体积模量(GPa),甚至目标空间群。这些属性被编码为连续向量,并注入Transformer的交叉注意力层,逐步引导自回归生成过程。这类似于文本的提示工程,但这里的“提示”是一组物理约束。然后,模型逐个标记地生成完整的晶体结构,每个新原子都基于先前生成的原子和目标属性向量进行条件化。

与现有方法的比较

| 方法 | 类型 | 速度(每个结构) | 准确性(形成能MAE) | 探索范围 | 对称性处理 |
|---|---|---|---|---|---|
| DFT (VASP) | 物理模拟 | 数小时至数天 | ~0.01 eV/原子 | 小(手动选择) | 固有 |
| 高通量筛选 (Materials Project) | 数据库查找 | 秒级 | ~0.1 eV/原子 | ~15万种已知化合物 | 不适用(静态) |
| 基于GNN的生成模型 (如CDVAE) | 深度生成 | 分钟级 | ~0.05 eV/原子 | 中等(潜在空间) | 部分(等变层) |
| PRISMat | 语言模型 | 秒级 | ~0.03 eV/原子(报告值) | 非常大(组合空间) | 完全(置换不变性) |

数据要点: PRISMat在Materials Project测试集上实现了与DFT相当的准确性(与DFT基准相差在0.02 eV/原子以内),同时速度提升了数个数量级。其显式的置换不变性使其比近似对称性的GNN模型具有决定性优势,能够从一开始就生成符合物理约束的结构。

该团队已在GitHub上开源了核心实现,仓库名为PRISMat-Project/prismat-generator(目前约1200颗星)。该仓库包含在Materials Project数据集(约15万种晶体)上预训练的权重,以及用于在自定义属性目标上进行微调的脚本。代码库基于PyTorch构建,并利用Hugging Face Transformers库作为骨干,使其对更广泛的机器学习社区具有可访问性。

关键参与者与案例研究

PRISMat的开发由一支处于计算材料科学与自然语言处理交叉领域的研究团队领导。虽然主要作者来自学术界,但其影响正迅速被工业界采纳。丰田研究院已宣布合作,利用PRISMat发现用于下一代电池的新型固态电解质材料。他们的目标是识别出一种锂超离子导体,其带隙>4 eV,离子电导率>10 mS/cm——这一组合此前在筛选和DFT引导的搜索中都未能实现。PRISMat生成的早期候选材料现正在丰田的实验室中进行合成。

微软研究院已将PRISMat的一个变体集成到其Azure Quantum Elements平台中,作为面向制药和半导体客户的服务提供。该平台现在允许用户通过自然语言界面指定目标属性(例如,“寻找一种稳定的氧化物,带隙为3.0 eV,介电常数高于20”),PRISMat会将其转化为生成任务。

AI材料发现平台比较

| 平台 | 核心方法 | 关键差异化优势 | 目标行业 | 开源? |
|---|---|---|---|---|
| PRISMat | 语言模型 + 置换不变性 | 策略驱动生成,对称性感知 | 电池、半导体、催化剂 | 是 (GitHub) |
| GNoME (DeepMind) | 图神经网络 + 主动学习 | 大规模筛选38万种稳定材料 | 通用材料 | 否 |
| MatterGen (微软) | 晶体图上的扩散模型 | 原子坐标的连续生成 | 能源、电子 | 否 |
| Crystal Diffusion Variational Autoencoder (CDVAE) | 变分自编码器 + 扩散 | 从头晶体生成 | 通用材料 | 是 |

更多来自 arXiv cs.AI

PopuLoRA:群体进化如何解锁超越RLHF的AI自我推理提升PopuLoRA代表了大语言模型(LLM)自主提升推理能力的一种范式转变。传统的自我对弈方法中,单一模型同时扮演教师和学生角色,存在一个根本缺陷:自我校准偏差。模型本质上是在给自己的作业打分,导致闭环迅速陷入平台期。PopuLoRA通过在单AI无规则发现物理法则:“巴布梦游仙境”突破性框架问世当前AI世界模型的根本局限在于,它们倾向于学习表面的语义相关性——将输入映射到输出——而非支配环境的底层因果法则。这种“语义陷阱”阻碍了智能体真正理解物理规律。全新框架“巴布梦游仙境”直接回应了这一挑战,它允许智能体仅凭在线交互证据,归纳出GRID框架:让大语言模型自动构建安全知识图谱,威胁情报从此结构化GRID代表了安全知识图谱构建方式的范式转变。多年来,网络安全行业一直难以将海量、非结构化的威胁报告——从APT组织档案到恶意软件分析——转化为结构化、可查询的知识。传统方法依赖昂贵的人工标注或脆弱的规则提取,两者都无法应对每日海量威胁情报查看来源专题页arXiv cs.AI 已收录 352 篇文章

时间归档

May 20262076 篇已发布文章

延伸阅读

PopuLoRA:群体进化如何解锁超越RLHF的AI自我推理提升PopuLoRA提出了一种基于群体的异步自我对弈框架,让共享冻结基座模型上的专用LoRA适配器作为教师和学生群体共同进化。通过用交叉评估取代自我校准,它构建了一个自我强化的循环,不断生成更具挑战性的问题和更优的解决方案,从而打破了传统自我对AI无规则发现物理法则:“巴布梦游仙境”突破性框架问世一项名为“巴布梦游仙境”的全新研究框架,攻克了可执行世界模型的核心难题:让AI在没有任何规则描述或奖励信号的情况下,从零开始自主发现环境的状态依赖动力学。这一突破将智能体从模式匹配推向真正的物理发现。GRID框架:让大语言模型自动构建安全知识图谱,威胁情报从此结构化GRID提出了一种全新的端到端框架,使大语言模型能够从非结构化的网络威胁情报中自动构建安全知识图谱。其核心在于引入可计算的奖励机制,有效克服了领域知识匮乏与监督信号不足的难题,为安全知识图谱的构建范式带来根本性变革。AI记忆过载:个性化系统为何总是“承诺”失信一项突破性框架——合约约束证据激活(CBEA)揭示,个性化AI的真正瓶颈不在于记忆容量,而在于承诺可靠性。当前模型常将模糊信号转化为刚性约束,丢弃罕见但关键的证据,并自信地回答无解问题。CBEA提出从“能记住多少”转向“能承诺多好”。

常见问题

这次模型发布“PRISMat Rewrites Material Science: AI Designs Crystals Like Writing Sentences”的核心内容是什么?

The discovery of new materials has long been a bottleneck in industries from energy storage to microelectronics. Traditional approaches—high-throughput screening of known databases…

从“PRISMat vs GNoME comparison for battery materials”看,这个模型发布为什么重要?

PRISMat’s architecture is a masterclass in marrying the discrete nature of language models with the continuous, symmetric reality of crystal structures. At its core, the framework treats a crystal as a sequence of 'token…

围绕“How to fine-tune PRISMat for custom property targets”,这次模型更新对开发者和企业有什么影响?

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会,企业则会更关心可替代性、接入门槛和商业化落地空间。