当前位置: 材料牛 » 科技 » Nature Machine Intelligence | 帝国理工Walsh课题组:基础机器学习势函数的”柏拉图式表征”——通向可互通、可比较、可解释的AI材料模型

Nature Machine Intelligence | 帝国理工Walsh课题组:基础机器学习势函数的”柏拉图式表征”——通向可互通、可比较、可解释的AI材料模型

2026年5月7日,英国帝国理工学院的研究人员李珍珠博士、Aron Walsh教授发现架构、训练数据、损失函数都不一样的七个基础机器学习原子间势函数(MLIPs),在合适的”投影坐标系”下可以收敛到了同一个隐空间几何——一个由物理监督所塑造的”柏拉图式”化学世界。这一发现不仅打通了不同模型之间的”语言壁垒”,更为AI材料模型的可比较、可拼接、可诊断提供了一条全新路径。

研究亮点

首次将”柏拉图表征假说”引入材料科学:证明独立训练的基础MLIPs确实在隐空间中收敛到一个统计一致的几何结构。

提出锚点投影框架:通过一组化学多样性锚点上的余弦相似度,将七个架构(涵盖等变/非等变、保守力/非保守力)的嵌入统一到同一坐标系。

打通三大下游能力:跨模型嵌入算术(材料、相变、化学反应)、零样本模型拼接(zero-shot model stitching)、以及无需基准真值的结构异常检测。

揭示几何的物理本源:相同数据训练的生成式扩散模型(Chemeleon)无法重现这一柏拉图几何,说明能量/力的物理监督才是几何收敛的关键。

提供模型诊断新工具:在统一空间中实现可视化微调的”灾难性遗忘”、检测非等变架构的对称性破缺、并以”流形距离”作为生成结构典型性的零样本度量。

研究背景

模型越来越多,但它们说的是同一种”语言”吗?

近几年,基础机器学习原子间势函数(foundation MLIPs)已成为加速原子尺度模拟的核心工具。从早期基于晶体图的M3GNet,到引入高阶原子团簇展开、消息传递、E(3)等变性的MACE、NequIP、SevenNet,再到最近探索非保守力直接预测的Orb-v3。MLIPs的家族迅速壮大。

然而,每个模型都把化学环境编码进了”自己的”隐空间:维度不同(如MACE是128维而Orb-v3是256维)、坐标系任意、归一化也不同。即使是共享同一训练集(MPtrj)的MACE-MP-0三个变体,PCA投影后也呈现出截然不同的结构(图1)。这意味着,目前主流的Matbench Discovery等基准只能通过预测精度来评估模型,不同模型之间的”内部世界”无法直接比较,也无法相互复用。

与此同时,自然语言处理领域提出了一个引人深思的假说:”柏拉图表征假说”(Platonic Representation Hypothesis)——足够强大的神经网络,无论训练目标和模态如何,最终都会在表征空间中收敛到对现实世界共享的统计建模。那么,这个现象是否也存在于学习量子力学的MLIPs中?这正是本文要回答的核心问题。

核心思想:让七个模型说同一种”几何语言”

研究者选取了七个代表性基础MLIPs:MACE-MP-0系列三个尺寸(large/medium/small)、两个OMat24训练的等变模型(Mace-omat、Seven-omat),以及两个Orb-v3变体(保守力con-omat与非保守力dir-omat)。从MP-20数据集的27,136个结构中提取了282,847个原子嵌入作为研究对象。

锚点投影:一种通用的”翻译器”文章提出了一个简洁而通用的统一框架。对任意模型给出的嵌入向量 eᵢ,选择一组锚点向量 {a₁, a₂, …, aK},将其投影为:

zᵢ = T(eᵢ) = [cos(eᵢ, a₁), cos(eᵢ, a₂), …, cos(eᵢ, aK)]ᵀ 每一维都对应于该原子环境与某个锚点的余弦相似度。这一构造满足四个核心性质:模型无关性(无需访问架构细节)、几何忠实性(保留近邻关系)、充分多样性(覆盖化学空间)和鲁棒性(对随机种子和锚点排列稳健)。锚点采用 DIRECT 分层采样从嵌入流形中选出,确保化学覆盖度。

主要结果

1. 七个独立模型收敛到一个共享的化学几何

随着锚点数 K 从 3 增加到 400,所有模型的统一表征逐步稳定(K≈100 时收敛)。在该统一空间中,过渡金属、卤素、硫族、磷族等元素分别形成清晰且一致的簇——尽管七个模型来自不同架构、不同数据集、不同训练目标。

作为关键对照,研究者用一个随机权重未训练的”哑模型”(dummy model)做相同投影:结果完全没有任何化学结构。这证明:柏拉图几何不是数学投影的人工产物,而是模型从数据中学到的物理规律的体现。

2. 三个互补指标定量刻画”互通性”

研究者用三个不同尺度的几何指标量化对齐质量:

Procrustes 分数:全局拓扑相似度;

mKNN 分数:局部近邻一致性;

最优传输(OT)代价:分布层面的差异。

结果显示:全局上模型高度一致(MACE 家族 Procrustes>0.86),但局部细节仍有显著分歧(mKNN<0.38)。非等变 Orb 模型与等变模型的 mKNN 几乎为零,揭示了对称性约束本质上塑造了不同的局部编码方式。综合三个指标得到的”SuperScore”将七个模型自然分成三个连贯的簇。

3. 物理监督,而非数据,才是几何的来源

研究者将一个用相同晶体结构数据训练、但没有能量/力监督的扩散生成模型(Chemeleon)投影到同一柏拉图空间。结果:化学元素簇完全混乱,周期律不再显现。

更妙的实验来自 SnSe 的双势阱振动模式:两个对称等价的势阱在物理上应该映射到同一个点。结果:等变 MACE 模型:完美对称重合;非等变 Orb 模型:嵌入轨迹平滑但分裂为两条对称等价但几何上不同的曲线(学到了能量面的连续性,但没学到对称性);生成模型:完全无序的轨迹(连能量面拓扑都没有)。

由此提出一个仅凭表征几何即可判别的”诊断层级”:模型究竟学到了能量面、还是对称性、还是什么都没学到。

4. 跨模型嵌入算术与零样本模型拼接

在统一空间中,材料级嵌入定义为其原子嵌入的质心。研究者展示了三个案例:

  1. 复杂氧化物 Na₃MnCoNiO₆:跨模型相似度 c-sim 稳定在 0.79–0.87;
  2. TiO₂ 多型相对:全局材料一致性高但局部畸变难以分辨,揭示了当前 pooling 策略的分辨极限;
  3. BaTiO₃ 合成反应:z_React = ∑z_产物 − ∑z_反应物 在多数模型间 c-sim>0.7。

更激动人心的是零样本模型拼接(zero-shot model stitching):用 MACE-large 的反应物嵌入与其他模型的产物嵌入”拼接”得到的反应向量,几何上依然合理(MACE 家族>0.88)。这意味着在不同数据集上独立训练的模型,可以在统一空间中代数式地重组复用,为预训练势函数的模块化复用打开了新通路。

5. 柏拉图空间作为通用诊断框架

文章展示了三类诊断应用:

(a) 训练动力学可视化:对 MACE-small 进行 Cu-Cu 二聚体微调时,朴素微调会导致未见过的 Au-Au 嵌入崩溃(灾难性遗忘);而多头微调能保留 Au 知识。柏拉图空间将训练轨迹”可视化”,让灾难性遗忘和稳定适应一目了然。

(b) 架构局限性诊断:通过两近邻分析定义”等变率”。MACE 等变模型在四个空间群中保持稳定的等变率;而非等变 Orb 模型则完全无法识别对称等价位——旋转 BaCeO₃ 晶体后嵌入直接发散,这一对称性破缺直接导致定性错误的声子色散。

(c) 无需真值的结构典型性度量:基于流形假说,原子配置应集中在低维流形附近。研究者将 OMat 的非平衡结构(rattled、300K、1000K)以及生成模型(GNoME、MatterGen、Chemeleon)的产物投影到柏拉图空间:0K 结构主要落在密集内部,1000K 结构则向稀疏区甚至流形外部迁移。这提供了一个完全不需要标签的”结构典型性”度量,可作为大规模生成式材料筛选的高效预筛工具。

研究意义与展望

本文为 AI 材料科学带来了三个层面的启示:

理论层面:基础 MLIPs 确实满足柏拉图表征假说——尽管架构、训练集、归纳偏置完全不同,它们在物理监督下趋向于一个由量子力学决定的共享几何。这把”表征收敛是统计现象还是物理现象”这一开放问题拉到了实证层面。

方法层面:锚点投影是一个轻量、与架构无关、可即插即用的工具。任何研究者都可以直接对自己的模型嵌入做这种投影,从而获得跨模型对齐、嵌入算术与诊断能力。

应用层面:从模型基准比较,到预训练势函数的复用拼接,再到生成式材料的零样本筛选与异常检测,柏拉图空间为整个 AI 材料工作流提供了一个通用的”几何语义层”。

正如作者在结尾指出的:未来 AI 材料模型的设计,或许应该把”表征兼容性”和”性能指标”放在同等重要的位置——这是迈向真正可互通、可重用、可解释的科学基础模型的关键一步。

文章信息

标题:Platonic representation of foundation machine learning interatomic potentials
作者:Zhenzhu Li, Aron Walsh
单位:Department of Materials, Imperial College London;Imperial-X;Imperial Global Singapore
期刊:Nature Machine Intelligence (2026)
DOI:10.1038/s42256-026-01235-7
链接:https://www.nature.com/articles/s42256-026-01235-7
代码:https://github.com/WMD-group/PlatonicRep
数据:https://doi.org/10.5281/zenodo.17721681

未经允许不得转载:材料牛 » Nature Machine Intelligence | 帝国理工Walsh课题组:基础机器学习势函数的”柏拉图式表征”——通向可互通、可比较、可解释的AI材料模型

相关文章

评论 (0)