【论文精选】CGformer:让AI“看懂”晶体结构的全新材料设计模型
发布机构:新材料大数据中心 发布时间:2025-10-22 10:49:00

在人工智能加速重塑科学研究范式的今天,材料科学正迎来新一轮革命。上海交通大学人工智能与微结构实验室(AIMS-Lab)李金金教授与黄富强教授团队研发出新一代AI材料设计模型 CGformer,首次将Transformer的全局注意力机制引入晶体图网络,实现了从“局部观察”到“全局理解”的跃迁。该研究成果发表于Cell旗下期刊Matter标志着AI驱动的材料发现正步入一个更智能、更高效的新阶段。

一、从“试错”到“智能发现”:材料设计的范式转变

长期以来,新材料研发依赖“实验-验证-再实验”的循环式探索。即便有高通量计算的辅助,面对元素种类庞杂、晶体结构复杂的高熵体系,传统方法仍显力不从心。人工智能的引入为材料科学带来了全新可能。借助机器学习模型对结构与性能关系的建模,科研人员得以在虚拟空间中筛选出最有潜力的候选材料,大幅减少实验成本与周期。然而,主流模型如Crystal Graph Convolutional Neural Network(CGCNN)Atomistic Line Graph Neural Network(ALIGNN)仍存在架构局限:信息传播仅限于原子局部邻域;难以捕获长程原子协同作用;在复杂晶格(尤其高熵体系)中容易失真。这种“近视眼式”的特征提取限制了模型的物理感知深度,也制约了其在高复杂度材料中的预测能力。

      二、高熵材料:无序中的秩序

所谓“高熵材料”,是由多种主元素等比例混合形成的新型晶体体系。其独特的多主元构型带来了更高的原子排列无序度(构型熵),也赋予了更优异的强度、热稳定性与电化学性能。但这种“高度无序”正是模型难以驾驭的部分:晶格中原子分布多样、局部环境差异大;实验数据稀缺、标注成本高;离子迁移路径复杂且非线性。如何让AI真正“理解”晶体结构内部的全局相互作用,成为破解高熵材料研发瓶颈的关键。

三、CGformer:让AI拥有“全局视野”的晶体图网络

为突破传统模型的局部限制,AIMS-Lab团队提出了全新的CGformer框架。其核心创新在于:将Graphormer的Transformer全局注意力机制,与CGCNN的晶体图结构编码相融合。

导入的文件(2).jpeg

图1:CGformer 筛选工作流程

CGformer的关键模块包括

全局注意力机制(Global Attention):允许模型在每一次信息聚合中关注晶体中任意两个原子之间的关系,而非仅限于局部邻域;

中心性编码(Centrality Encoding):捕捉节点在晶体网络中的重要程度,帮助模型识别关键迁移通道;

空间位置编码(Spatial Encoding):保留原子间几何信息,使网络具备三维空间感知能力。

这种融合使CGformer具备“全局感知”能力,能够在复杂晶体中建模长程电荷传导与结构畸变等现象,实现对离子迁移、电导率等关键性质的精准预测。

导入的文件.jpeg

图2:CGformer 的网络架构

       四、高通量筛选:AI 驱动的高熵电解质发现

研究团队以高熵钠离子固态电解质(HE-NSEs)为案例,将CGformer应用于高通量虚拟筛选。结果显示:

预测精度显著提升CGformer相较传统CGCNN模型,平均绝对误差(MAE)降低25%;

导入的文件(4).jpeg

图3:CGformer 与 CGCNN 作用对比

筛选效率显著提高:通过结合无监督聚类算法,AI模型在148,995NASICON-type结构中快速筛选出18种最优候选;

导入的文件(3).jpeg

图4:CGformer 在计算得到的高熵钠 Eb 数据集上的微调结果

实验验证成功:最终合成的6HE-NSEs材料展现出卓越性能,室温钠离子电导率高达0.256mS/cm,激活能低至0.235 eV

导入的文件(1).jpeg

图5:所选 HE-NSEs 的实验验证

这些实验结果验证了CGformer的预测准确性,也标志着AI驱动的“虚拟设计—实验验证”闭环已在材料科学中形成现实可行路径。

五、数据构建:AI能力进化的基石

为支持模型的学习与迁移,研究团队构建了多类别数据集,包括:

      钠离子扩散能垒(Eb)基础数据集:利用Voronoi分解(CAVD)与键价位点能(Bond Valence Site Energy,BVSE方法构建,目前为规模最大的高熵体系扩散能垒数据库;

高熵Na-ion材料数据集:用于模型微调与验证,覆盖不同掺杂体系与晶体对称性;

迁移学习框架:先在基础数据集上预训练,再迁移至高熵体系任务,提高模型的泛化与稳定性。

这套数据策略让CGformer不仅能“学得准”,还能“学得快”,为未来在其他体系(如LiMg、热电材料)上的迁移奠定基础。

六、技术亮点与突破

模型创新:首次在晶体图网络中引入Transformer全局注意力,实现跨原子、跨键长的远程信息交互。

预测性能MAE降低 25%,在高熵钠体系预测中显著领先现有模型。

真实验证:成功合成6种新型HE-NSEs,实验结果与预测高度一致。

扩展潜力:可迁移至锂离子、镁离子导体及热电材料设计领域。

七、从智能计算到实验落地:AI开启材料科学新周期

CGformer的诞生标志着AI材料设计迈向更高层次的“可解释全局建模”阶段。它不仅提升了模型对复杂晶体结构的理解深度,更推动了AI与实验科学的深度融合,让新材料的发现从“经验驱动”变为“智能驱动”。

未来,随着多模态数据(结构、光谱、动力学)的融合与模型可解释性研究的深入,AI将在能源材料、催化剂设计、极端环境装备等方向发挥更核心的作用。

 

论文信息

来源 K. Tao, J. Li, W. He, A. Chen, Y. Han, F. Huang, F. Huang, J. Li. CGformer: Transformer-enhanced crystal graph network with global attention for material property prediction[J]. Matter, 2025, 102380.

论文链接 https://www.cell.com/matter/abstract/S2590-2385(25)00423-0


系统提示
请您先登录
提示

您访问的链接即将离开“新材料大数据中心”网站
是否继续?