背景介绍:
量子点是纳米尺寸的半导体晶体,具有优异的光电效应,在新型显示、生物医学、红外传感、量子光源等领域具有广泛的应用。量子点的合成是其应用的基石。2023年诺贝尔化学奖授予了Moungi G. Bawendi、Louis E. Brus和Alexei I. Ekimov,以表彰他们在发现和合成量子点方面所作出的卓越贡献。经过多年的发展,量子点的合成技术已开始进入规模化生产阶段,然而,前期研发主要依赖于“试错-实验”的方式,如何利用AI工具加速量子点合成技术的开发,已成为备受关注的前沿课题。
最近,北京理工大学的研究团队在“AI+量子点”的交叉研究方面取得重要进展。他们通过建立一个包含多种胶体量子点材料、涵盖了前驱体、配体、溶剂、反应温度和时间等关键合成参数的综合数据库,构建了深度学习模型,实现了对量子点尺寸和形貌的精准预测与分析。近日,该研究结果以《Deep Learning Models for Colloidal Nanocrystal Synthesis》为题发表在ACS Nano期刊上。北京理工大学博士后顾凯、计算机学院博士生梁瑛平为论文的共同第一作者。材料学院钟海政教授与计算机学院付莹教授为共同通讯作者。该研究工作得到了张军院士、北京航空航天大学孙志梅教授、缪奶华教授的指导与支持以及国家自然基金(U23A20683, H.Z.)和北京市自然基金(Z210018, H.Z.)的支持。
正文:
该研究工作主要包含两个核心部分:高通量实验数据的自动解析和合成结果的深度学习预测。
- 数据基础:建立高通量实验数据库与图像自动解析
深度学习模型的训练依赖于大规模、高质量的数据。(1)首先从大量文献和实验中整理、构建了两个关键数据集:3508条涵盖348种量子点的合成配方数据集(图1);与配方对应的1.2万张包含约120万个量子点的透射电镜电镜图像(TEM)数据集。(2)开发了一个高精度的图像分割模型(图2),采用半监督学习策略,能够从少量标注数据中学习,实现了对TEM图像中量子点的自动、快速识别与参数提取,分割准确率达到82.5%。

图1. (a)所有配方中包含的不同类型化学物质数量,按量子点、前驱体、配体和溶剂分类;(b)各类量子点合成配方分布示意图,按元素物质、二元化合物、三元化合物和四元化合物分类;(c)配方数据集中不同量子点的元素频率分布

图2. (a)量子点分割模型的半监督学习策略示意图;(b)TEM图像的分割效果图
- 模型构建:基于Transformer算法的合成结果预测
基于分割模型产生的精确数据,采用了Transformer算法,构建了一个强大的量子点合成预测模型。该模型能够直接关联合成配方(输入:反应物、配体、溶剂、温度、时间等)与最终产物的特征(输出:平均尺寸和形貌)。进一步提出了基于反应中间体的数据增强方法。该方法利用第一性原理计算来模拟化学反应的可能过程,为训练过程补充了关键的前驱体中间态信息,有效的将数据集扩充了十倍(图3)。最终模型在尺寸预测上平均绝对百分比误差仅为17%,形貌预测上平均准确率为89%。

图3. 基于反应中间体的数据扩充和利用图神经网络进行反应物特征化的过程
模型洞察与泛化能力
除了精准预测,该模型还为理解量子点的生长机制提供了新的视角。通过分析模型的注意力权重,研究人员对所有编码物质的最大注意力权重进行了排序(图4a)。通过对这些编码物质按功能分类,研究人员得以探究不同物质对最终产物尺寸的影响程度,结果显示重要性排序为:量子点种类 > 前驱体/配体 > 溶剂,表明尺寸性质受产物量子点的内禀性质影响最大(图4b),而溶剂的影响最小。
更重要的是,该模型展现了强大的泛化能力。在面对训练集中从未出现过的全新材料体系时,模型依然能够给出可靠的预测。为“AI指导新材料发现”提供了可能。

图4. (a)编码物质的最大注意力权重在不同transformer层的分布,图中每条竖线的横坐标对应一个物质名称,横坐标对应transformer的第几层;(b)不同功能类别物质的数量分布图
论文信息:
标题: Deep Learning Models for Colloidal Nanocrystal Synthesis
作者: Kai Gu#, Yingping Liang#, Jiaming Su, Peihan Sun, Jia Peng, Naihua Miao, Zhimei Sun, Ying Fu*, Haizheng Zhong*, Jun Zhang
引用:ACS Nano 2025, 19, 45, 39025–39034
DOI:10.1021/acsnano.5c09134
arXiv:https://arxiv.org/abs/2412.10838
分割模型/数据集:https://github.com/Sharpiless/Nanocrystals-TEM-segmentation
分割软件:https://github.com/Sharpiless/Nanocrystals-TEM-segmentation/blob/main/docs/software.md
合成模型/数据集:https://github.com/Sharpiless/Nanocrystals-Deep-Learning





