← 返回列表

基于扩散模型的晶体结构生成方法及装置

申请号: CN202311737478.8
申请人: 烟台国工智能科技有限公司
更新日期: 2026-03-09

专利详细信息

项目 内容
专利名称 基于扩散模型的晶体结构生成方法及装置
专利类型 发明授权
申请号 CN202311737478.8
申请日 2023/12/18
公告号 CN117423396B
公开日 2024/3/8
IPC主分类号 G16C10/00
权利人 烟台国工智能科技有限公司
发明人 鲍雨; 张翔宇; 姜会秀; 李中伟
地址 山东省烟台市开发区珠江路66号正海大厦27层2701号

摘要文本

基于扩散模型的晶体结构生成方法及装置,利用原子间的相对距离不仅可以全面表征晶体的E(3)等变性,对数据集不做任何更改;引入线性插值提高晶体生成的多样性和新颖性,使用线性组合的方式将两种晶体结构按照比重分别添加高斯噪声融合后得到混合高斯噪音然后逐步去除噪音,可以将两种晶体结构平滑可控的融合,理论上可以生成数以万计种新型晶体结构,极大节省人工合成材料成本且省去合成方式构思;通过键预测器作为引导提高原子坐标生成精度,基于键对原子坐标的强依赖,轻微的原子扰动便会影响键的类型和是否成键,因此使用交叉熵损失函数且其梯度作为优化方向从而对原子坐标生成起到修正作用;综合提升扩散模型在无机晶体结构生成的表现。

专利主权项内容

1.基于扩散模型的晶体结构生成方法,其特征在于,包括:获取开源晶体结构数据集作为晶体结构生成数据集,所述晶体结构生成数据集由表示每种晶体结构的晶胞参数及原子三维坐标的CIF类型文件构成;使用化学信息文件类型转化包将所述CIF类型文件批次转化为训练所需的SDF类型文件,所述SDF类型文件包括晶胞原子个数、原子成键邻接矩阵及每个原子的三维坐标;将格式转换后的所述晶体结构生成数据集划分为训练集、验证集和测试集;构建晶体结构生成扩散模型,所述晶体结构生成扩散模型具有前向加噪过程和逆向去噪过程,前向加噪过程使用预定义的超参数表示条件概率分布均值和方差,逆向去噪过程通过预测前向加噪过程所添加的噪音对数据进行还原;通过图神经网络构建键预测器,键预测器的输入值为所述晶体结构生成数据集中原子坐标和原子类型,键预测器的输出值为键类型;键预测器的输出值键类型判断为二分类任务,使用交叉熵作为损失函数,通过梯度值引导所述晶体结构生成扩散模型的学习条件概率分布,对生成的晶体原子坐标进行修正;使用训练集对晶体结构生成扩散模型进行训练,使用验证集评估训练晶体结构生成扩散模型在未知数据集的预测能力,使用测试集对训练后的晶体结构生成扩散模型进行测试得到最终的晶体结构生成扩散模型;利用给定的高斯噪音,通过构建的建键预测器和最终的所述晶体结构生成扩散模型生成晶体结构;随机从多维标准高斯噪音分布中采集噪音值作为起始值实现逆向去噪过程,逆向去噪的高斯噪音维度包括晶胞所含原子坐标、所有原子种类的one-hot编码;所述晶体结构生成扩散模根据学习到的条件分布连续对输入值去噪,最终得到符合原始数据集分布的真值;对训练完毕的所述晶体结构生成扩散模型所生成的新型晶体结构进行线性插值,将两个不同晶体结构加噪至不同时间戳,设置插值因子,以控制每种晶体结构在复合晶体中的占有比重。。来自马-克-数-据-官网