本文利用机器学习加速密度泛函理论系统地研究了合金原子在铝基体和不同类型的石墨烯/铝界面中的扩散迁移行为。通过第一性原理计算建立小样本数据集,通过特征工程确定输入输出特征值的类型,综合考虑模型复杂度和预测精度的影响,最终确定完美界面、缺陷界面和铝矩阵的输入特征个数分别为6、5和4。通过五倍交叉和十几个机器学习模型的比较,CatBoost算法具有最低的误差和更好的确定系数。我们进一步优化了CatBoost算法,并调整了正则化项系数,以避免过度拟合的风险。通过构造SHAP值矩阵,定量描述各特征对模型预测结果的影响。性能最好的Catboost模型用于预测完整的元素周期表数据,进而用于筛选出易于向石墨烯/铝复合材料界面移动的元素种类。通过对比元素在铝基体和不同石墨烯/铝界面的扩散迁移结果,发现这些合金元素有利于复合材料中缺陷石墨烯的改性。机器学习加速第一性原理计算的结果可以为进一步开发新型铝合金复合材料提供理论基础。
图1. (a)机器学习过程中的步骤,(b)交叉验证图,(c)SHAP可解释模型,(d)机器学习方法和DFT计算的效率比较。
图2. 计算结果与不同描述符之间的 Pearson 相关系数矩阵的热图。红色和蓝色表示正相关和负相关的强度。
图3. (a) 铝基体 (b) 石墨烯/铝完美界面和 (c) 石墨烯/铝缺陷界面的平均绝对百分比误差重要性雷达图。(d) 特征去除曲线。
图4. (a) 不同模型的均方误差比较结果、确定系数以及(b)铝基体、( c)石墨烯/铝复合材料完美界面和(d)石墨烯/铝复合材料缺陷界面的DFT比较机器学习预测结果。
图5. (a) 铝基质 (c) 石墨烯/铝复合材料完美界面和 (e) 石墨烯/铝复合材料缺陷界面的 SHAP 值,(b) 铝基质 (d) 石墨烯/铝复合材料完美界面和 (f) 石墨烯/铝复合材料缺陷界面的 SHAP 摘要图表。
图6. (a)铝基质、(b)石墨烯/铝复合材料完美界面和(c)石墨烯/铝复合材料缺陷界面的元素周期表扩散迁移预测图,(d)铝基质与石墨烯/铝复合材料完美界面比较,(e)石墨烯/铝复合材料完美界面与缺陷界面比较。
相关研究成果由哈尔滨工业大学材料科学与工程学院Jingtao Huang等人于2024年发表在Composite Structures (https://doi.org/10.1016/j.compstruct.2024.118025)上。
原文:Explainable machine learning accelerated density functional theory prediction for diffusive transport behaviour of elements in aluminium matrix and graphene/aluminium interface
本文来自石墨烯研究,本文观点不代表石墨烯网立场,转载请联系原作者。