复合材料吧 关注:3,988贴子:10,973
  • 0回复贴,共1

金属材料设计新范式:AI 与数据驱动全流程实操

只看楼主收藏回复

第一部分
Python与材料科学数据分析基础
理论内容:
数据驱动材料设计的范式革命与核心流程
Python材料数据科学生态系统
材料数据库与数据标准化概述
实践内容:从环境搭建到数据分析
Case 1:Python科学计算环境搭建与核心库(NumPy, Pandas等)
Case 2:准备或数据库下载特定材料数据
高温合金体系,获取其原子结构、成分、相溶解温度等基本信息
钛合金体系,重点关注蠕变性能和拉伸力学性能
下载/准备钛合金或高温合金的数据,并将结果保存为DataFrame
Case 3:数据清洗、探索与可视化分析
第二部分
描述符工程与特征优化
理论内容:
材料描述符的核心概念:如何数字化表征材料
成分描述符、工艺描述符、晶体结构描述符与电子结构描述符详解
特征选择、降维与特征重要性分析方法及原理
实践内容:从生成描述符到优化特征空间
Case 1:使用Matminer批量生成多元化描述符
为钛合金体系生成描述符
为高温合金体系生成描述符
获得包含原始材料信息和数十至上百个描述符列的DataFrame
Case 2:无监督学习与数据可视化
数据预处理: 对生成的大量描述符进行标准化,确保处于同一量纲
主成分分析:对钛合金/高温合金体系描述符数据进行PCA分析
t-SNE可视化:使用t-SNE对钛合金体系/高温合金体系进行可视化
Case 3:特征选择与优化
过滤法:计算描述符与目标性能的相关系数
随机森林或其他回归模型进行训练。 以“预测钛合金的蠕变断裂寿命或其他性能”为例,分析模型哪些描述符最为重要。
递归特征消除:使用RFECV工具,自动确定最佳特征数量。
第三部分
经典与集成机器学习算法
理论内容:
监督学习的基本框架与材料数据的建模流程
经典机器学习算法的核心思想与比较
集成学习方法及其在复杂材料体系中的优势
模型评估、误差分析与模型选择策略
实践内容——从基础建模到集成算法应用
Case 1:基于经典算法的材料性能预测入门实践
使用给定合金属性数据集(如晶体结构/力学性能 - 元素特征数据)建立初始化线性回归、支持向量机回归、决策树回归/分类器等模型
完成训练–测试流程,可视化预测误差
Case 2:超参数调优实战:使用交叉验证和自动化搜索工具来寻找模型的最佳超参数组合
Case 3:集成模型在复杂材料任务中的应用与解释
针对合金力学性能等,分别训练基于随机森林、GBDT等性能预测模型,调整主要超参数,比较不同集成模型的预测精度与训练效率
模型解释性:使用SHAP库,对合金力学性能预测模型进行分析
第四部分
主动学习与多目标优化
理论内容:
材料研发的瓶颈与主动学习的核心
主动学习优化框架:建模与决策
单目标优化与多目标优化介绍
实践内容:
Case 1:在一个简单一维函数上实现主动学习循环,理解其工作原理
Case 2:综合案例—钛合金增材制造工艺参数优化
问题定义
构建初始代理模型
设计主动学习循环
执行循环,绘制每一轮中发现的最佳性能的进化图
循环结束后,分析最终推荐出的增材制造工艺参数
论文实例复现与解读:
1.Active learning framework to optimize process parameters for additive-manufactured Ti-6Al-4V with high strength and ductility. Nature Communication, 2025: 16: 931.
第五部分
“灰箱”模型与可解释AI
理论内容:
“灰箱”模型的核心思想与优势
物理信息神经网络核心原理与应用
符号回归
模型可解释性技术(全局与局部解释、SHAP 理论)
实践内容——构建与解读下一代AI模型(结合相关论文)
Case 1:物理约束神经网络实战
Case 2:符号回归发现新材料规律
输入系统或材料相关的多维数据,运行符号回归寻找关键描述符
对发现的公式进行合理性评估,判断其是否具有实际解释意义
运用SHAP工具解读一个高性能集成学习模型,获得材料设计指南
全局解释:计算并绘制SHAP特征重要性条形图,识别出影响合金性能的最关键描述符,绘制SHAP摘要图,观察每个描述符与目标性能的单调性或非线性关系
局部解释:选择一个模型预测为超高力学性能的特定合金成分,生成该样本的SHAP力力图,直观展示描述符(特征)




IP属地:北京1楼2025-12-09 14:58回复