当前位置: 首页 > 在线开发 > 机器学习
材料机器学习平台

新材料大数据中心机器学习模块面向材料公益数据场景,核心服务于材料性能预测、成分设计及机理分析等任务。模块以云智材料机器学习平台(企业版)的低代码工作流为内核,复用其 “拖拉拽” 算子组件、可视化流程构建等核心能力,集成 12 大类 128 种算子组件,涵盖数据处理、机器学习全关键环节。用户可结合国家新材料大数据中心权威数据与自有数据,通过简化操作快速搭建自定义模型,高效完成材料领域数据分析与模型开发。

北京云智材料大数据研究院 北京科技大学2025.10.16

材料机器学习平台
软件介绍

过去10年,材料大数据和智能技术快速发展,正在变革材料研发范式。材料机器学习平台旨在打破专业与技术壁垒,助力材料科研人员轻松、高效完成材料数据分析。平台将人工智能与机器学习算法封装为“拖拉拽”式的算子组件,支持用户快速搭建自定义的材料领域机器学习模型。平台集成12大类、共计128种算子组件,涵盖数据预处理、统计分析、多变量分析、特征工程、关联规则、聚类与分类分析、时间序列、模型评估、线性与混合整数规划、大模型等丰富功能,全面覆盖数据处理与机器学习关键环节。平台将集成AI大模型智能问答生成工作流功能,用户可通过自然语言交互快速生成智能分析工作流方案。用户可依托国家新材料大数据中心的权威数据资源,结合自有数据,通过可视化工作流拖拽方式,灵活构建材料机器学习模型,高效完成材料性能预测、成分设计及机理分析等任务。本平台提供从数据接入、清洗预处理、统计与多变量建模、特征工程、机器学习训练到模型评估与部署的一体化能力。平台内置工作流式可视化建模界面,支持表格/文本/JSON与主流数据库的数据源连接,能够将材料实验数据(成分、工艺参数、显微组织、力学/电学/热学等性能)与仿真数据统一纳管,通过拖拽式算子拼装形成可复用的材料机器学习流程,实现“数据—特征—模型—评估—发布”的闭环。


【案例分享】材料机器学习平台:拖拽式机器学习工作流设计操作案例

使用说明

打开材料机器学习平台,用户可访问工作流模块,通过导航菜单进入编辑器界面。

1.png

除了空白工作流创建,平台还有针对材料用户的工作流模板,用户可以直接复用模板,快速进行工作流配置。

2.png

用户还可以通过AI智能问答生成工作流,通过在对话窗口进行自然语言输入即可智能生成工作流。

3.png

用户可采用“拖拉拽”的形式构建工作流,从用户空间拖动数据集条目和组件到工程面板,连接节点以形成分析流程。

4.png

用户可自定义节点参数。

5.png

点击执行后,将运行选中节点及前序节点。

6.png

材料机器学习平台已在部分科研院所进行了部署应用,帮助材料研发团队缩短了数据分析时间,提升了研发效率。

当前,针对数据处理与机器学习任务,平台覆盖数据预处理、统计分析、多变量分析、特征工程、关联规则、聚类分析、分类分析、时间序列、模型评估、线性/混合整数规划、大模型以及自定义节点等12大类,共计128个细粒度算子,能够满足材料成分优化、工艺窗口寻优、性能预测与失效分析等主流场景的建模需求。

其中数据预处理算子多达40项,支持分箱、缺失值/异常值处理、透视与逆透视、标准化/正规化、数据分割与过抽样等高频操作;统计与多变量分析内置t检验/方差分析/相关矩阵、PCA/PLS等方法,便于开展材料变量敏感性与相关性研究;

特征工程模块提供信息增益、RELIEF_F、卡方等多种特征选择与过滤机制,支撑高维配方/工艺特征的筛选;

聚类与分类覆盖K-means/层次/DBSCAN与决策树、随机森林、SVM、XGBoost及表格/图像/文本的深度学习分类节点,可快速构建材料分群、组织相判别与缺陷识别模型;

时间序列模块提供ARIMA与指数平滑等预测能力,适用于长周期烧结/时效过程的参数曲线建模与趋势外推;

模型评估模块内置交叉验证、混淆矩阵、AUC与回归R²/MSE/MAE等指标,保障模型可解释、可比与可复现;

线性与混合整数规划算子可进一步将预测结果与约束优化耦合,用于配方/工艺的目标最优化求解。

平台还支持可配置工作流发布为标准Web服务,结合控制流与脚本扩展(R、Python、Groovy)实现异构工具链联动,并可对接嵌入式或通用大模型开展知识库构建与检索增强(RAG),用于材料文献/专利—实验—仿真的跨源知识检索与辅助机理解释。

在算力侧,平台支持高性能AI服务器与主流框架优化部署,满足多团队并发建模与推理。依托上述能力,国家材料大数据平台可在统一的数据与模型底座上,沉淀标准化材料数据处理流程与模型仓库,面向成分—工艺—组织—性能全链条,实现从批量数据治理、特征挖掘、在线建模到服务化发布的贯通,支撑材料性能预测、配方反演、工艺参数推荐与质量一致性提升等关键任务的规模化落地。

材料机器学习平台具有较高的应用推广价值:模块化和可视化特性非常适合需要复杂数据分析但又没有足够编程能力的用户;平台支持多种分析类型(分类、聚类、回归等),能够支持绝大多数基于数据驱动的材料研发场景;平台能保存分析思路和流程,促进科研协作与知识传承,推动数据驱动决策与创新。


操作视频
系统提示
请您先登录
提示

您访问的链接即将离开“新材料大数据中心”网站
是否继续?