第九届材料基因工程国际论坛期间,新材料大数据中心公开发布了为AI for Materials研发新范式提供专业化数据管理支撑功能的材料数据库系统,并在现场设置了专属产品演示与交互区域,直观呈现产品核心功能与技术价值,吸引了众多专家学者的广泛关注。为了便于各位专家学者更好地了解系统功能,本文通过演示晶体学数据上传的完整流程,展示材料数据库系统从模板设计到数据发布的全流程操作。
一、访问入口
官方网址:https://database.matbd.cn/,可自行注册与登录。

二、模板创建——构建标准化数据格式
1. 基础设置:点击“模板创建”,选择创建模板类型为“数据模板”,填写模板名称,并选择模板所属标签等。

2. 模板设计:拖拽式构建数据字段
1)进入模板设计界面,将合适的控件拖拽进模板设计区。

2)控件支持进行字段设置。

3)可选择直接拖拽右侧模板片段(例如“晶格常数”),提高创建效率。

4)模板创建完成后,可进行预览。

3. 数据量规则配置:数据模板嵌入了规范化的数据量统计规则,便于数据量的统计。
1)在结果区域中,勾选容器型控件“晶胞结构”,以及“密度”、“带隙”等6个数值与字符串型控件。后续每上传一条数据,这些控件中的内容都各作为一个数据量计入。


2)选定字段后,点击右上角“模拟”按钮,模拟每条数据的数据量统计效果。

三、模板审核——确保模板质量
具有审核模板权限的用户,可进入模板审核页面,查看模板并审核。

模板通过超级管理员终审后,进入到模板库,供后续使用。

四、数据上传——数据集创建并上传数据
1.进入数据上传页面,填写数据集名称、摘要等信息,选择模板库中的“晶体学模板”,创建数据集。

2.进入数据上传页面,选择刚刚创建好的“新材料大数据中心晶体学数据集”,按照如下三种方式上传数据:
(1)在线填写
在网页上直接填写,元素以及特殊符号可以用输入框右侧的虚拟键盘规范输入。填写完成后点击“提交”,即可完成单条数据上传。

(2)Excel批量导入
1)点击“批量上传”,并下载Excel模板。

2)将数据按Excel模板表头一一对应填入,确保格式规范。 模板中“晶体结构cif文件”为文件型字段,需要将完整的文件名(如hc-109867.cif)填入“晶体结构cif文件”列中。

3)选中填好的Excel模板以及所有的cif文件,打包压缩在一个压缩包中(若上传数据中无附件,可忽略此步骤;亦不可对文件夹进行压缩)。

4)点击“上传”按钮,在打开的文件夹中选择3)中的压缩包,上传完成后,点击提交(若上传数据中无附件,直接上传填写好的Excel模板即可)。

(3)JSON文件批量上传
1)点击“批量上传”,并下载JSON模板。

2)将数据按JSON模板中的字段对应填入。模板中“晶体结构cif文件”为文件型字段,需要将完整的文件名加上“”后(如“hc-10225009782.cif”)填入“晶体结构cif文件”字段冒号后。

3)选中填好的JSON模板以及所有的cif文件,直接压缩在一个压缩包中(若上传数据中无附件,可忽略此步骤;亦不可对文件夹进行压缩)。
4)点击“上传”按钮,在打开的文件夹中选择3)中的压缩包,上传完成后,点击提交(若上传数据中无附件,直接上传填写好的JSON模板即可)。

3.上传成功后,在个人中心可以查看该数据集内容。

五、数据审核——确保数据质量
具有数据审核权限的用户,可进入数据审核页面,查看数据并审核。

数据通过超级管理员终审后,进入到数据库,供后续使用。

六、数据发布
在数据发布界面,点击操作列中的“预发布”按钮,即可将数据集通过融通器预发布至新材料大数据中心主平台。

经过融通器与主平台审核后,数据集将被赋新材料大数据中心数据标识,并可在门户各业务系统内使用。
材料数据库系统聚焦当前材料科研领域的核心痛点,以“AI Ready”为核心导向,致力于破解多源异构材料数据的孤岛化、碎片化难题,为“AI+材料”新范式的深化落地夯实关键数据基础。为提升服务水平,测试和优化功能,敬请广大用户对材料数据库系统的设计、功能、内容、页面等提出意见与建议(反馈邮箱:fsx@mbd.org.cn)。新材料大数据中心将认真研究、积极改进,努力提升服务质量。
请您先登录
