当前位置: 首页 > 新闻中心
【使用指南】材料科技论文数据抽取系统:一键开启材料文献知识宝库!
发布机构:新材料大数据中心 发布时间:2025-12-04 10:00:00

材料科技文献是推动材料设计和研发的重要知识源泉,为充分挖掘潜在信息与知识,促进文献数据资源的高效整合与利用。新材料大数据中心材料科技论文数据抽取系统1.0于2025年12月4日正式上线试运行。现公开征求社会各界意见和建议,以助力提升服务水平,共同构建支撑AI+新材料的研发新范式。

系统定位与核心价值

材料科技论文数据抽取系统,面向材料科技文献爆炸式增长而高价值数据沉睡其中难以获取的难题,通过集成文献管理、主题分析、数据自动抽取和结果可视化等功能,实现了从材料科技论文到结构化数据的自动转换。

论文库:支持PDF、XML和HTML等多源异构文献的导入与管理,帮助用户构建个性化的知识库;

主题分析:可基于文献内容自动分析研究主题和相关热度,辅助用户确定相关的抽取目标;

数据抽取:自动识别并提取文献中的关键信息,包括成分、合成与制备工艺,以及物理和化学性能等核心要素,并互相关联形成结构化数据集;

可视化:提供抽取结果可视化功能,支持条形图与散点图的生成,帮助用户深入理解整体数据分布和特征间的关联关系。

访问入口

图片1.png

材料科技论文数据抽取系统访问入口

抽取系统官网入口

https://matminer.matbd.cn

国家新材料大数据中心平台入口

https://www.matbd.cn→“数据产品”→“材料科技论文数据抽取系统”

材料科技论文数据抽取系统软件操作指南

以下为材料科技论文数据抽取系统使用方法的简要说明,旨在帮助用户轻松上手、熟练操作。

图片2.png

软件首页

登录鉴权完成后,用户需配置API密钥并选择模型。

图片3.png

用户API密钥配置界面

顶栏主菜单由五大模块组成,分别为论文库管理、抽取任务管理、抽取历史管理、使用说明手册、个人账号中心。用户在主页点击【开始抽取】按钮,将直接跳转至【任务管理】页面,通过创建抽取任务开始数据抽取。

图片4.png

抽取任务管理界面

论文数据抽取任务包含以下四个步骤:

1. 文献选择

图片5.png

文献选择界面

在侧边栏选中已创建的任务后,点击“添加文献”进入文献选择界面。用户可直接勾选系统中已有的文献,也可点击“新文献导入”将本地文件上传至系统文件夹。系统支持文件夹批量上传、拖拽上传和文件选择上传,并兼容PDF、XML、HTML等多种文献格式,方便用户灵活导入不同来源的科研文献。

2. 主题分析

图片6.png

主题分析界面

文献导入后,点击页面右上角“下一步”即可进入“主题分析”流程。系统将自动识别文献中材料、工艺和性能三个方向的主题词及其研究关注度,为后续数据抽取明确相关目标。完成主题分析后,再次点击“下一步”即可进入文献数据抽取环节。

3. 文献抽取

图片7.png

抽取目标配置界面

“主题分析”生成候选抽取目标集,用户可在其中进行选择,以确保系统提取与研究主题相关的信息。若候选目标中未包含所需的抽取目标,可手动添加:点击【新增】按钮,在弹出的输入框中输入目标名称并进行勾选。完成设置后,点击【下一步】即可开始抽取文献数据并形成抽取结果。

4. 结果管理

图片8.png

抽取结果管理界面

数据抽取完成后,用户可以通过以下方式查看并分析结果:

1、查看单篇文献的抽取结果

点击【抽取结果查看】,可浏览每篇文献的详细抽取结果。若需导出单篇文献结果至本地,可通过【抽取结果查看】→【操作】→【查看】→【导出单篇结果】,即可将抽取结果导出并保存到本地Excel文件中。

2、批量导出抽取结果

若需一次性导出当前任务中所有文献的抽取数据,可点击【总体结果下载】按钮。系统将自动汇总所有文献抽取结果,并导出到Excel文件中。

3、生成可视化图表

点击【抽取结果查看】→【配置可视化图表】,即可对抽取结果进行多种类型的数据可视化呈现。

系统其他操作

1. 论文库管理

图片9.png

论文库界面

在顶部主菜单栏,用户可进入个人论文库管理文献,支持文件夹创建与删除、文献分类、文献预览及文献收藏等操作,实现文献的高效组织与快速检索。

2. 历史管理

图片10.png

文献解析和抽取历史界面

通过顶部主菜单栏进入历史管理页面,可查看个人全部的文献解析和抽取记录,并支持按任务名称快速定位具体历史记录。


该系统由王伟仁博士、姜雪副教授和宿彦京教授等人自主研发的SuperalloyDigger材料数据抽取工具迭代发展而来,具备更强的语义理解能力与要素关联能力。相关工具此前已在英国帝国理工学院、南京工业大学、中科院上海微系统所等机构的研究中广泛使用。应用领域涵盖高熵合金、钢铁、陶瓷膜、电池、金属基复合材料等多个方向。

材料科技论文数据抽取系统通过智能解析材料科技论文,精准提取并关联材料成分、合成与制备工艺和性能等关键要素,自动构建结构化数据并进行可视化呈现,可面向多源文献开展深入分析,助力科研人员高效把握材料研究的核心数据脉络。为进一步提升服务水平、持续优化功能,系统未来还将拓展图像数据抽取、曲线点自动识别等能力,逐步完善材料文献的全场景信息解析能力。

敬请广大用户对材料科技论文数据抽取系统的设计、功能、内容、页面等提出意见与建议(反馈邮箱:info@mbd.org.cn)。新材料大数据中心将认真研究、积极改进,努力提升服务质量。

系统提示
请您先登录
提示

您访问的链接即将离开“新材料大数据中心”网站
是否继续?