PROJECT · Agent

中南大学热管理材料基因数据库与智能发现智能体

面向固态制冷与热电材料的数据库、可视化检索与多智能体发现工作流

2026-04-24 · Agent

中南大学热管理材料基因数据库与智能发现智能体

一个围绕热管理材料构建的科研工程平台,整合 MCE、ECE、BCE、OCE、ELCE、TECS、PCET、TEG、TCX 等材料数据模型,提供前后台数据管理、CIF/结构数据查看、Materials Project 信息补全,以及基于 LangGraph 的材料候选筛选与发现智能体。

Problem

热管理材料研究里,数据往往散落在论文、Materials Project、CSV 表格、CIF 文件和实验记录之间。真正做材料筛选时,需要同时回答几个问题:这个材料是否稳定?相变温度是否接近目标窗口?电卡或磁卡效应是否足够强?有没有结构文件?是否适合进入下一轮计算?

这个项目的目标,是把这些分散的信息组织成一个可检索、可维护、可扩展的材料基因数据库,并在此基础上接入智能体工作流,让系统可以从自然语言研究目标出发,辅助完成候选材料召回、筛选、评分和报告生成。

Architecture

project-image-1 系统分成四层:

  1. 数据层:MySQL 存储多类型热管理材料数据,Redis 支撑认证和缓存,CIF 文件作为结构数据资产独立管理。
  2. 服务层:Spring Boot 后端提供材料数据、成员、发表物、统计、CIF 和智能体 token 等 REST API。
  3. 应用层:Vue 3 用户端和管理端分别服务公开浏览、数据检索、后台维护、数据审核和可视化交互。
  4. 智能体层:FastAPI + LangGraph 实现 discovery 模式,连接 RAG、本地 TMMD 数据库和 Materials Project,形成分层材料发现流程。
User/Admin Web
  -> Spring Boot API
  -> MySQL + Redis + CIF Storage
  -> FastAPI Agent Service
  -> LangGraph Discovery Workflow
  -> RAG / TMMD DB / Materials Project
  -> Candidate Screening + Scoring + Report

Materials Database

数据库围绕热管理材料的关键物理机制设计,覆盖固态制冷与热电方向的多类数据:

project-image-1

  • MCE:磁卡效应材料
  • ECE:电卡效应材料
  • BCE:压卡效应材料
  • OCE:光卡效应材料
  • ELCE:弹卡效应材料
  • TECS:热电制冷储热材料
  • PCET:光控电热输运材料
  • TEG:热电发电材料
  • TCX:超高/超低热导率极值材料

以电卡材料为例,数据库不仅存储材料名、化学式、文献来源和 DOI,还记录铁电相/顺电相、双相 MP ID、居里温度、电卡熵变、电卡温变、电场强度、自发极化、剩余极化、矫顽场、介电常数、压电模量、能量凸包、形成能、带隙和 CIF 路径等字段。

这些字段让材料不只是“表格里的一行”,而是一个可以被搜索、比较、解释和继续计算的研究对象。

Agent Workflow

project-image-1

智能体的 discovery 模式面向材料候选发现。用户可以输入自然语言目标,例如:

筛选室温附近、高 ΔT、低工作电场、不要含铅的电卡材料。

系统会把这个目标解析为结构化约束,然后从三类来源召回候选:

  • 本地 RAG 文档:来自论文、项目文档和研究材料
  • TMMD 后端数据库:平台已整理和审核的材料数据
  • Materials Project:外部公开材料数据库

候选材料进入分层流程:

  1. L1:基于稳定性、基础物性和启发式规则快速筛选。
  2. Human Gate:让研究者确认哪些候选值得继续深入。
  3. L2:进入更重的计算或结构筛选流程。
  4. L3:对高价值候选做进一步动态验证。
  5. Report:生成 Top-N 候选解释,包括 why-picked、why-not 和 what-next。

What I Built

这个项目的核心价值不在于单个页面或单个 API,而在于把科研材料数据平台和智能体工作流连接起来:

  • 设计并维护多类型热管理材料的数据模型。
  • 实现 Spring Boot + MyBatis 的材料数据 API。
  • 构建 Vue 3 用户端和管理端的数据检索、展示和维护界面。
  • 支持 CIF 文件读取、结构数据检查和 Materials Project 字段补全。
  • 设计 LangGraph discovery 工作流,把自然语言目标转成材料筛选流程。
  • 将本地数据库、RAG 文档和 Materials Project 作为候选来源统一进入评分和报告生成。

Key Decisions

我没有把智能体做成一个“聊天窗口套壳”,而是把它放在材料发现流程中。它需要知道数据从哪里来、候选为什么被选中、哪些指标支持它进入下一轮、哪些风险需要研究者判断。

另一个关键决定是保留 human-in-the-loop gate。材料发现不是纯自动化推荐,尤其在候选材料进入高成本计算前,需要让研究者参与决策。智能体负责整理证据、提出建议和生成报告,人负责判断研究方向是否值得继续。

Next Steps

后续我希望继续完善三件事:

  1. 强化数据质量:补齐更多材料类型的字段规范、审核流程和来源追踪。
  2. 强化计算闭环:让 L2/L3 计算结果更稳定地回写到候选材料记录中。
  3. 强化解释能力:让报告不仅给出排名,还能解释性能、稳定性、可制备性、新颖性和成本之间的取舍。