中南大学热管理材料基因数据库与智能发现智能体

一个围绕热管理材料构建的科研工程平台，整合 MCE、ECE、BCE、OCE、ELCE、TECS、PCET、TEG、TCX 等材料数据模型，提供前后台数据管理、CIF/结构数据查看、Materials Project 信息补全，以及基于 LangGraph 的材料候选筛选与发现智能体。

tmmd.csu.edu.cn

Thermal Management Materials Database

Open link

tmmd.csu.edu.cn

Problem

热管理材料研究里，数据往往散落在论文、Materials Project、CSV 表格、CIF 文件和实验记录之间。真正做材料筛选时，需要同时回答几个问题：这个材料是否稳定？相变温度是否接近目标窗口？电卡或磁卡效应是否足够强？有没有结构文件？是否适合进入下一轮计算？

这个项目的目标，是把这些分散的信息组织成一个可检索、可维护、可扩展的材料基因数据库，并在此基础上接入智能体工作流，让系统可以从自然语言研究目标出发，辅助完成候选材料召回、筛选、评分和报告生成。

Architecture

project-image-1 系统分成四层：

数据层：MySQL 存储多类型热管理材料数据，Redis 支撑认证和缓存，CIF 文件作为结构数据资产独立管理。
服务层：Spring Boot 后端提供材料数据、成员、发表物、统计、CIF 和智能体 token 等 REST API。
应用层：Vue 3 用户端和管理端分别服务公开浏览、数据检索、后台维护、数据审核和可视化交互。
智能体层：FastAPI + LangGraph 实现 discovery 模式，连接 RAG、本地 TMMD 数据库和 Materials Project，形成分层材料发现流程。

text

User/Admin Web
  -> Spring Boot API
  -> MySQL + Redis + CIF Storage
  -> FastAPI Agent Service
  -> LangGraph Discovery Workflow
  -> RAG / TMMD DB / Materials Project
  -> Candidate Screening + Scoring + Report

Materials Database

数据库围绕热管理材料的关键物理机制设计，覆盖固态制冷与热电方向的多类数据：

project-image-1

MCE：磁卡效应材料
ECE：电卡效应材料
BCE：压卡效应材料
OCE：光卡效应材料
ELCE：弹卡效应材料
TECS：热电制冷储热材料
PCET：光控电热输运材料
TEG：热电发电材料
TCX：超高/超低热导率极值材料

以电卡材料为例，数据库不仅存储材料名、化学式、文献来源和 DOI，还记录铁电相/顺电相、双相 MP ID、居里温度、电卡熵变、电卡温变、电场强度、自发极化、剩余极化、矫顽场、介电常数、压电模量、能量凸包、形成能、带隙和 CIF 路径等字段。

这些字段让材料不只是“表格里的一行”，而是一个可以被搜索、比较、解释和继续计算的研究对象。

Agent Workflow

project-image-1

智能体的 discovery 模式面向材料候选发现。用户可以输入自然语言目标，例如：

筛选室温附近、高 ΔT、低工作电场、不要含铅的电卡材料。

系统会把这个目标解析为结构化约束，然后从三类来源召回候选：

本地 RAG 文档：来自论文、项目文档和研究材料
TMMD 后端数据库：平台已整理和审核的材料数据
Materials Project：外部公开材料数据库

候选材料进入分层流程：

L1：基于稳定性、基础物性和启发式规则快速筛选。
Human Gate：让研究者确认哪些候选值得继续深入。
L2：进入更重的计算或结构筛选流程。
L3：对高价值候选做进一步动态验证。
Report：生成 Top-N 候选解释，包括 why-picked、why-not 和 what-next。

What I Built

这个项目的核心价值不在于单个页面或单个 API，而在于把科研材料数据平台和智能体工作流连接起来：

设计并维护多类型热管理材料的数据模型。
实现 Spring Boot + MyBatis 的材料数据 API。
构建 Vue 3 用户端和管理端的数据检索、展示和维护界面。
支持 CIF 文件读取、结构数据检查和 Materials Project 字段补全。
设计 LangGraph discovery 工作流，把自然语言目标转成材料筛选流程。
将本地数据库、RAG 文档和 Materials Project 作为候选来源统一进入评分和报告生成。

Key Decisions

我没有把智能体做成一个“聊天窗口套壳”，而是把它放在材料发现流程中。它需要知道数据从哪里来、候选为什么被选中、哪些指标支持它进入下一轮、哪些风险需要研究者判断。

另一个关键决定是保留 human-in-the-loop gate。材料发现不是纯自动化推荐，尤其在候选材料进入高成本计算前，需要让研究者参与决策。智能体负责整理证据、提出建议和生成报告，人负责判断研究方向是否值得继续。

Next Steps

后续我希望继续完善三件事：

强化数据质量：补齐更多材料类型的字段规范、审核流程和来源追踪。
强化计算闭环：让 L2/L3 计算结果更稳定地回写到候选材料记录中。
强化解释能力：让报告不仅给出排名，还能解释性能、稳定性、可制备性、新颖性和成本之间的取舍。

tmmd.csu.edu.cn

Thermal Management Materials Database

Open link

tmmd.csu.edu.cn

Problem

Architecture

project-image-1 系统分成四层：

数据层：MySQL 存储多类型热管理材料数据，Redis 支撑认证和缓存，CIF 文件作为结构数据资产独立管理。
服务层：Spring Boot 后端提供材料数据、成员、发表物、统计、CIF 和智能体 token 等 REST API。
应用层：Vue 3 用户端和管理端分别服务公开浏览、数据检索、后台维护、数据审核和可视化交互。
智能体层：FastAPI + LangGraph 实现 discovery 模式，连接 RAG、本地 TMMD 数据库和 Materials Project，形成分层材料发现流程。

text

User/Admin Web
  -> Spring Boot API
  -> MySQL + Redis + CIF Storage
  -> FastAPI Agent Service
  -> LangGraph Discovery Workflow
  -> RAG / TMMD DB / Materials Project
  -> Candidate Screening + Scoring + Report

Materials Database

数据库围绕热管理材料的关键物理机制设计，覆盖固态制冷与热电方向的多类数据：

project-image-1

MCE：磁卡效应材料
ECE：电卡效应材料
BCE：压卡效应材料
OCE：光卡效应材料
ELCE：弹卡效应材料
TECS：热电制冷储热材料
PCET：光控电热输运材料
TEG：热电发电材料
TCX：超高/超低热导率极值材料

这些字段让材料不只是“表格里的一行”，而是一个可以被搜索、比较、解释和继续计算的研究对象。

Agent Workflow

project-image-1

智能体的 discovery 模式面向材料候选发现。用户可以输入自然语言目标，例如：

筛选室温附近、高 ΔT、低工作电场、不要含铅的电卡材料。

系统会把这个目标解析为结构化约束，然后从三类来源召回候选：

本地 RAG 文档：来自论文、项目文档和研究材料
TMMD 后端数据库：平台已整理和审核的材料数据
Materials Project：外部公开材料数据库

候选材料进入分层流程：

L1：基于稳定性、基础物性和启发式规则快速筛选。
Human Gate：让研究者确认哪些候选值得继续深入。
L2：进入更重的计算或结构筛选流程。
L3：对高价值候选做进一步动态验证。
Report：生成 Top-N 候选解释，包括 why-picked、why-not 和 what-next。

What I Built

这个项目的核心价值不在于单个页面或单个 API，而在于把科研材料数据平台和智能体工作流连接起来：

设计并维护多类型热管理材料的数据模型。
实现 Spring Boot + MyBatis 的材料数据 API。
构建 Vue 3 用户端和管理端的数据检索、展示和维护界面。
支持 CIF 文件读取、结构数据检查和 Materials Project 字段补全。
设计 LangGraph discovery 工作流，把自然语言目标转成材料筛选流程。
将本地数据库、RAG 文档和 Materials Project 作为候选来源统一进入评分和报告生成。

Key Decisions

Next Steps

后续我希望继续完善三件事：

强化数据质量：补齐更多材料类型的字段规范、审核流程和来源追踪。
强化计算闭环：让 L2/L3 计算结果更稳定地回写到候选材料记录中。
强化解释能力：让报告不仅给出排名，还能解释性能、稳定性、可制备性、新颖性和成本之间的取舍。