
一个围绕热管理材料构建的科研工程平台,整合 MCE、ECE、BCE、OCE、ELCE、TECS、PCET、TEG、TCX 等材料数据模型,提供前后台数据管理、CIF/结构数据查看、Materials Project 信息补全,以及基于 LangGraph 的材料候选筛选与发现智能体。
Problem
热管理材料研究里,数据往往散落在论文、Materials Project、CSV 表格、CIF 文件和实验记录之间。真正做材料筛选时,需要同时回答几个问题:这个材料是否稳定?相变温度是否接近目标窗口?电卡或磁卡效应是否足够强?有没有结构文件?是否适合进入下一轮计算?
这个项目的目标,是把这些分散的信息组织成一个可检索、可维护、可扩展的材料基因数据库,并在此基础上接入智能体工作流,让系统可以从自然语言研究目标出发,辅助完成候选材料召回、筛选、评分和报告生成。
Architecture
系统分成四层:
- 数据层:MySQL 存储多类型热管理材料数据,Redis 支撑认证和缓存,CIF 文件作为结构数据资产独立管理。
- 服务层:Spring Boot 后端提供材料数据、成员、发表物、统计、CIF 和智能体 token 等 REST API。
- 应用层:Vue 3 用户端和管理端分别服务公开浏览、数据检索、后台维护、数据审核和可视化交互。
- 智能体层:FastAPI + LangGraph 实现 discovery 模式,连接 RAG、本地 TMMD 数据库和 Materials Project,形成分层材料发现流程。
User/Admin Web
-> Spring Boot API
-> MySQL + Redis + CIF Storage
-> FastAPI Agent Service
-> LangGraph Discovery Workflow
-> RAG / TMMD DB / Materials Project
-> Candidate Screening + Scoring + Report
Materials Database
数据库围绕热管理材料的关键物理机制设计,覆盖固态制冷与热电方向的多类数据:

- MCE:磁卡效应材料
- ECE:电卡效应材料
- BCE:压卡效应材料
- OCE:光卡效应材料
- ELCE:弹卡效应材料
- TECS:热电制冷储热材料
- PCET:光控电热输运材料
- TEG:热电发电材料
- TCX:超高/超低热导率极值材料
以电卡材料为例,数据库不仅存储材料名、化学式、文献来源和 DOI,还记录铁电相/顺电相、双相 MP ID、居里温度、电卡熵变、电卡温变、电场强度、自发极化、剩余极化、矫顽场、介电常数、压电模量、能量凸包、形成能、带隙和 CIF 路径等字段。
这些字段让材料不只是“表格里的一行”,而是一个可以被搜索、比较、解释和继续计算的研究对象。
Agent Workflow

智能体的 discovery 模式面向材料候选发现。用户可以输入自然语言目标,例如:
筛选室温附近、高 ΔT、低工作电场、不要含铅的电卡材料。
系统会把这个目标解析为结构化约束,然后从三类来源召回候选:
- 本地 RAG 文档:来自论文、项目文档和研究材料
- TMMD 后端数据库:平台已整理和审核的材料数据
- Materials Project:外部公开材料数据库
候选材料进入分层流程:
- L1:基于稳定性、基础物性和启发式规则快速筛选。
- Human Gate:让研究者确认哪些候选值得继续深入。
- L2:进入更重的计算或结构筛选流程。
- L3:对高价值候选做进一步动态验证。
- Report:生成 Top-N 候选解释,包括 why-picked、why-not 和 what-next。
What I Built
这个项目的核心价值不在于单个页面或单个 API,而在于把科研材料数据平台和智能体工作流连接起来:
- 设计并维护多类型热管理材料的数据模型。
- 实现 Spring Boot + MyBatis 的材料数据 API。
- 构建 Vue 3 用户端和管理端的数据检索、展示和维护界面。
- 支持 CIF 文件读取、结构数据检查和 Materials Project 字段补全。
- 设计 LangGraph discovery 工作流,把自然语言目标转成材料筛选流程。
- 将本地数据库、RAG 文档和 Materials Project 作为候选来源统一进入评分和报告生成。
Key Decisions
我没有把智能体做成一个“聊天窗口套壳”,而是把它放在材料发现流程中。它需要知道数据从哪里来、候选为什么被选中、哪些指标支持它进入下一轮、哪些风险需要研究者判断。
另一个关键决定是保留 human-in-the-loop gate。材料发现不是纯自动化推荐,尤其在候选材料进入高成本计算前,需要让研究者参与决策。智能体负责整理证据、提出建议和生成报告,人负责判断研究方向是否值得继续。
Next Steps
后续我希望继续完善三件事:
- 强化数据质量:补齐更多材料类型的字段规范、审核流程和来源追踪。
- 强化计算闭环:让 L2/L3 计算结果更稳定地回写到候选材料记录中。
- 强化解释能力:让报告不仅给出排名,还能解释性能、稳定性、可制备性、新颖性和成本之间的取舍。