DeepAgent:具有可擴展工具集的通用推理 Agent。
> 当工具成千上万、记忆不堪重负时
1. Agent 需要新工具时会生成 <tool_search>天气预报工具</tool_search> 特殊指令,后台工具检索器通过向量检索从工具库中找到匹配工具并返回说明文档。这使 Agent 能按需动态学习和使用新工具,无需预先加载所有工具。
2. 采用"记忆折叠"机制解决 LLM 上下文窗口限制问题:当 Agent 完成子任务或需要整理思路时执行 fold 动作。一个辅助 LLM (Auxiliary LLM) 随即介入,将冗长的交互历史压缩成结构化的简洁摘要,避免模型遗忘或被信息淹没。
这个记忆摘要被设计成三种类型,模拟了人脑的记忆方式:
- 情节记忆:记录任务的关键节点和重大决策,像是“任务大事记”。
- 工作记忆:保存当前的直接目标、遇到的困难和下一步计划,像是“便利贴”。
- 工具记忆:总结用过的所有工具、它们的效果以及使用技巧,像是“工具使用心得”。
論文 https://arxiv.org/abs/2510.21618
介紹 https://zhuanlan.zhihu.com/p/1967339969728194140
專案 https://github.com/RUC-NLPIR/DeepAgent
 
 
Back to Top