1. 一句话结论
Deep Agents 是 LangChain 团队推出的“带电池的 Agent 框架层”:它不是一个单纯的聊天机器人 SDK,而是在 LangGraph 运行时之上,预置了任务规划、虚拟文件系统、子代理、技能、记忆、权限控制、上下文压缩、Human-in-the-loop 等能力,适合用来快速搭建面向复杂业务流程的长任务 Agent。
对售前来说,它的价值在于:当客户已经不满足于“问答/RAG”,而是希望 AI 能完成调研、代码、数据处理、文档生成、系统操作、多步骤流程编排时,Deep Agents 可以作为 PoC 的底座,用较短时间证明“Agent 能否真的做事”。
2. 项目基本信息
| 维度 | 信息 |
|---|---|
| GitHub | langchain-ai/deepagents |
| 官方文档 | Deep Agents Docs |
| PyPI | deepagents |
| 开源协议 | MIT |
| 主要语言 | Python |
| Python 要求 | >=3.11, <4.0 |
| 当前 PyPI 稳定版本 | 0.6.12 |
| GitHub 描述 | The batteries-included agent harness. |
| 生态依赖 | LangChain、LangGraph、LangSmith |
| 模型兼容 | 支持具备 tool calling 能力的模型,包括商业模型、开源模型和本地模型 |
截至 2026-06-30,GitHub 仓库约 25k stars、3.5k forks,更新非常活跃,说明它处在快速演进阶段,适合技术预研和 PoC,但在正式生产落地前需要锁定版本、做安全边界和稳定性验证。
3. 它主要能做什么
Deep Agents 的核心能力可以理解为“给大模型一个可控的工作环境”。
3.1 长任务执行
普通 LLM 调用通常是“一问一答”,Deep Agents 则面向多轮、多步骤、长耗时任务。它内置任务规划工具,可以维护待办事项,把复杂目标拆成多个步骤持续推进。
典型例子:
- 自动完成一个研究报告:搜索资料、读文档、整理结论、生成 Markdown。
- 自动完成代码任务:读仓库、定位问题、修改文件、运行测试、总结变更。
- 自动完成数据分析:读文件、写脚本、执行分析、产出图表和解释。
3.2 子代理协作
Deep Agents 内置 task 工具,可以让主 Agent 创建临时子 Agent。每个子 Agent 有独立上下文,适合处理隔离的子任务,最后只把结果返回给主 Agent。
售前价值:
- 面向复杂客户任务时,可以把“调研”“数据清洗”“代码检查”“报告撰写”拆成不同子代理。
- 减少单个上下文窗口塞满的风险。
- 更接近真实企业流程中的分工协作。
3.3 虚拟文件系统
Deep Agents 提供文件工具,例如:
| 工具 | 作用 |
|---|---|
ls | 列目录 |
read_file | 读取文件,支持大文件分段读取 |
write_file | 写文件 |
edit_file | 修改文件 |
glob | 按模式查找文件 |
grep | 搜索文件内容 |
execute | 在沙箱后端中执行 shell 命令 |
这些能力让 Agent 不只是“回答”,而是能在工作区里沉淀中间结果、读写上下文、执行脚本,适合企业内部知识处理、代码处理和自动化办公场景。
3.4 上下文管理
Deep Agents 针对长任务提供了几类上下文工程能力:
- Skills:按需加载专项能力和领域知识。
- Memory:通过
AGENTS.md等机制保存长期偏好、规范和项目说明。 - Summarization:对长对话和大工具结果做压缩。
- Context offloading:把大结果卸载到文件系统中,减少上下文窗口压力。
- Subagent isolation:让子任务在隔离上下文中执行,只返回最终摘要。
这对于售前 PoC 很关键,因为客户常见痛点是:“Agent 跑一会儿就忘了前面做过什么”“工具结果太长塞爆上下文”“复杂任务越跑越乱”。Deep Agents 正是在解决这些工程问题。
3.5 权限与人工审批
Deep Agents 支持文件系统权限规则,可以限制 Agent 哪些路径能读、哪些路径能写。它也支持 Human-in-the-loop,可以在敏感工具调用前中断,让人审批、修改或拒绝。
适合对客户强调:
- Agent 的能力边界应该由工具和沙箱定义。
- 对删除、写库、发请求、调用外部系统等高风险操作,要配置人工审批。
- 不是把系统权限全部交给模型,而是通过工程边界控制模型行动范围。
3.6 MCP 和外部工具接入
Deep Agents 支持自定义函数、LangChain tools,以及 MCP server 工具。对于企业客户,这意味着可以接入:
- 数据库
- 内部 API
- CRM/ERP/工单系统
- 文档库
- 搜索系统
- 文件系统
- 自动化脚本
4. 官方示意图与架构理解
4.1 官方能力总览图
这张官方文档图展示了 Deep Agents 作为 Agent Harness 覆盖的能力类别:执行环境、上下文管理、任务委派、人工干预与持续改进。
4.2 Deep Agents 与 LangChain/LangGraph 的关系
开箱即用 Harness:默认能力、middleware、backend、profile"] --> B["LangChain
模型、工具、中间件、Agent 抽象"] B --> C["LangGraph
状态、checkpoint、streaming、interrupt、持久运行时"]
可以这样理解:
- LangGraph 是底层运行时,负责状态、流式输出、checkpoint、interrupt 等。
- LangChain 提供模型、工具、中间件和 Agent 抽象。
- Deep Agents 在上层预置了一套面向复杂任务的默认组合,让开发者不用从零搭 Agent 工程骨架。
4.3 项目自带示例图:Better Harness
Better Harness 示例展示了“一个 Deep Agent 优化另一个 Agent Harness”的循环:先跑 baseline,再让外层 Agent 修改 prompt、工具、skill 或 middleware,最后用 train/holdout eval 判断是否保留修改。这对于做 Agent 自动优化、评测驱动迭代很有参考价值。
4.4 项目自带示例图:Ralph Mode

Ralph Mode 是一种自主循环模式:每一轮用新上下文启动 Agent,但通过文件系统和 Git 保留进度。它强调“上下文重置 + 文件系统记忆”的长任务模式,适合构建课程、应用、代码项目等持续推进型任务。
4.5 项目自带示例图:Text-to-SQL LangSmith Trace

这个示例体现了 Deep Agents 与 LangSmith 结合后可以做 tracing、调试和评估,对企业落地时的可观测性、问题追踪、效果评估很重要。
5. 适用场景
5.1 企业知识工作自动化
适合任务:
- 行业/竞品/政策/技术调研
- 招投标资料整理
- 售前方案初稿生成
- 多文档阅读、摘要、对比和引用
- 客户资料归档与洞察提取
客户价值:
- 把“找资料、读材料、整理结构、写初稿”的重复劳动自动化。
- 通过文件系统沉淀中间结果,可审计、可复用。
- 可结合人工审批保证最终输出质量。
5.2 软件研发与代码助手
适合任务:
- 仓库理解
- Bug 定位
- 小范围代码修改
- 测试执行与修复
- PR 总结
- 文档生成
Deep Agents Code 是官方提供的终端 coding agent,类似 Claude Code/Codex 这类交互式代码代理。对于研发型客户,可以作为“企业内部代码 Agent”的底座或参考实现。
5.3 数据分析与数据库问答
适合任务:
- Text-to-SQL
- 数据文件分析
- 自动生成分析脚本
- 结果解释与报告输出
优势在于 Agent 可以通过工具连接数据库或文件系统,并在长任务中分步完成查询、验证和解释。
5.4 多系统流程编排
适合任务:
- 工单自动处理
- CRM 线索整理
- API 调用型业务流程
- 内部运营自动化
- 多步骤审批前置准备
Deep Agents 适合做“半自动流程代理”:先由 Agent 准备、分析、生成建议,再在关键动作前让人审批。
5.5 Agent 平台和二次开发
如果客户希望建设自己的 Agent 平台,而不是只做单个机器人,Deep Agents 的 middleware、backend、subagent、skills、memory、permissions 等模块化设计有参考价值。
可以落地方向:
- 内部 Agent Harness 标准化。
- 按业务线沉淀 skills。
- 接入 MCP 形成工具市场。
- 使用 LangSmith 做 tracing/eval/monitoring。
6. 不太适合的场景
Deep Agents 并不是所有场景都需要。
| 场景 | 原因 |
|---|---|
| 简单 FAQ/RAG | 直接用 RAG 或 LangChain create_agent 更轻 |
| 极低延迟简单问答 | Deep Agents 的 harness 能力可能显得重 |
| 强确定性流程 | 传统工作流引擎/BPM 更可控 |
| 需要严格事务一致性的核心业务写操作 | Agent 应只做辅助,关键写操作需人工审批或规则系统 |
| 完全无工具调用能力的模型 | Deep Agents 依赖 tool calling 能力才能发挥价值 |
7. 怎么用
7.1 安装
uv add deepagents
或:
pip install -U deepagents
如果使用特定模型提供商,需要安装对应 LangChain 集成包,例如:
pip install -U deepagents langchain-openai
pip install -U deepagents langchain-anthropic
pip install -U deepagents langchain-google-genai
7.2 最小示例
from deepagents import create_deep_agent
def get_weather(city: str) -> str:
"""Get weather for a given city."""
return f"It's always sunny in {city}!"
agent = create_deep_agent(
model="openai:gpt-5.5",
tools=[get_weather],
system_prompt="You are a helpful assistant.",
)
result = agent.invoke({
"messages": [{"role": "user", "content": "what is the weather in sf"}]
})
7.3 面向企业 PoC 的典型接入方式
from deepagents import create_deep_agent
agent = create_deep_agent(
model="anthropic:claude-sonnet-4-6",
tools=[
search_internal_docs,
query_crm,
create_draft_report,
],
system_prompt="""
你是企业售前助手。你需要基于客户资料、产品资料和行业资料,
生成结构化调研结论、PoC 建议和销售话术。
""",
interrupt_on={
"create_draft_report": True,
},
)
7.4 使用 Deep Agents Code
官方提供了 Deep Agents Code,用于终端里的代码代理:
curl -LsSf https://langch.in/dcode | bash
这类工具适合给研发团队演示“Agent 读仓库、改代码、跑测试、生成总结”的端到端能力。
8. 售前价值总结
8.1 可以向客户传达的核心卖点
- Deep Agents 不是简单聊天框,而是可执行任务的 Agent Harness。
- 它内置复杂任务所需的工程部件:文件系统、子代理、记忆、技能、权限、审批、上下文压缩。
- 它建立在 LangGraph 之上,天然支持 streaming、checkpoint、interrupt 等生产级能力。
- 它兼容多模型,只要模型支持 tool calling,就可接入商业模型、开源模型或本地模型。
- 它适合快速做 PoC,验证企业内部 Agent 是否能真正落地到业务流程。
8.2 客户痛点映射
| 客户痛点 | Deep Agents 对应能力 |
|---|---|
| Agent 只能聊天,不能执行任务 | Tools、MCP、文件系统、代码执行 |
| 长任务容易忘上下文 | Summarization、context offloading、memory |
| 复杂任务难拆解 | Todo planning、subagents |
| 工具调用有安全风险 | Permissions、sandbox、Human-in-the-loop |
| 结果不可观测 | LangGraph streaming、LangSmith tracing/eval |
| 每个业务都要重新写 Agent 框架 | Skills、middleware、backends、profiles |
8.3 适合切入的客户类型
- 已经做过 RAG,但想进一步做“会行动的 AI 助手”的客户。
- 有大量知识工作、调研、报告、文档处理需求的客户。
- 研发团队希望引入 AI coding agent 或内部代码助手的客户。
- 希望搭建企业级 Agent 平台、工具市场、MCP 生态的客户。
- 对 Agent 安全、审批、追踪、评估有较高要求的客户。
9. PoC 建议
9.1 PoC 方向一:售前资料研究助手
目标:输入客户名称、行业和几个资料链接,Agent 自动生成客户画像、痛点分析、推荐方案、PoC 路线和销售话术。
接入工具:
- 网页抓取
- 内部知识库搜索
- 产品资料读取
- Markdown/Word 报告生成
评估指标:
- 是否覆盖客户背景与行业痛点
- 是否能引用来源
- 是否能输出可直接使用的销售材料
- 人工修改量减少多少
9.2 PoC 方向二:研发代码助手
目标:让 Agent 在一个真实仓库中完成小范围代码任务。
任务示例:
- 修复一个 bug
- 增加一个 API 参数
- 补充测试
- 更新 README
评估指标:
- 是否能正确理解仓库结构
- 是否能小范围修改而不破坏无关代码
- 是否能运行测试
- 是否能输出可审计的修改总结
9.3 PoC 方向三:数据库分析助手
目标:自然语言输入业务问题,Agent 自动生成 SQL、查询数据、解释结果并输出分析报告。
接入工具:
- 数据库只读账号
- SQL 执行工具
- 表结构说明
- 可视化或报告生成工具
安全建议:
- 初期仅开放只读权限。
- 对高成本查询设置审批。
- 所有 SQL 和结果进入审计日志。
10. 风险与注意事项
10.1 项目仍在快速演进
Deep Agents 版本更新频繁,适合快速验证,但生产落地需要:
- 锁定依赖版本
- 建立回归测试
- 明确升级策略
- 关注 breaking changes
10.2 安全边界必须由工具和沙箱承担
官方 FAQ 明确强调:Agent 能做什么取决于你给了它什么工具和权限。不能依赖模型“自觉安全”,要通过:
- 沙箱
- 权限规则
- 最小权限工具
- 人工审批
- 审计日志
来控制风险。
10.3 成本和延迟需要评估
长任务、多子代理、多工具调用会带来较高 token 成本和延迟。PoC 时应记录:
- 单任务平均耗时
- 模型调用次数
- token 消耗
- 工具调用次数
- 人工介入次数
10.4 与现有系统集成是关键工作
Deep Agents 提供 harness,但真正落地取决于能否把企业内部 API、数据库、知识库、权限系统、审批系统接进来。这部分通常是项目成败关键。
11. 竞争与替代方案视角
| 方案 | 更适合 |
|---|---|
LangChain create_agent | 轻量 Agent、简单工具调用 |
| LangGraph | 自定义复杂状态机和工作流 |
| Deep Agents | 希望快速获得完整 Agent Harness |
| AutoGen/CrewAI 等多 Agent 框架 | 偏多角色协作建模 |
| Claude Code/Codex 类代码代理 | 面向研发 coding 场景的终端体验 |
| 传统 RPA/BPM | 高确定性、强流程、低智能决策场景 |
售前建议:如果客户问“为什么不用 LangGraph 直接做”,可以回答:LangGraph 是底层运行时,自由度高但工程工作量大;Deep Agents 是在 LangGraph 上封装的默认 harness,适合更快启动 PoC。如果客户后期需要高度定制,也可以下沉到 LangGraph。
12. 推荐销售话术
面向业务负责人
Deep Agents 适合把 AI 从“回答问题”推进到“完成任务”。它能读资料、调用工具、拆解任务、写文件、生成结果,并在关键动作前让人审批,适合做调研、报告、工单、运营和流程辅助。
面向技术负责人
Deep Agents 是 LangGraph 之上的开箱即用 Agent Harness,内置文件系统、子代理、上下文管理、技能、记忆、权限和 HITL。它可以作为企业 Agent 平台 PoC 的起点,同时保留向 LangGraph 深度定制的空间。
面向安全/合规负责人
Deep Agents 本身不等于安全边界。安全应该通过工具最小权限、沙箱、文件权限、人工审批和审计日志来实现。PoC 阶段建议先从只读工具、非生产环境和人工确认流程开始。
13. 我的判断
Deep Agents 是一个非常值得关注的 Agent 工程化项目。它的核心优势不是“模型能力更强”,而是把复杂 Agent 落地时必需的工程部件预置好了:计划、文件、记忆、技能、子代理、权限、审批、流式输出、checkpoint 和 tracing。
如果客户当前还停留在“知识库问答”,Deep Agents 可以作为下一阶段“可执行任务型 AI 助手”的演示底座;如果客户已经有 LangChain/LangGraph 基础,它可以帮助团队更快沉淀统一的 Agent Harness;如果客户关注生产落地,则需要重点补齐安全、评估、成本、审计和系统集成。