Deep Agents

1. 一句话结论

Deep Agents 是 LangChain 团队推出的“带电池的 Agent 框架层”：它不是一个单纯的聊天机器人 SDK，而是在 LangGraph 运行时之上，预置了任务规划、虚拟文件系统、子代理、技能、记忆、权限控制、上下文压缩、Human-in-the-loop 等能力，适合用来快速搭建面向复杂业务流程的长任务 Agent。

对售前来说，它的价值在于：当客户已经不满足于“问答/RAG”，而是希望 AI 能完成调研、代码、数据处理、文档生成、系统操作、多步骤流程编排时，Deep Agents 可以作为 PoC 的底座，用较短时间证明“Agent 能否真的做事”。

2. 项目基本信息

维度	信息
GitHub	langchain-ai/deepagents
官方文档	Deep Agents Docs
PyPI	deepagents
开源协议	MIT
主要语言	Python
Python 要求	>=3.11, <4.0
当前 PyPI 稳定版本	0.6.12
GitHub 描述	The batteries-included agent harness.
生态依赖	LangChain、LangGraph、LangSmith
模型兼容	支持具备 tool calling 能力的模型，包括商业模型、开源模型和本地模型

截至 2026-06-30，GitHub 仓库约 25k stars、3.5k forks，更新非常活跃，说明它处在快速演进阶段，适合技术预研和 PoC，但在正式生产落地前需要锁定版本、做安全边界和稳定性验证。

3. 它主要能做什么

Deep Agents 的核心能力可以理解为“给大模型一个可控的工作环境”。

3.1 长任务执行

普通 LLM 调用通常是“一问一答”，Deep Agents 则面向多轮、多步骤、长耗时任务。它内置任务规划工具，可以维护待办事项，把复杂目标拆成多个步骤持续推进。

典型例子：

自动完成一个研究报告：搜索资料、读文档、整理结论、生成 Markdown。
自动完成代码任务：读仓库、定位问题、修改文件、运行测试、总结变更。
自动完成数据分析：读文件、写脚本、执行分析、产出图表和解释。

3.2 子代理协作

Deep Agents 内置 task 工具，可以让主 Agent 创建临时子 Agent。每个子 Agent 有独立上下文，适合处理隔离的子任务，最后只把结果返回给主 Agent。

售前价值：

面向复杂客户任务时，可以把“调研”“数据清洗”“代码检查”“报告撰写”拆成不同子代理。
减少单个上下文窗口塞满的风险。
更接近真实企业流程中的分工协作。

3.3 虚拟文件系统

Deep Agents 提供文件工具，例如：

工具	作用
`ls`	列目录
`read_file`	读取文件，支持大文件分段读取
`write_file`	写文件
`edit_file`	修改文件
`glob`	按模式查找文件
`grep`	搜索文件内容
`execute`	在沙箱后端中执行 shell 命令

这些能力让 Agent 不只是“回答”，而是能在工作区里沉淀中间结果、读写上下文、执行脚本，适合企业内部知识处理、代码处理和自动化办公场景。

3.4 上下文管理

Deep Agents 针对长任务提供了几类上下文工程能力：

Skills：按需加载专项能力和领域知识。
Memory：通过 AGENTS.md 等机制保存长期偏好、规范和项目说明。
Summarization：对长对话和大工具结果做压缩。
Context offloading：把大结果卸载到文件系统中，减少上下文窗口压力。
Subagent isolation：让子任务在隔离上下文中执行，只返回最终摘要。

这对于售前 PoC 很关键，因为客户常见痛点是：“Agent 跑一会儿就忘了前面做过什么”“工具结果太长塞爆上下文”“复杂任务越跑越乱”。Deep Agents 正是在解决这些工程问题。

3.5 权限与人工审批

Deep Agents 支持文件系统权限规则，可以限制 Agent 哪些路径能读、哪些路径能写。它也支持 Human-in-the-loop，可以在敏感工具调用前中断，让人审批、修改或拒绝。

适合对客户强调：

Agent 的能力边界应该由工具和沙箱定义。
对删除、写库、发请求、调用外部系统等高风险操作，要配置人工审批。
不是把系统权限全部交给模型，而是通过工程边界控制模型行动范围。

3.6 MCP 和外部工具接入

Deep Agents 支持自定义函数、LangChain tools，以及 MCP server 工具。对于企业客户，这意味着可以接入：

数据库
内部 API
CRM/ERP/工单系统
文档库
搜索系统
文件系统
自动化脚本

4. 官方示意图与架构理解

4.1 官方能力总览图

这张官方文档图展示了 Deep Agents 作为 Agent Harness 覆盖的能力类别：执行环境、上下文管理、任务委派、人工干预与持续改进。

4.2 Deep Agents 与 LangChain/LangGraph 的关系

flowchart TB A["Deep Agents
开箱即用 Harness：默认能力、middleware、backend、profile"] --> B["LangChain
模型、工具、中间件、Agent 抽象"] B --> C["LangGraph
状态、checkpoint、streaming、interrupt、持久运行时"]

可以这样理解：

LangGraph 是底层运行时，负责状态、流式输出、checkpoint、interrupt 等。
LangChain 提供模型、工具、中间件和 Agent 抽象。
Deep Agents 在上层预置了一套面向复杂任务的默认组合，让开发者不用从零搭 Agent 工程骨架。

4.3 项目自带示例图：Better Harness

Better Harness 示例展示了“一个 Deep Agent 优化另一个 Agent Harness”的循环：先跑 baseline，再让外层 Agent 修改 prompt、工具、skill 或 middleware，最后用 train/holdout eval 判断是否保留修改。这对于做 Agent 自动优化、评测驱动迭代很有参考价值。

4.4 项目自带示例图：Ralph Mode

Ralph Mode 是一种自主循环模式：每一轮用新上下文启动 Agent，但通过文件系统和 Git 保留进度。它强调“上下文重置 + 文件系统记忆”的长任务模式，适合构建课程、应用、代码项目等持续推进型任务。

4.5 项目自带示例图：Text-to-SQL LangSmith Trace

这个示例体现了 Deep Agents 与 LangSmith 结合后可以做 tracing、调试和评估，对企业落地时的可观测性、问题追踪、效果评估很重要。

5. 适用场景

5.1 企业知识工作自动化

适合任务：

行业/竞品/政策/技术调研
招投标资料整理
售前方案初稿生成
多文档阅读、摘要、对比和引用
客户资料归档与洞察提取

客户价值：

把“找资料、读材料、整理结构、写初稿”的重复劳动自动化。
通过文件系统沉淀中间结果，可审计、可复用。
可结合人工审批保证最终输出质量。

5.2 软件研发与代码助手

适合任务：

仓库理解
Bug 定位
小范围代码修改
测试执行与修复
PR 总结
文档生成

Deep Agents Code 是官方提供的终端 coding agent，类似 Claude Code/Codex 这类交互式代码代理。对于研发型客户，可以作为“企业内部代码 Agent”的底座或参考实现。

5.3 数据分析与数据库问答

适合任务：

Text-to-SQL
数据文件分析
自动生成分析脚本
结果解释与报告输出

优势在于 Agent 可以通过工具连接数据库或文件系统，并在长任务中分步完成查询、验证和解释。

5.4 多系统流程编排

适合任务：

工单自动处理
CRM 线索整理
API 调用型业务流程
内部运营自动化
多步骤审批前置准备

Deep Agents 适合做“半自动流程代理”：先由 Agent 准备、分析、生成建议，再在关键动作前让人审批。

5.5 Agent 平台和二次开发

如果客户希望建设自己的 Agent 平台，而不是只做单个机器人，Deep Agents 的 middleware、backend、subagent、skills、memory、permissions 等模块化设计有参考价值。

可以落地方向：

内部 Agent Harness 标准化。
按业务线沉淀 skills。
接入 MCP 形成工具市场。
使用 LangSmith 做 tracing/eval/monitoring。

6. 不太适合的场景

Deep Agents 并不是所有场景都需要。

场景	原因
简单 FAQ/RAG	直接用 RAG 或 LangChain `create_agent` 更轻
极低延迟简单问答	Deep Agents 的 harness 能力可能显得重
强确定性流程	传统工作流引擎/BPM 更可控
需要严格事务一致性的核心业务写操作	Agent 应只做辅助，关键写操作需人工审批或规则系统
完全无工具调用能力的模型	Deep Agents 依赖 tool calling 能力才能发挥价值

7. 怎么用

7.1 安装

uv add deepagents

或：

pip install -U deepagents

如果使用特定模型提供商，需要安装对应 LangChain 集成包，例如：

pip install -U deepagents langchain-openai
pip install -U deepagents langchain-anthropic
pip install -U deepagents langchain-google-genai

7.2 最小示例

from deepagents import create_deep_agent

def get_weather(city: str) -> str:
    """Get weather for a given city."""
    return f"It's always sunny in {city}!"

agent = create_deep_agent(
    model="openai:gpt-5.5",
    tools=[get_weather],
    system_prompt="You are a helpful assistant.",
)

result = agent.invoke({
    "messages": [{"role": "user", "content": "what is the weather in sf"}]
})

7.3 面向企业 PoC 的典型接入方式

from deepagents import create_deep_agent

agent = create_deep_agent(
    model="anthropic:claude-sonnet-4-6",
    tools=[
        search_internal_docs,
        query_crm,
        create_draft_report,
    ],
    system_prompt="""
你是企业售前助手。你需要基于客户资料、产品资料和行业资料，
生成结构化调研结论、PoC 建议和销售话术。
""",
    interrupt_on={
        "create_draft_report": True,
    },
)

7.4 使用 Deep Agents Code

官方提供了 Deep Agents Code，用于终端里的代码代理：

curl -LsSf https://langch.in/dcode | bash

这类工具适合给研发团队演示“Agent 读仓库、改代码、跑测试、生成总结”的端到端能力。

8. 售前价值总结

8.1 可以向客户传达的核心卖点

Deep Agents 不是简单聊天框，而是可执行任务的 Agent Harness。
它内置复杂任务所需的工程部件：文件系统、子代理、记忆、技能、权限、审批、上下文压缩。
它建立在 LangGraph 之上，天然支持 streaming、checkpoint、interrupt 等生产级能力。
它兼容多模型，只要模型支持 tool calling，就可接入商业模型、开源模型或本地模型。
它适合快速做 PoC，验证企业内部 Agent 是否能真正落地到业务流程。

8.2 客户痛点映射

客户痛点	Deep Agents 对应能力
Agent 只能聊天，不能执行任务	Tools、MCP、文件系统、代码执行
长任务容易忘上下文	Summarization、context offloading、memory
复杂任务难拆解	Todo planning、subagents
工具调用有安全风险	Permissions、sandbox、Human-in-the-loop
结果不可观测	LangGraph streaming、LangSmith tracing/eval
每个业务都要重新写 Agent 框架	Skills、middleware、backends、profiles

8.3 适合切入的客户类型

已经做过 RAG，但想进一步做“会行动的 AI 助手”的客户。
有大量知识工作、调研、报告、文档处理需求的客户。
研发团队希望引入 AI coding agent 或内部代码助手的客户。
希望搭建企业级 Agent 平台、工具市场、MCP 生态的客户。
对 Agent 安全、审批、追踪、评估有较高要求的客户。

9. PoC 建议

9.1 PoC 方向一：售前资料研究助手

目标：输入客户名称、行业和几个资料链接，Agent 自动生成客户画像、痛点分析、推荐方案、PoC 路线和销售话术。

接入工具：

网页抓取
内部知识库搜索
产品资料读取
Markdown/Word 报告生成

评估指标：

是否覆盖客户背景与行业痛点
是否能引用来源
是否能输出可直接使用的销售材料
人工修改量减少多少

9.2 PoC 方向二：研发代码助手

目标：让 Agent 在一个真实仓库中完成小范围代码任务。

任务示例：

修复一个 bug
增加一个 API 参数
补充测试
更新 README

评估指标：

是否能正确理解仓库结构
是否能小范围修改而不破坏无关代码
是否能运行测试
是否能输出可审计的修改总结

9.3 PoC 方向三：数据库分析助手

目标：自然语言输入业务问题，Agent 自动生成 SQL、查询数据、解释结果并输出分析报告。

接入工具：

数据库只读账号
SQL 执行工具
表结构说明
可视化或报告生成工具

安全建议：

初期仅开放只读权限。
对高成本查询设置审批。
所有 SQL 和结果进入审计日志。

10. 风险与注意事项

10.1 项目仍在快速演进

Deep Agents 版本更新频繁，适合快速验证，但生产落地需要：

锁定依赖版本
建立回归测试
明确升级策略
关注 breaking changes

10.2 安全边界必须由工具和沙箱承担

官方 FAQ 明确强调：Agent 能做什么取决于你给了它什么工具和权限。不能依赖模型“自觉安全”，要通过：

沙箱
权限规则
最小权限工具
人工审批
审计日志

来控制风险。

10.3 成本和延迟需要评估

长任务、多子代理、多工具调用会带来较高 token 成本和延迟。PoC 时应记录：

单任务平均耗时
模型调用次数
token 消耗
工具调用次数
人工介入次数

10.4 与现有系统集成是关键工作

Deep Agents 提供 harness，但真正落地取决于能否把企业内部 API、数据库、知识库、权限系统、审批系统接进来。这部分通常是项目成败关键。

11. 竞争与替代方案视角

方案	更适合
LangChain `create_agent`	轻量 Agent、简单工具调用
LangGraph	自定义复杂状态机和工作流
Deep Agents	希望快速获得完整 Agent Harness
AutoGen/CrewAI 等多 Agent 框架	偏多角色协作建模
Claude Code/Codex 类代码代理	面向研发 coding 场景的终端体验
传统 RPA/BPM	高确定性、强流程、低智能决策场景

售前建议：如果客户问“为什么不用 LangGraph 直接做”，可以回答：LangGraph 是底层运行时，自由度高但工程工作量大；Deep Agents 是在 LangGraph 上封装的默认 harness，适合更快启动 PoC。如果客户后期需要高度定制，也可以下沉到 LangGraph。

12. 推荐销售话术

面向业务负责人

Deep Agents 适合把 AI 从“回答问题”推进到“完成任务”。它能读资料、调用工具、拆解任务、写文件、生成结果，并在关键动作前让人审批，适合做调研、报告、工单、运营和流程辅助。

面向技术负责人

Deep Agents 是 LangGraph 之上的开箱即用 Agent Harness，内置文件系统、子代理、上下文管理、技能、记忆、权限和 HITL。它可以作为企业 Agent 平台 PoC 的起点，同时保留向 LangGraph 深度定制的空间。

面向安全/合规负责人

Deep Agents 本身不等于安全边界。安全应该通过工具最小权限、沙箱、文件权限、人工审批和审计日志来实现。PoC 阶段建议先从只读工具、非生产环境和人工确认流程开始。

13. 我的判断

Deep Agents 是一个非常值得关注的 Agent 工程化项目。它的核心优势不是“模型能力更强”，而是把复杂 Agent 落地时必需的工程部件预置好了：计划、文件、记忆、技能、子代理、权限、审批、流式输出、checkpoint 和 tracing。

如果客户当前还停留在“知识库问答”，Deep Agents 可以作为下一阶段“可执行任务型 AI 助手”的演示底座；如果客户已经有 LangChain/LangGraph 基础，它可以帮助团队更快沉淀统一的 Agent Harness；如果客户关注生产落地，则需要重点补齐安全、评估、成本、审计和系统集成。

1. 一句话结论

2. 项目基本信息

3. 它主要能做什么

3.1 长任务执行

3.2 子代理协作

3.3 虚拟文件系统

3.4 上下文管理

3.5 权限与人工审批

3.6 MCP 和外部工具接入

4. 官方示意图与架构理解

4.1 官方能力总览图

4.2 Deep Agents 与 LangChain/LangGraph 的关系

4.3 项目自带示例图：Better Harness

4.4 项目自带示例图：Ralph Mode

4.5 项目自带示例图：Text-to-SQL LangSmith Trace

5. 适用场景

5.1 企业知识工作自动化

5.2 软件研发与代码助手

5.3 数据分析与数据库问答

5.4 多系统流程编排

5.5 Agent 平台和二次开发

6. 不太适合的场景

7. 怎么用

7.1 安装

7.2 最小示例

7.3 面向企业 PoC 的典型接入方式

7.4 使用 Deep Agents Code

8. 售前价值总结

8.1 可以向客户传达的核心卖点

8.2 客户痛点映射

8.3 适合切入的客户类型

9. PoC 建议

9.1 PoC 方向一：售前资料研究助手

9.2 PoC 方向二：研发代码助手

9.3 PoC 方向三：数据库分析助手

10. 风险与注意事项

10.1 项目仍在快速演进

10.2 安全边界必须由工具和沙箱承担

10.3 成本和延迟需要评估

10.4 与现有系统集成是关键工作

11. 竞争与替代方案视角

12. 推荐销售话术

面向业务负责人

面向技术负责人

面向安全/合规负责人

13. 我的判断

14. 参考资料