← 返回项目列表

1. 一句话结论

Deep Agents 是 LangChain 团队推出的“带电池的 Agent 框架层”:它不是一个单纯的聊天机器人 SDK,而是在 LangGraph 运行时之上,预置了任务规划、虚拟文件系统、子代理、技能、记忆、权限控制、上下文压缩、Human-in-the-loop 等能力,适合用来快速搭建面向复杂业务流程的长任务 Agent。

对售前来说,它的价值在于:当客户已经不满足于“问答/RAG”,而是希望 AI 能完成调研、代码、数据处理、文档生成、系统操作、多步骤流程编排时,Deep Agents 可以作为 PoC 的底座,用较短时间证明“Agent 能否真的做事”。

2. 项目基本信息

维度信息
GitHublangchain-ai/deepagents
官方文档Deep Agents Docs
PyPIdeepagents
开源协议MIT
主要语言Python
Python 要求>=3.11, <4.0
当前 PyPI 稳定版本0.6.12
GitHub 描述The batteries-included agent harness.
生态依赖LangChain、LangGraph、LangSmith
模型兼容支持具备 tool calling 能力的模型,包括商业模型、开源模型和本地模型

截至 2026-06-30,GitHub 仓库约 25k stars、3.5k forks,更新非常活跃,说明它处在快速演进阶段,适合技术预研和 PoC,但在正式生产落地前需要锁定版本、做安全边界和稳定性验证。

3. 它主要能做什么

Deep Agents 的核心能力可以理解为“给大模型一个可控的工作环境”。

3.1 长任务执行

普通 LLM 调用通常是“一问一答”,Deep Agents 则面向多轮、多步骤、长耗时任务。它内置任务规划工具,可以维护待办事项,把复杂目标拆成多个步骤持续推进。

典型例子:

  • 自动完成一个研究报告:搜索资料、读文档、整理结论、生成 Markdown。
  • 自动完成代码任务:读仓库、定位问题、修改文件、运行测试、总结变更。
  • 自动完成数据分析:读文件、写脚本、执行分析、产出图表和解释。

3.2 子代理协作

Deep Agents 内置 task 工具,可以让主 Agent 创建临时子 Agent。每个子 Agent 有独立上下文,适合处理隔离的子任务,最后只把结果返回给主 Agent。

售前价值:

  • 面向复杂客户任务时,可以把“调研”“数据清洗”“代码检查”“报告撰写”拆成不同子代理。
  • 减少单个上下文窗口塞满的风险。
  • 更接近真实企业流程中的分工协作。

3.3 虚拟文件系统

Deep Agents 提供文件工具,例如:

工具作用
ls列目录
read_file读取文件,支持大文件分段读取
write_file写文件
edit_file修改文件
glob按模式查找文件
grep搜索文件内容
execute在沙箱后端中执行 shell 命令

这些能力让 Agent 不只是“回答”,而是能在工作区里沉淀中间结果、读写上下文、执行脚本,适合企业内部知识处理、代码处理和自动化办公场景。

3.4 上下文管理

Deep Agents 针对长任务提供了几类上下文工程能力:

  • Skills:按需加载专项能力和领域知识。
  • Memory:通过 AGENTS.md 等机制保存长期偏好、规范和项目说明。
  • Summarization:对长对话和大工具结果做压缩。
  • Context offloading:把大结果卸载到文件系统中,减少上下文窗口压力。
  • Subagent isolation:让子任务在隔离上下文中执行,只返回最终摘要。

这对于售前 PoC 很关键,因为客户常见痛点是:“Agent 跑一会儿就忘了前面做过什么”“工具结果太长塞爆上下文”“复杂任务越跑越乱”。Deep Agents 正是在解决这些工程问题。

3.5 权限与人工审批

Deep Agents 支持文件系统权限规则,可以限制 Agent 哪些路径能读、哪些路径能写。它也支持 Human-in-the-loop,可以在敏感工具调用前中断,让人审批、修改或拒绝。

适合对客户强调:

  • Agent 的能力边界应该由工具和沙箱定义。
  • 对删除、写库、发请求、调用外部系统等高风险操作,要配置人工审批。
  • 不是把系统权限全部交给模型,而是通过工程边界控制模型行动范围。

3.6 MCP 和外部工具接入

Deep Agents 支持自定义函数、LangChain tools,以及 MCP server 工具。对于企业客户,这意味着可以接入:

  • 数据库
  • 内部 API
  • CRM/ERP/工单系统
  • 文档库
  • 搜索系统
  • 文件系统
  • 自动化脚本

4. 官方示意图与架构理解

4.1 官方能力总览图

这张官方文档图展示了 Deep Agents 作为 Agent Harness 覆盖的能力类别:执行环境、上下文管理、任务委派、人工干预与持续改进。

4.2 Deep Agents 与 LangChain/LangGraph 的关系

flowchart TB A["Deep Agents
开箱即用 Harness:默认能力、middleware、backend、profile"] --> B["LangChain
模型、工具、中间件、Agent 抽象"] B --> C["LangGraph
状态、checkpoint、streaming、interrupt、持久运行时"]

可以这样理解:

  • LangGraph 是底层运行时,负责状态、流式输出、checkpoint、interrupt 等。
  • LangChain 提供模型、工具、中间件和 Agent 抽象。
  • Deep Agents 在上层预置了一套面向复杂任务的默认组合,让开发者不用从零搭 Agent 工程骨架。

4.3 项目自带示例图:Better Harness

Better Harness 示例展示了“一个 Deep Agent 优化另一个 Agent Harness”的循环:先跑 baseline,再让外层 Agent 修改 prompt、工具、skill 或 middleware,最后用 train/holdout eval 判断是否保留修改。这对于做 Agent 自动优化、评测驱动迭代很有参考价值。

4.4 项目自带示例图:Ralph Mode

Ralph Mode 是一种自主循环模式:每一轮用新上下文启动 Agent,但通过文件系统和 Git 保留进度。它强调“上下文重置 + 文件系统记忆”的长任务模式,适合构建课程、应用、代码项目等持续推进型任务。

4.5 项目自带示例图:Text-to-SQL LangSmith Trace

这个示例体现了 Deep Agents 与 LangSmith 结合后可以做 tracing、调试和评估,对企业落地时的可观测性、问题追踪、效果评估很重要。

5. 适用场景

5.1 企业知识工作自动化

适合任务:

  • 行业/竞品/政策/技术调研
  • 招投标资料整理
  • 售前方案初稿生成
  • 多文档阅读、摘要、对比和引用
  • 客户资料归档与洞察提取

客户价值:

  • 把“找资料、读材料、整理结构、写初稿”的重复劳动自动化。
  • 通过文件系统沉淀中间结果,可审计、可复用。
  • 可结合人工审批保证最终输出质量。

5.2 软件研发与代码助手

适合任务:

  • 仓库理解
  • Bug 定位
  • 小范围代码修改
  • 测试执行与修复
  • PR 总结
  • 文档生成

Deep Agents Code 是官方提供的终端 coding agent,类似 Claude Code/Codex 这类交互式代码代理。对于研发型客户,可以作为“企业内部代码 Agent”的底座或参考实现。

5.3 数据分析与数据库问答

适合任务:

  • Text-to-SQL
  • 数据文件分析
  • 自动生成分析脚本
  • 结果解释与报告输出

优势在于 Agent 可以通过工具连接数据库或文件系统,并在长任务中分步完成查询、验证和解释。

5.4 多系统流程编排

适合任务:

  • 工单自动处理
  • CRM 线索整理
  • API 调用型业务流程
  • 内部运营自动化
  • 多步骤审批前置准备

Deep Agents 适合做“半自动流程代理”:先由 Agent 准备、分析、生成建议,再在关键动作前让人审批。

5.5 Agent 平台和二次开发

如果客户希望建设自己的 Agent 平台,而不是只做单个机器人,Deep Agents 的 middleware、backend、subagent、skills、memory、permissions 等模块化设计有参考价值。

可以落地方向:

  • 内部 Agent Harness 标准化。
  • 按业务线沉淀 skills。
  • 接入 MCP 形成工具市场。
  • 使用 LangSmith 做 tracing/eval/monitoring。

6. 不太适合的场景

Deep Agents 并不是所有场景都需要。

场景原因
简单 FAQ/RAG直接用 RAG 或 LangChain create_agent 更轻
极低延迟简单问答Deep Agents 的 harness 能力可能显得重
强确定性流程传统工作流引擎/BPM 更可控
需要严格事务一致性的核心业务写操作Agent 应只做辅助,关键写操作需人工审批或规则系统
完全无工具调用能力的模型Deep Agents 依赖 tool calling 能力才能发挥价值

7. 怎么用

7.1 安装

uv add deepagents

或:

pip install -U deepagents

如果使用特定模型提供商,需要安装对应 LangChain 集成包,例如:

pip install -U deepagents langchain-openai
pip install -U deepagents langchain-anthropic
pip install -U deepagents langchain-google-genai

7.2 最小示例

from deepagents import create_deep_agent

def get_weather(city: str) -> str:
    """Get weather for a given city."""
    return f"It's always sunny in {city}!"

agent = create_deep_agent(
    model="openai:gpt-5.5",
    tools=[get_weather],
    system_prompt="You are a helpful assistant.",
)

result = agent.invoke({
    "messages": [{"role": "user", "content": "what is the weather in sf"}]
})

7.3 面向企业 PoC 的典型接入方式

from deepagents import create_deep_agent

agent = create_deep_agent(
    model="anthropic:claude-sonnet-4-6",
    tools=[
        search_internal_docs,
        query_crm,
        create_draft_report,
    ],
    system_prompt="""
你是企业售前助手。你需要基于客户资料、产品资料和行业资料,
生成结构化调研结论、PoC 建议和销售话术。
""",
    interrupt_on={
        "create_draft_report": True,
    },
)

7.4 使用 Deep Agents Code

官方提供了 Deep Agents Code,用于终端里的代码代理:

curl -LsSf https://langch.in/dcode | bash

这类工具适合给研发团队演示“Agent 读仓库、改代码、跑测试、生成总结”的端到端能力。

8. 售前价值总结

8.1 可以向客户传达的核心卖点

  1. Deep Agents 不是简单聊天框,而是可执行任务的 Agent Harness。
  2. 它内置复杂任务所需的工程部件:文件系统、子代理、记忆、技能、权限、审批、上下文压缩。
  3. 它建立在 LangGraph 之上,天然支持 streaming、checkpoint、interrupt 等生产级能力。
  4. 它兼容多模型,只要模型支持 tool calling,就可接入商业模型、开源模型或本地模型。
  5. 它适合快速做 PoC,验证企业内部 Agent 是否能真正落地到业务流程。

8.2 客户痛点映射

客户痛点Deep Agents 对应能力
Agent 只能聊天,不能执行任务Tools、MCP、文件系统、代码执行
长任务容易忘上下文Summarization、context offloading、memory
复杂任务难拆解Todo planning、subagents
工具调用有安全风险Permissions、sandbox、Human-in-the-loop
结果不可观测LangGraph streaming、LangSmith tracing/eval
每个业务都要重新写 Agent 框架Skills、middleware、backends、profiles

8.3 适合切入的客户类型

  • 已经做过 RAG,但想进一步做“会行动的 AI 助手”的客户。
  • 有大量知识工作、调研、报告、文档处理需求的客户。
  • 研发团队希望引入 AI coding agent 或内部代码助手的客户。
  • 希望搭建企业级 Agent 平台、工具市场、MCP 生态的客户。
  • 对 Agent 安全、审批、追踪、评估有较高要求的客户。

9. PoC 建议

9.1 PoC 方向一:售前资料研究助手

目标:输入客户名称、行业和几个资料链接,Agent 自动生成客户画像、痛点分析、推荐方案、PoC 路线和销售话术。

接入工具:

  • 网页抓取
  • 内部知识库搜索
  • 产品资料读取
  • Markdown/Word 报告生成

评估指标:

  • 是否覆盖客户背景与行业痛点
  • 是否能引用来源
  • 是否能输出可直接使用的销售材料
  • 人工修改量减少多少

9.2 PoC 方向二:研发代码助手

目标:让 Agent 在一个真实仓库中完成小范围代码任务。

任务示例:

  • 修复一个 bug
  • 增加一个 API 参数
  • 补充测试
  • 更新 README

评估指标:

  • 是否能正确理解仓库结构
  • 是否能小范围修改而不破坏无关代码
  • 是否能运行测试
  • 是否能输出可审计的修改总结

9.3 PoC 方向三:数据库分析助手

目标:自然语言输入业务问题,Agent 自动生成 SQL、查询数据、解释结果并输出分析报告。

接入工具:

  • 数据库只读账号
  • SQL 执行工具
  • 表结构说明
  • 可视化或报告生成工具

安全建议:

  • 初期仅开放只读权限。
  • 对高成本查询设置审批。
  • 所有 SQL 和结果进入审计日志。

10. 风险与注意事项

10.1 项目仍在快速演进

Deep Agents 版本更新频繁,适合快速验证,但生产落地需要:

  • 锁定依赖版本
  • 建立回归测试
  • 明确升级策略
  • 关注 breaking changes

10.2 安全边界必须由工具和沙箱承担

官方 FAQ 明确强调:Agent 能做什么取决于你给了它什么工具和权限。不能依赖模型“自觉安全”,要通过:

  • 沙箱
  • 权限规则
  • 最小权限工具
  • 人工审批
  • 审计日志

来控制风险。

10.3 成本和延迟需要评估

长任务、多子代理、多工具调用会带来较高 token 成本和延迟。PoC 时应记录:

  • 单任务平均耗时
  • 模型调用次数
  • token 消耗
  • 工具调用次数
  • 人工介入次数

10.4 与现有系统集成是关键工作

Deep Agents 提供 harness,但真正落地取决于能否把企业内部 API、数据库、知识库、权限系统、审批系统接进来。这部分通常是项目成败关键。

11. 竞争与替代方案视角

方案更适合
LangChain create_agent轻量 Agent、简单工具调用
LangGraph自定义复杂状态机和工作流
Deep Agents希望快速获得完整 Agent Harness
AutoGen/CrewAI 等多 Agent 框架偏多角色协作建模
Claude Code/Codex 类代码代理面向研发 coding 场景的终端体验
传统 RPA/BPM高确定性、强流程、低智能决策场景

售前建议:如果客户问“为什么不用 LangGraph 直接做”,可以回答:LangGraph 是底层运行时,自由度高但工程工作量大;Deep Agents 是在 LangGraph 上封装的默认 harness,适合更快启动 PoC。如果客户后期需要高度定制,也可以下沉到 LangGraph。

12. 推荐销售话术

面向业务负责人

Deep Agents 适合把 AI 从“回答问题”推进到“完成任务”。它能读资料、调用工具、拆解任务、写文件、生成结果,并在关键动作前让人审批,适合做调研、报告、工单、运营和流程辅助。

面向技术负责人

Deep Agents 是 LangGraph 之上的开箱即用 Agent Harness,内置文件系统、子代理、上下文管理、技能、记忆、权限和 HITL。它可以作为企业 Agent 平台 PoC 的起点,同时保留向 LangGraph 深度定制的空间。

面向安全/合规负责人

Deep Agents 本身不等于安全边界。安全应该通过工具最小权限、沙箱、文件权限、人工审批和审计日志来实现。PoC 阶段建议先从只读工具、非生产环境和人工确认流程开始。

13. 我的判断

Deep Agents 是一个非常值得关注的 Agent 工程化项目。它的核心优势不是“模型能力更强”,而是把复杂 Agent 落地时必需的工程部件预置好了:计划、文件、记忆、技能、子代理、权限、审批、流式输出、checkpoint 和 tracing。

如果客户当前还停留在“知识库问答”,Deep Agents 可以作为下一阶段“可执行任务型 AI 助手”的演示底座;如果客户已经有 LangChain/LangGraph 基础,它可以帮助团队更快沉淀统一的 Agent Harness;如果客户关注生产落地,则需要重点补齐安全、评估、成本、审计和系统集成。