← 返回项目列表
DeerFlow 是字节跳动开源的 Super Agent Harness,从早期 Deep Research 框架升级为面向研究、代码、内容创作和长任务执行的全栈 Agent 运行环境。它把 sub-agents、memory、sandbox、skills、工具、MCP、Web UI、TUI、IM 渠道和可观测性组合在一起,适合用于企业级“能做事的 Agent”PoC。售前视角下,它尤其适合拿来讲“从问答/RAG 走向长任务自动化”的升级路径。

1. 项目概览

维度信息
项目名称DeerFlow
GitHubbytedance/deer-flow
官网deerflow.tech
项目定位开源 Super Agent Harness
核心描述An open-source long-horizon SuperAgent harness that researches, codes, and creates
开源协议MIT
技术栈Python、TypeScript、LangGraph、LangChain、FastAPI、Next.js、Nginx、Docker Sandbox
Python 要求README 标注 Python 3.12+
Node.js 要求README 标注 Node.js 22+
最新 Releasev2.0.0,2026-06-25 发布
当前活跃度2026-06-30 检查:约 75.5k stars、10.2k forks、589 issues、401 PR
重要说明DeerFlow 2.0 是彻底重写,与 v1 不共用代码;v1 Deep Research 框架维护在 main-1.x 分支

DeerFlow 的全称是 Deep Exploration and Efficient Research Flow。它最早是 Deep Research 框架,后来社区把它扩展到数据流水线、演示文稿生成、Dashboard、内容自动化等更多场景,于是 2.0 被重构为更通用的 Super Agent Harness。

售前可以把它解释为:一个给大模型配备“工作环境、长期记忆、技能体系、文件系统、工具和子代理”的开源 Agent 平台底座。

2. 它主要能做什么

2.1 深度研究与报告生成

DeerFlow 继承了 Deep Research 的核心能力,可以围绕一个复杂问题进行资料搜索、网页抓取、信息整理、多角度分析,并输出报告。

适合场景:

场景价值
行业研究自动收集公开资料,形成结构化行业洞察
竞品分析比较多个产品的定位、能力、价格、生态
政策/法规跟踪汇总政策原文、提炼影响、形成行动建议
售前资料准备生成客户背景、痛点、方案建议、PoC 路线

2.2 长任务执行

官网强调 DeerFlow 可以处理从几分钟到几小时不等的任务。它通过规划、子任务拆解、文件系统、记忆和 sandbox 执行环境支撑长链路任务。

典型任务:

  • 研究一个开源项目并生成分析报告。
  • 读取上传资料并生成 PPT 或网页。
  • 编写一个小型应用或脚本。
  • 分析数据文件并产出图表与解释。
  • 多轮迭代一个内容项目或技术方案。

2.3 Sub-agents 并行协作

DeerFlow 的 lead agent 可以动态拉起 sub-agents。每个 sub-agent 拥有独立上下文、工具和终止条件,可以并行处理不同方向,最后由 lead agent 汇总。

售前表达:

DeerFlow 不只是单个 Agent 在一个上下文里硬撑,而是可以把复杂任务拆成多个子任务,让不同子代理并行研究、执行和汇总,更适合复杂业务场景。

2.4 Sandbox 与文件系统

DeerFlow 给 Agent 提供可执行环境。每个任务都有隔离的工作目录,包括上传文件、工作区和输出目录:

/mnt/user-data/
├── uploads/          ← 用户上传文件
├── workspace/        ← Agent 工作目录
└── outputs/          ← 最终交付物

它支持:

  • 读写文件
  • 编辑文件
  • 执行 bash 或代码
  • 查看图片
  • 生成最终交付物
  • 在 Docker 或 Kubernetes 相关模式下隔离执行环境

这使它从“会调用工具的聊天机器人”更接近“有一台可控电脑的 Agent”。

2.5 Skills 与工具扩展

DeerFlow 支持标准 Agent Skill。Skill 通常是一个 SKILL.md,可以包含工作流、最佳实践、参考资料、脚本和模板。

内置和适配方向包括:

  • research
  • report-generation
  • slide-creation
  • web-page
  • image-generation
  • video-generation
  • claude-to-deerflow

示例结构:

/mnt/skills/public
├── research/SKILL.md
├── report-generation/SKILL.md
├── slide-creation/SKILL.md
├── web-page/SKILL.md
└── image-generation/SKILL.md

/mnt/skills/custom
└── your-custom-skill/SKILL.md

核心价值:企业可以把内部方法论、行业知识、交付模板、售前流程固化为 Skill,形成可复用的 Agent 能力库。

2.6 长期记忆

DeerFlow 支持跨会话记忆,逐步积累用户画像、偏好、背景知识、工作习惯和常用流程。

适合用于:

  • 个人工作助手
  • 团队知识助手
  • 长期客户跟进助手
  • 固定业务流程自动化助手

2.7 多端入口

DeerFlow 不只是后端 SDK,它提供多个使用入口:

入口说明
Web UINext.js 前端,通过 Nginx 统一入口访问
Gateway APIFastAPI REST + LangGraph-compatible agent runtime
Embedded Python Client不启动完整 HTTP 服务也能嵌入 Python 使用
Terminal Workbench / TUI面向终端用户的交互式工作台
IM ChannelsTelegram、Slack、飞书/Lark、企业微信、钉钉、微信等渠道接入
Claude Code Skill通过 claude-to-deerflow skill 从 Claude Code 直接控制 DeerFlow

3. 项目自带示意图和官方视觉资料

3.1 官网定位图与演示入口

官网把 DeerFlow 描述为:开放源码 SuperAgent Harness,可以研究、编码和创作;借助 sandbox、memory、tools、skills 和 subagents 处理不同层级的长任务。

3.2 InfoQuest 集成图

DeerFlow README 中展示了 BytePlus InfoQuest 搜索与抓取工具集成。

售前含义:DeerFlow 在“深度研究”场景中不只依赖模型本身,还强调搜索、抓取和资料获取能力。对于客户的公开网页研究、竞品调研、行业信息收集,这类工具链是关键。

3.3 TUI 官方预览图

DeerFlow 项目自带 Terminal Workbench 预览图:

售前含义:它不仅有 Web 体验,也支持终端原生工作流,适合研发、数据、运维和 Agent 工程团队。

3.4 Star History

README 内置 Star History 图:

售前含义:社区关注度高,可以作为开源成熟度和生态热度的辅助证据,但不能等同于生产稳定性。

3.5 后端架构示意

项目后端 README 给出的核心架构可以概括为:

flowchart TB U["用户 / Web / TUI / IM / API"] --> N["Nginx
统一入口 :2026"] N --> F["Frontend
Next.js :3000"] N --> G["Gateway API
FastAPI :8001"] G --> R["Embedded LangGraph-compatible Agent Runtime"] R --> L["Lead Agent"] L --> M["Middleware Chain"] L --> T["Tools / MCP / Skills / Sandbox / Subagents"] T --> S["Sandbox FS
uploads / workspace / outputs"] T --> O["Observability
LangSmith / Langfuse"]

关键点:

  • /api/langgraph/* 由 Nginx 转发到 Gateway 的 LangGraph-compatible API。
  • Gateway 同时承担 REST API 和 Agent Runtime。
  • Lead Agent 通过 middleware chain 组合上下文、上传文件、sandbox、记忆、技能、子代理和澄清流程。

4. 核心能力清单

能力说明售前价值
Deep Research搜索、抓取、整理、报告生成从“资料收集”到“报告初稿”自动化
Long-horizon Agent支持分钟到小时级任务可演示复杂业务自动化
Sub-agents动态拆分子任务,可并行处理适合复杂调研、内容生产和研发任务
Sandbox隔离执行命令、代码和文件操作比普通聊天机器人更像执行型 Agent
File System上传、工作区、输出目录中间结果可沉淀、可追踪、可交付
Skills可扩展工作流模块可沉淀行业/客户/交付方法论
MCP支持外部工具和服务接入可连接企业内部系统
Memory跨会话记忆适合个人/团队长期助手
Web UI面向普通用户便于业务演示
TUI面向终端用户便于研发和技术团队使用
IM Channels接入 Slack、飞书、企业微信等贴近企业日常协作入口
ObservabilityLangSmith、Langfuse支持 trace、排错和评估
Multi-model支持 OpenAI-compatible、DeepSeek、OpenAI、Gemini、Doubao 等不绑定单一模型,适合私有化/多模型策略

5. 适用场景

5.1 售前和解决方案团队

DeerFlow 很适合做“售前研究助手”:

  • 输入客户名称、行业、官网和公开资料。
  • 自动完成客户背景、业务痛点、竞品动态、行业趋势整理。
  • 输出售前拜访提纲、PoC 建议、方案结构和演示话术。

优势:

  • 可以把售前方法论做成 skills。
  • 可以把结果写到文件系统,形成可交付材料。
  • 可以通过 Web UI 或 IM 入口降低使用门槛。

5.2 企业知识工作自动化

适合部门:

  • 市场研究
  • 战略分析
  • 咨询顾问
  • 法务/合规初筛
  • 产品运营
  • 内容团队

典型任务:

  • 行业报告初稿
  • 政策影响摘要
  • 竞品资料库
  • 客户资料整理
  • 多文档分析
  • 网页/报告/PPT 生成

5.3 研发与技术团队

适合任务:

  • 代码仓库理解
  • 小型功能实现
  • Bug 定位
  • 生成脚本和工具
  • 代码文档与架构说明
  • 通过 TUI 或 API 接入开发流程

项目支持 Codex CLI、Claude Code OAuth、ACP agent、MCP Server、Docker sandbox,对技术团队会比较有吸引力。

5.4 企业级 Agent 平台 PoC

如果客户想建设内部 Agent 平台,而不只是做单个机器人,DeerFlow 可以作为参考底座:

  • 统一模型配置
  • 统一工具配置
  • 统一技能库
  • 统一 sandbox 执行
  • 统一 Web / API / IM 入口
  • 统一 trace 和 memory 管理

5.5 多端企业助手

DeerFlow 支持 Telegram、Slack、飞书/Lark、企业微信、钉钉、微信等 IM 渠道。对于已经高度依赖协同工具的企业,这意味着 Agent 可以嵌入现有工作入口,而不是额外打开一个新系统。

6. 不太适合的场景

场景原因
简单 FAQ 或标准 RAGDeerFlow 架构偏重,简单问答不需要完整 harness
强事务、强确定性流程传统工作流引擎/BPM/RPA 更可控
公网裸露部署官方明确提示有高权限操作风险,不应无认证暴露
对延迟极敏感的简单查询长任务 Agent 的开销和工具调用链路更长
无法提供模型/API/搜索/沙箱资源的环境很多能力依赖外部模型、工具和运行环境
生产级多租户但缺少安全隔离能力的客户需要先补认证、隔离、审计、权限、网络安全

7. 架构、部署与集成方式

7.1 全栈架构

DeerFlow 是一个完整应用,而不只是库:

层级技术/组件
前端Next.js Web UI
统一入口Nginx,默认端口 2026
APIFastAPI Gateway,默认端口 8001
Agent RuntimeLangGraph-compatible runtime 嵌入 Gateway
Agent 编排Lead Agent + middleware chain + subagents
工具内置 tools、MCP、community tools、Python functions
执行环境LocalSandboxProvider、AioSandboxProvider、Kubernetes/provisioner
可观测性LangSmith、Langfuse
数据和状态thread data、memory、checkpointer、uploads、outputs

7.2 部署方式

官方推荐 Docker 方式,尤其是长期运行或共享环境。

部署目标起步配置推荐配置说明
本地体验 / make dev4 vCPU、8 GB RAM、20 GB SSD8 vCPU、16 GB RAM适合单个开发者轻量体验
Docker 开发 / make docker-start4 vCPU、8 GB RAM、25 GB SSD8 vCPU、16 GB RAM需要考虑镜像构建和 sandbox 容器
长期运行服务 / make up8 vCPU、16 GB RAM、40 GB SSD16 vCPU、32 GB RAM适合共享、多 Agent、报告生成和更重 sandbox

7.3 模型集成

DeerFlow 模型配置通过 config.yaml 管理。支持:

  • OpenAI
  • Anthropic
  • DeepSeek
  • Gemini
  • OpenRouter
  • vLLM
  • Xiaomi MiMo
  • Codex CLI
  • Claude Code OAuth
  • 任意 LangChain-compatible provider

示例:

models:
  - name: gpt-5-responses
    display_name: GPT-5 (Responses API)
    use: langchain_openai:ChatOpenAI
    model: gpt-5
    api_key: $OPENAI_API_KEY
    use_responses_api: true
    output_version: responses/v1

售前重点:它可以适配客户已有模型网关、私有化 vLLM、OpenAI-compatible 服务,也可以结合火山引擎/BytePlus 相关模型与 InfoQuest 工具。

7.4 工具和 MCP 集成

DeerFlow 支持:

  • web_search
  • web_fetch
  • image_search
  • file read/write
  • bash
  • MCP Server
  • Python functions
  • 自定义 skills

这为企业系统集成提供了入口,比如:

  • 内部知识库
  • CRM
  • 工单系统
  • 数据库
  • BI 平台
  • 文档系统
  • 私有搜索
  • 代码仓库

8. 怎么用

8.1 Docker 推荐路径

git clone https://github.com/bytedance/deer-flow.git
cd deer-flow

make setup
make docker-init
make docker-start

访问:

http://localhost:2026

8.2 本地开发路径

git clone https://github.com/bytedance/deer-flow.git
cd deer-flow

make config
make check
make install
make dev

8.3 TUI 使用

uv pip install 'deerflow-harness[tui]'

deerflow
deerflow --continue
deerflow --resume THREAD
deerflow --print "summarize this repo"
deerflow --json "hello"

注意:PyPI 上名为 deerflow-harness 的包在 2026-06-30 查询时显示为 0.0.1 placeholder,而仓库内 backend/packages/harness/pyproject.toml 标注版本为 2.1.0。因此实际使用应以仓库 README/源码安装方式为准,避免误装占位包。

8.4 Embedded Python Client

from deerflow.client import DeerFlowClient

client = DeerFlowClient()

response = client.chat("Analyze this paper for me", thread_id="my-thread")

for event in client.stream("hello"):
    if event.type == "messages-tuple" and event.data.get("type") == "ai":
        print(event.data["content"])

9. 售前可以怎么讲

9.1 一句话话术

DeerFlow 是一个开源 Super Agent Harness,可以把大模型从“回答问题”升级为“完成任务”:它有沙箱、文件系统、技能、记忆、子代理和多端入口,适合构建企业内部的研究助手、内容助手、研发助手和长任务自动化平台。

9.2 面向业务负责人

它可以帮助团队自动完成资料收集、调研分析、报告生成、PPT/网页初稿、内容生产等重复性知识工作,把人工从“找资料和整理格式”中解放出来,更多聚焦判断和决策。

9.3 面向技术负责人

DeerFlow 基于 LangGraph 和 LangChain,提供完整 agent runtime、middleware chain、sandbox、MCP、skills、memory 和 subagents。它不是一个封闭 SaaS,而是 MIT 开源、可自托管、可扩展,可以作为内部 Agent 平台的工程参考。

9.4 面向安全负责人

DeerFlow 具备系统命令执行、文件读写、业务逻辑调用等高权限能力,所以不能裸露公网。正确方式是本地可信网络、强认证、IP 白名单、网络隔离、沙箱隔离、最小权限和审计追踪。

10. 客户痛点映射

客户痛点DeerFlow 对应能力售前切入
RAG 只能问答,不能执行Sandbox、Tools、File System从知识问答升级为任务执行
复杂任务容易丢上下文Context Engineering、Memory、Sub-agents支撑长任务和多步骤流程
内部流程难集成MCP、Python tools、Gateway API接企业系统和工具链
Agent 输出不可控Skills、Prompt、Workflow、Human review 可扩展用企业方法论约束输出
缺少审计和排错LangSmith、Langfuse tracing可观测、可复盘、可评估
多入口使用麻烦Web UI、TUI、IM Channels嵌入现有工作流
模型选择不确定Multi-model、OpenAI-compatible、vLLM不绑定单一模型供应商

11. 常见客户问题

问题建议回答
它和普通 RAG 有什么区别?RAG 主要解决“查资料后回答”,DeerFlow 更偏“长任务执行”,能规划、调用工具、写文件、派生子代理并生成交付物。
它和 LangGraph 是什么关系?DeerFlow 基于 LangGraph 和 LangChain 构建,LangGraph 更底层,DeerFlow 是更完整的 Agent 应用和 harness。
能不能私有化部署?项目 MIT 开源,支持本地/Docker/生产部署,但需要按官方安全建议配置认证、网络隔离和沙箱。
能不能接企业微信/飞书/钉钉?README 显示支持 Telegram、Slack、Feishu/Lark、WeChat、WeCom、DingTalk 等 IM 渠道,实际落地需要配置对应平台密钥。
能接内部系统吗?可以通过 MCP Server、Python tools、API 和文件系统接入,但要做权限控制和审计。
生产可用吗?项目活跃、功能完整,但 2.0 是新重写版本。建议先做 PoC,再做安全、稳定性、性能、版本锁定和回归测试。
能否用国产模型?README 推荐 Doubao-Seed-2.0-Code、DeepSeek v3.2、Kimi 2.5,也支持 OpenAI-compatible/vLLM 等方式接入。
最大风险是什么?高权限工具和命令执行带来的安全风险,以及长任务成本、延迟、稳定性和模型工具调用可靠性。

12. PoC 建议

12.1 PoC 一:售前调研助手

目标:输入客户名称、官网、行业和竞品,自动生成售前研究报告。

建议验证:

指标验证方式
信息完整性是否覆盖客户背景、业务、竞品、行业趋势
来源可靠性是否保留来源链接
交付质量是否可直接形成拜访提纲或方案初稿
效率提升与人工调研耗时对比
可控性能否用 skill 固化售前模板

12.2 PoC 二:企业文档分析与报告生成

目标:上传多份 PDF/Word/PPT/Excel,生成摘要、风险点、建议和最终报告。

验证重点:

  • 文件上传和转换能力
  • 长上下文处理能力
  • 结果结构化质量
  • 输出文件可交付程度
  • 敏感资料隔离和权限

12.3 PoC 三:研发代码助手

目标:让 DeerFlow 分析一个真实代码仓库,完成小修复或生成架构说明。

验证重点:

  • 仓库理解能力
  • 文件读写能力
  • bash/test 执行能力
  • TUI 使用体验
  • 生成变更说明和审计记录

12.4 PoC 四:IM 入口企业助手

目标:在飞书/企业微信/钉钉中接入 DeerFlow,让业务人员通过聊天提交任务。

验证重点:

  • 渠道接入成本
  • 用户体验
  • 权限和身份映射
  • 文件上传/下载
  • 多轮任务状态管理

13. 风险和注意事项

13.1 安全风险是第一优先级

官方 README 明确提示:DeerFlow 具备系统命令执行、资源操作和业务逻辑调用等高权限能力,默认设计为本地可信环境。公网或不可信网络部署必须采取严格安全措施。

建议:

  • 不要裸露公网。
  • 使用强认证和反向代理。
  • 配置 IP 白名单。
  • 网络隔离到专用 VLAN。
  • 生产环境优先使用 Docker/Kubernetes sandbox。
  • 对高危工具做最小权限和审计。
  • 禁止 Agent 直接操作生产数据库写权限。

13.2 Docker Socket 风险

配置文档指出,某些 Docker-outside-of-Docker 模式需要挂载宿主机 Docker socket,而 Docker socket 等价于宿主机 root 级控制能力。多租户或公网环境应优先考虑 provisioner/Kubernetes 隔离方式。

13.3 2.0 重写后的稳定性

DeerFlow 2.0 是 ground-up rewrite,说明架构已经升级,但也意味着:

  • 版本可能快速变化。
  • 文档和实现可能有更新差异。
  • 生产落地需要锁定版本。
  • 需要完整回归测试。

13.4 PyPI 包名注意

2026-06-30 查询 deerflow-harness PyPI 显示为 placeholder 0.0.1,而仓库内 harness 版本为 2.1.0。售前演示和 PoC 不应直接依赖 PyPI 占位包,应按仓库官方安装路径执行。

13.5 成本和性能

长任务、子代理、搜索、抓取、代码执行、多模型调用会带来成本和延迟。

PoC 时建议记录:

  • 单任务耗时
  • 模型调用次数
  • token 消耗
  • 工具调用次数
  • 失败重试次数
  • 人工介入次数
  • 生成结果可用率

14. 竞争与替代方案视角

类别代表与 DeerFlow 的差异
RAG 框架Dify、RAGFlow、LangChain RAG更偏知识问答,长任务和执行环境不是核心
Agent 编排框架LangGraph、AutoGen、CrewAILangGraph 更底层;DeerFlow 提供完整应用和 harness
Deep Research 产品各类研究 Agent/SaaSDeerFlow 开源、可自托管、可改造
Coding AgentClaude Code、Codex、CursorDeerFlow 覆盖研究、内容、文件、IM、多端入口,不只 coding
RPA/BPMUiPath、Power Automate、传统工作流RPA 更确定性;DeerFlow 更适合开放式知识任务

售前判断:如果客户想做“企业 Agent 平台 PoC”,DeerFlow 比纯框架更快出效果;如果客户只需要简单问答,则可能过重;如果客户需要严格生产流程控制,则要和工作流/审批/权限系统结合,而不是让 Agent 单独承担全部责任。

15. 我的售前判断

DeerFlow 是一个非常适合作为售前演示和 PoC 底座的开源项目。它的亮点不是单点算法,而是把 Agent 落地需要的一整套工程能力打包在一起:Web UI、Gateway、TUI、IM、sandbox、文件系统、skills、memory、subagents、MCP 和 tracing。

它适合向客户展示“AI 从聊天走向任务执行”的新阶段,尤其适合深度研究、售前资料准备、内容生成、文档分析、研发辅助和企业内部 Agent 平台建设。

但它也不是直接开箱上生产的银弹。真正落地时,安全边界、认证授权、沙箱隔离、工具权限、成本控制、可观测性、评估体系和版本治理都必须同步设计。售前推荐用它做一个边界清晰的 PoC:选择非生产数据、只读系统、有限工具、明确输出指标,让客户先看到长任务 Agent 的业务价值,再讨论生产化改造。