DeerFlow

← 返回项目列表

DeerFlow 是字节跳动开源的 Super Agent Harness，从早期 Deep Research 框架升级为面向研究、代码、内容创作和长任务执行的全栈 Agent 运行环境。它把 sub-agents、memory、sandbox、skills、工具、MCP、Web UI、TUI、IM 渠道和可观测性组合在一起，适合用于企业级“能做事的 Agent”PoC。售前视角下，它尤其适合拿来讲“从问答/RAG 走向长任务自动化”的升级路径。

1. 项目概览

维度	信息
项目名称	DeerFlow
GitHub	bytedance/deer-flow
官网	deerflow.tech
项目定位	开源 Super Agent Harness
核心描述	An open-source long-horizon SuperAgent harness that researches, codes, and creates
开源协议	MIT
技术栈	Python、TypeScript、LangGraph、LangChain、FastAPI、Next.js、Nginx、Docker Sandbox
Python 要求	README 标注 Python 3.12+
Node.js 要求	README 标注 Node.js 22+
最新 Release	v2.0.0，2026-06-25 发布
当前活跃度	2026-06-30 检查：约 75.5k stars、10.2k forks、589 issues、401 PR
重要说明	DeerFlow 2.0 是彻底重写，与 v1 不共用代码；v1 Deep Research 框架维护在 `main-1.x` 分支

DeerFlow 的全称是 Deep Exploration and Efficient Research Flow。它最早是 Deep Research 框架，后来社区把它扩展到数据流水线、演示文稿生成、Dashboard、内容自动化等更多场景，于是 2.0 被重构为更通用的 Super Agent Harness。

售前可以把它解释为：一个给大模型配备“工作环境、长期记忆、技能体系、文件系统、工具和子代理”的开源 Agent 平台底座。

2. 它主要能做什么

2.1 深度研究与报告生成

DeerFlow 继承了 Deep Research 的核心能力，可以围绕一个复杂问题进行资料搜索、网页抓取、信息整理、多角度分析，并输出报告。

适合场景：

场景	价值
行业研究	自动收集公开资料，形成结构化行业洞察
竞品分析	比较多个产品的定位、能力、价格、生态
政策/法规跟踪	汇总政策原文、提炼影响、形成行动建议
售前资料准备	生成客户背景、痛点、方案建议、PoC 路线

2.2 长任务执行

官网强调 DeerFlow 可以处理从几分钟到几小时不等的任务。它通过规划、子任务拆解、文件系统、记忆和 sandbox 执行环境支撑长链路任务。

典型任务：

研究一个开源项目并生成分析报告。
读取上传资料并生成 PPT 或网页。
编写一个小型应用或脚本。
分析数据文件并产出图表与解释。
多轮迭代一个内容项目或技术方案。

2.3 Sub-agents 并行协作

DeerFlow 的 lead agent 可以动态拉起 sub-agents。每个 sub-agent 拥有独立上下文、工具和终止条件，可以并行处理不同方向，最后由 lead agent 汇总。

售前表达：

DeerFlow 不只是单个 Agent 在一个上下文里硬撑，而是可以把复杂任务拆成多个子任务，让不同子代理并行研究、执行和汇总，更适合复杂业务场景。

2.4 Sandbox 与文件系统

DeerFlow 给 Agent 提供可执行环境。每个任务都有隔离的工作目录，包括上传文件、工作区和输出目录：

/mnt/user-data/
├── uploads/          ← 用户上传文件
├── workspace/        ← Agent 工作目录
└── outputs/          ← 最终交付物

它支持：

读写文件
编辑文件
执行 bash 或代码
查看图片
生成最终交付物
在 Docker 或 Kubernetes 相关模式下隔离执行环境

这使它从“会调用工具的聊天机器人”更接近“有一台可控电脑的 Agent”。

2.5 Skills 与工具扩展

DeerFlow 支持标准 Agent Skill。Skill 通常是一个 SKILL.md，可以包含工作流、最佳实践、参考资料、脚本和模板。

内置和适配方向包括：

research
report-generation
slide-creation
web-page
image-generation
video-generation
claude-to-deerflow

示例结构：

/mnt/skills/public
├── research/SKILL.md
├── report-generation/SKILL.md
├── slide-creation/SKILL.md
├── web-page/SKILL.md
└── image-generation/SKILL.md

/mnt/skills/custom
└── your-custom-skill/SKILL.md

核心价值：企业可以把内部方法论、行业知识、交付模板、售前流程固化为 Skill，形成可复用的 Agent 能力库。

2.6 长期记忆

DeerFlow 支持跨会话记忆，逐步积累用户画像、偏好、背景知识、工作习惯和常用流程。

适合用于：

个人工作助手
团队知识助手
长期客户跟进助手
固定业务流程自动化助手

2.7 多端入口

DeerFlow 不只是后端 SDK，它提供多个使用入口：

入口	说明
Web UI	Next.js 前端，通过 Nginx 统一入口访问
Gateway API	FastAPI REST + LangGraph-compatible agent runtime
Embedded Python Client	不启动完整 HTTP 服务也能嵌入 Python 使用
Terminal Workbench / TUI	面向终端用户的交互式工作台
IM Channels	Telegram、Slack、飞书/Lark、企业微信、钉钉、微信等渠道接入
Claude Code Skill	通过 `claude-to-deerflow` skill 从 Claude Code 直接控制 DeerFlow

3. 项目自带示意图和官方视觉资料

3.1 官网定位图与演示入口

官网把 DeerFlow 描述为：开放源码 SuperAgent Harness，可以研究、编码和创作；借助 sandbox、memory、tools、skills 和 subagents 处理不同层级的长任务。

官网：https://deerflow.tech
README 中也包含官方演示视频链接：deer-flow-720p.mp4

3.2 InfoQuest 集成图

DeerFlow README 中展示了 BytePlus InfoQuest 搜索与抓取工具集成。

售前含义：DeerFlow 在“深度研究”场景中不只依赖模型本身，还强调搜索、抓取和资料获取能力。对于客户的公开网页研究、竞品调研、行业信息收集，这类工具链是关键。

3.3 TUI 官方预览图

DeerFlow 项目自带 Terminal Workbench 预览图：

售前含义：它不仅有 Web 体验，也支持终端原生工作流，适合研发、数据、运维和 Agent 工程团队。

3.4 Star History

README 内置 Star History 图：

售前含义：社区关注度高，可以作为开源成熟度和生态热度的辅助证据，但不能等同于生产稳定性。

3.5 后端架构示意

项目后端 README 给出的核心架构可以概括为：

flowchart TB U["用户 / Web / TUI / IM / API"] --> N["Nginx
统一入口 :2026"] N --> F["Frontend
Next.js :3000"] N --> G["Gateway API
FastAPI :8001"] G --> R["Embedded LangGraph-compatible Agent Runtime"] R --> L["Lead Agent"] L --> M["Middleware Chain"] L --> T["Tools / MCP / Skills / Sandbox / Subagents"] T --> S["Sandbox FS
uploads / workspace / outputs"] T --> O["Observability
LangSmith / Langfuse"]

关键点：

/api/langgraph/* 由 Nginx 转发到 Gateway 的 LangGraph-compatible API。
Gateway 同时承担 REST API 和 Agent Runtime。
Lead Agent 通过 middleware chain 组合上下文、上传文件、sandbox、记忆、技能、子代理和澄清流程。

4. 核心能力清单

能力	说明	售前价值
Deep Research	搜索、抓取、整理、报告生成	从“资料收集”到“报告初稿”自动化
Long-horizon Agent	支持分钟到小时级任务	可演示复杂业务自动化
Sub-agents	动态拆分子任务，可并行处理	适合复杂调研、内容生产和研发任务
Sandbox	隔离执行命令、代码和文件操作	比普通聊天机器人更像执行型 Agent
File System	上传、工作区、输出目录	中间结果可沉淀、可追踪、可交付
Skills	可扩展工作流模块	可沉淀行业/客户/交付方法论
MCP	支持外部工具和服务接入	可连接企业内部系统
Memory	跨会话记忆	适合个人/团队长期助手
Web UI	面向普通用户	便于业务演示
TUI	面向终端用户	便于研发和技术团队使用
IM Channels	接入 Slack、飞书、企业微信等	贴近企业日常协作入口
Observability	LangSmith、Langfuse	支持 trace、排错和评估
Multi-model	支持 OpenAI-compatible、DeepSeek、OpenAI、Gemini、Doubao 等	不绑定单一模型，适合私有化/多模型策略

5. 适用场景

5.1 售前和解决方案团队

DeerFlow 很适合做“售前研究助手”：

输入客户名称、行业、官网和公开资料。
自动完成客户背景、业务痛点、竞品动态、行业趋势整理。
输出售前拜访提纲、PoC 建议、方案结构和演示话术。

优势：

可以把售前方法论做成 skills。
可以把结果写到文件系统，形成可交付材料。
可以通过 Web UI 或 IM 入口降低使用门槛。

5.2 企业知识工作自动化

适合部门：

市场研究
战略分析
咨询顾问
法务/合规初筛
产品运营
内容团队

典型任务：

行业报告初稿
政策影响摘要
竞品资料库
客户资料整理
多文档分析
网页/报告/PPT 生成

5.3 研发与技术团队

适合任务：

代码仓库理解
小型功能实现
Bug 定位
生成脚本和工具
代码文档与架构说明
通过 TUI 或 API 接入开发流程

项目支持 Codex CLI、Claude Code OAuth、ACP agent、MCP Server、Docker sandbox，对技术团队会比较有吸引力。

5.4 企业级 Agent 平台 PoC

如果客户想建设内部 Agent 平台，而不只是做单个机器人，DeerFlow 可以作为参考底座：

统一模型配置
统一工具配置
统一技能库
统一 sandbox 执行
统一 Web / API / IM 入口
统一 trace 和 memory 管理

5.5 多端企业助手

DeerFlow 支持 Telegram、Slack、飞书/Lark、企业微信、钉钉、微信等 IM 渠道。对于已经高度依赖协同工具的企业，这意味着 Agent 可以嵌入现有工作入口，而不是额外打开一个新系统。

6. 不太适合的场景

场景	原因
简单 FAQ 或标准 RAG	DeerFlow 架构偏重，简单问答不需要完整 harness
强事务、强确定性流程	传统工作流引擎/BPM/RPA 更可控
公网裸露部署	官方明确提示有高权限操作风险，不应无认证暴露
对延迟极敏感的简单查询	长任务 Agent 的开销和工具调用链路更长
无法提供模型/API/搜索/沙箱资源的环境	很多能力依赖外部模型、工具和运行环境
生产级多租户但缺少安全隔离能力的客户	需要先补认证、隔离、审计、权限、网络安全

7. 架构、部署与集成方式

7.1 全栈架构

DeerFlow 是一个完整应用，而不只是库：

层级	技术/组件
前端	Next.js Web UI
统一入口	Nginx，默认端口 2026
API	FastAPI Gateway，默认端口 8001
Agent Runtime	LangGraph-compatible runtime 嵌入 Gateway
Agent 编排	Lead Agent + middleware chain + subagents
工具	内置 tools、MCP、community tools、Python functions
执行环境	LocalSandboxProvider、AioSandboxProvider、Kubernetes/provisioner
可观测性	LangSmith、Langfuse
数据和状态	thread data、memory、checkpointer、uploads、outputs

7.2 部署方式

官方推荐 Docker 方式，尤其是长期运行或共享环境。

部署目标	起步配置	推荐配置	说明
本地体验 / `make dev`	4 vCPU、8 GB RAM、20 GB SSD	8 vCPU、16 GB RAM	适合单个开发者轻量体验
Docker 开发 / `make docker-start`	4 vCPU、8 GB RAM、25 GB SSD	8 vCPU、16 GB RAM	需要考虑镜像构建和 sandbox 容器
长期运行服务 / `make up`	8 vCPU、16 GB RAM、40 GB SSD	16 vCPU、32 GB RAM	适合共享、多 Agent、报告生成和更重 sandbox

7.3 模型集成

DeerFlow 模型配置通过 config.yaml 管理。支持：

OpenAI
Anthropic
DeepSeek
Gemini
OpenRouter
vLLM
Xiaomi MiMo
Codex CLI
Claude Code OAuth
任意 LangChain-compatible provider

示例：

models:
  - name: gpt-5-responses
    display_name: GPT-5 (Responses API)
    use: langchain_openai:ChatOpenAI
    model: gpt-5
    api_key: $OPENAI_API_KEY
    use_responses_api: true
    output_version: responses/v1

售前重点：它可以适配客户已有模型网关、私有化 vLLM、OpenAI-compatible 服务，也可以结合火山引擎/BytePlus 相关模型与 InfoQuest 工具。

7.4 工具和 MCP 集成

DeerFlow 支持：

web_search
web_fetch
image_search
file read/write
bash
MCP Server
Python functions
自定义 skills

这为企业系统集成提供了入口，比如：

内部知识库
CRM
工单系统
数据库
BI 平台
文档系统
私有搜索
代码仓库

8. 怎么用

8.1 Docker 推荐路径

git clone https://github.com/bytedance/deer-flow.git
cd deer-flow

make setup
make docker-init
make docker-start

访问：

http://localhost:2026

8.2 本地开发路径

git clone https://github.com/bytedance/deer-flow.git
cd deer-flow

make config
make check
make install
make dev

8.3 TUI 使用

uv pip install 'deerflow-harness[tui]'

deerflow
deerflow --continue
deerflow --resume THREAD
deerflow --print "summarize this repo"
deerflow --json "hello"

注意：PyPI 上名为 deerflow-harness 的包在 2026-06-30 查询时显示为 0.0.1 placeholder，而仓库内 backend/packages/harness/pyproject.toml 标注版本为 2.1.0。因此实际使用应以仓库 README/源码安装方式为准，避免误装占位包。

8.4 Embedded Python Client

from deerflow.client import DeerFlowClient

client = DeerFlowClient()

response = client.chat("Analyze this paper for me", thread_id="my-thread")

for event in client.stream("hello"):
    if event.type == "messages-tuple" and event.data.get("type") == "ai":
        print(event.data["content"])

9. 售前可以怎么讲

9.1 一句话话术

DeerFlow 是一个开源 Super Agent Harness，可以把大模型从“回答问题”升级为“完成任务”：它有沙箱、文件系统、技能、记忆、子代理和多端入口，适合构建企业内部的研究助手、内容助手、研发助手和长任务自动化平台。

9.2 面向业务负责人

它可以帮助团队自动完成资料收集、调研分析、报告生成、PPT/网页初稿、内容生产等重复性知识工作，把人工从“找资料和整理格式”中解放出来，更多聚焦判断和决策。

9.3 面向技术负责人

DeerFlow 基于 LangGraph 和 LangChain，提供完整 agent runtime、middleware chain、sandbox、MCP、skills、memory 和 subagents。它不是一个封闭 SaaS，而是 MIT 开源、可自托管、可扩展，可以作为内部 Agent 平台的工程参考。

9.4 面向安全负责人

DeerFlow 具备系统命令执行、文件读写、业务逻辑调用等高权限能力，所以不能裸露公网。正确方式是本地可信网络、强认证、IP 白名单、网络隔离、沙箱隔离、最小权限和审计追踪。

10. 客户痛点映射

客户痛点	DeerFlow 对应能力	售前切入
RAG 只能问答，不能执行	Sandbox、Tools、File System	从知识问答升级为任务执行
复杂任务容易丢上下文	Context Engineering、Memory、Sub-agents	支撑长任务和多步骤流程
内部流程难集成	MCP、Python tools、Gateway API	接企业系统和工具链
Agent 输出不可控	Skills、Prompt、Workflow、Human review 可扩展	用企业方法论约束输出
缺少审计和排错	LangSmith、Langfuse tracing	可观测、可复盘、可评估
多入口使用麻烦	Web UI、TUI、IM Channels	嵌入现有工作流
模型选择不确定	Multi-model、OpenAI-compatible、vLLM	不绑定单一模型供应商

11. 常见客户问题

问题	建议回答
它和普通 RAG 有什么区别？	RAG 主要解决“查资料后回答”，DeerFlow 更偏“长任务执行”，能规划、调用工具、写文件、派生子代理并生成交付物。
它和 LangGraph 是什么关系？	DeerFlow 基于 LangGraph 和 LangChain 构建，LangGraph 更底层，DeerFlow 是更完整的 Agent 应用和 harness。
能不能私有化部署？	项目 MIT 开源，支持本地/Docker/生产部署，但需要按官方安全建议配置认证、网络隔离和沙箱。
能不能接企业微信/飞书/钉钉？	README 显示支持 Telegram、Slack、Feishu/Lark、WeChat、WeCom、DingTalk 等 IM 渠道，实际落地需要配置对应平台密钥。
能接内部系统吗？	可以通过 MCP Server、Python tools、API 和文件系统接入，但要做权限控制和审计。
生产可用吗？	项目活跃、功能完整，但 2.0 是新重写版本。建议先做 PoC，再做安全、稳定性、性能、版本锁定和回归测试。
能否用国产模型？	README 推荐 Doubao-Seed-2.0-Code、DeepSeek v3.2、Kimi 2.5，也支持 OpenAI-compatible/vLLM 等方式接入。
最大风险是什么？	高权限工具和命令执行带来的安全风险，以及长任务成本、延迟、稳定性和模型工具调用可靠性。

12. PoC 建议

12.1 PoC 一：售前调研助手

目标：输入客户名称、官网、行业和竞品，自动生成售前研究报告。

建议验证：

指标	验证方式
信息完整性	是否覆盖客户背景、业务、竞品、行业趋势
来源可靠性	是否保留来源链接
交付质量	是否可直接形成拜访提纲或方案初稿
效率提升	与人工调研耗时对比
可控性	能否用 skill 固化售前模板

12.2 PoC 二：企业文档分析与报告生成

目标：上传多份 PDF/Word/PPT/Excel，生成摘要、风险点、建议和最终报告。

验证重点：

文件上传和转换能力
长上下文处理能力
结果结构化质量
输出文件可交付程度
敏感资料隔离和权限

12.3 PoC 三：研发代码助手

目标：让 DeerFlow 分析一个真实代码仓库，完成小修复或生成架构说明。

验证重点：

仓库理解能力
文件读写能力
bash/test 执行能力
TUI 使用体验
生成变更说明和审计记录

12.4 PoC 四：IM 入口企业助手

目标：在飞书/企业微信/钉钉中接入 DeerFlow，让业务人员通过聊天提交任务。

验证重点：

渠道接入成本
用户体验
权限和身份映射
文件上传/下载
多轮任务状态管理

13. 风险和注意事项

13.1 安全风险是第一优先级

官方 README 明确提示：DeerFlow 具备系统命令执行、资源操作和业务逻辑调用等高权限能力，默认设计为本地可信环境。公网或不可信网络部署必须采取严格安全措施。

建议：

不要裸露公网。
使用强认证和反向代理。
配置 IP 白名单。
网络隔离到专用 VLAN。
生产环境优先使用 Docker/Kubernetes sandbox。
对高危工具做最小权限和审计。
禁止 Agent 直接操作生产数据库写权限。

13.2 Docker Socket 风险

配置文档指出，某些 Docker-outside-of-Docker 模式需要挂载宿主机 Docker socket，而 Docker socket 等价于宿主机 root 级控制能力。多租户或公网环境应优先考虑 provisioner/Kubernetes 隔离方式。

13.3 2.0 重写后的稳定性

DeerFlow 2.0 是 ground-up rewrite，说明架构已经升级，但也意味着：

版本可能快速变化。
文档和实现可能有更新差异。
生产落地需要锁定版本。
需要完整回归测试。

13.4 PyPI 包名注意

2026-06-30 查询 deerflow-harness PyPI 显示为 placeholder 0.0.1，而仓库内 harness 版本为 2.1.0。售前演示和 PoC 不应直接依赖 PyPI 占位包，应按仓库官方安装路径执行。

13.5 成本和性能

长任务、子代理、搜索、抓取、代码执行、多模型调用会带来成本和延迟。

PoC 时建议记录：

单任务耗时
模型调用次数
token 消耗
工具调用次数
失败重试次数
人工介入次数
生成结果可用率

14. 竞争与替代方案视角

类别	代表	与 DeerFlow 的差异
RAG 框架	Dify、RAGFlow、LangChain RAG	更偏知识问答，长任务和执行环境不是核心
Agent 编排框架	LangGraph、AutoGen、CrewAI	LangGraph 更底层；DeerFlow 提供完整应用和 harness
Deep Research 产品	各类研究 Agent/SaaS	DeerFlow 开源、可自托管、可改造
Coding Agent	Claude Code、Codex、Cursor	DeerFlow 覆盖研究、内容、文件、IM、多端入口，不只 coding
RPA/BPM	UiPath、Power Automate、传统工作流	RPA 更确定性；DeerFlow 更适合开放式知识任务

售前判断：如果客户想做“企业 Agent 平台 PoC”，DeerFlow 比纯框架更快出效果；如果客户只需要简单问答，则可能过重；如果客户需要严格生产流程控制，则要和工作流/审批/权限系统结合，而不是让 Agent 单独承担全部责任。

15. 我的售前判断

DeerFlow 是一个非常适合作为售前演示和 PoC 底座的开源项目。它的亮点不是单点算法，而是把 Agent 落地需要的一整套工程能力打包在一起：Web UI、Gateway、TUI、IM、sandbox、文件系统、skills、memory、subagents、MCP 和 tracing。

它适合向客户展示“AI 从聊天走向任务执行”的新阶段，尤其适合深度研究、售前资料准备、内容生成、文档分析、研发辅助和企业内部 Agent 平台建设。

但它也不是直接开箱上生产的银弹。真正落地时，安全边界、认证授权、沙箱隔离、工具权限、成本控制、可观测性、评估体系和版本治理都必须同步设计。售前推荐用它做一个边界清晰的 PoC：选择非生产数据、只读系统、有限工具、明确输出指标，让客户先看到长任务 Agent 的业务价值，再讨论生产化改造。

1. 项目概览

2. 它主要能做什么

2.1 深度研究与报告生成

2.2 长任务执行

2.3 Sub-agents 并行协作

2.4 Sandbox 与文件系统

2.5 Skills 与工具扩展

2.6 长期记忆

2.7 多端入口

3. 项目自带示意图和官方视觉资料

3.1 官网定位图与演示入口

3.2 InfoQuest 集成图

3.3 TUI 官方预览图

3.4 Star History

3.5 后端架构示意

4. 核心能力清单

5. 适用场景

5.1 售前和解决方案团队

5.2 企业知识工作自动化

5.3 研发与技术团队

5.4 企业级 Agent 平台 PoC

5.5 多端企业助手

6. 不太适合的场景

7. 架构、部署与集成方式

7.1 全栈架构

7.2 部署方式

7.3 模型集成

7.4 工具和 MCP 集成

8. 怎么用

8.1 Docker 推荐路径

8.2 本地开发路径

8.3 TUI 使用

8.4 Embedded Python Client

9. 售前可以怎么讲

9.1 一句话话术

9.2 面向业务负责人

9.3 面向技术负责人

9.4 面向安全负责人

10. 客户痛点映射

11. 常见客户问题

12. PoC 建议

12.1 PoC 一：售前调研助手

12.2 PoC 二：企业文档分析与报告生成

12.3 PoC 三：研发代码助手

12.4 PoC 四：IM 入口企业助手

13. 风险和注意事项

13.1 安全风险是第一优先级

13.2 Docker Socket 风险

13.3 2.0 重写后的稳定性

13.4 PyPI 包名注意

13.5 成本和性能

14. 竞争与替代方案视角

15. 我的售前判断

16. 参考资料