1. 项目概览
| 维度 | 信息 |
|---|---|
| 项目名称 | DeerFlow |
| GitHub | bytedance/deer-flow |
| 官网 | deerflow.tech |
| 项目定位 | 开源 Super Agent Harness |
| 核心描述 | An open-source long-horizon SuperAgent harness that researches, codes, and creates |
| 开源协议 | MIT |
| 技术栈 | Python、TypeScript、LangGraph、LangChain、FastAPI、Next.js、Nginx、Docker Sandbox |
| Python 要求 | README 标注 Python 3.12+ |
| Node.js 要求 | README 标注 Node.js 22+ |
| 最新 Release | v2.0.0,2026-06-25 发布 |
| 当前活跃度 | 2026-06-30 检查:约 75.5k stars、10.2k forks、589 issues、401 PR |
| 重要说明 | DeerFlow 2.0 是彻底重写,与 v1 不共用代码;v1 Deep Research 框架维护在 main-1.x 分支 |
DeerFlow 的全称是 Deep Exploration and Efficient Research Flow。它最早是 Deep Research 框架,后来社区把它扩展到数据流水线、演示文稿生成、Dashboard、内容自动化等更多场景,于是 2.0 被重构为更通用的 Super Agent Harness。
售前可以把它解释为:一个给大模型配备“工作环境、长期记忆、技能体系、文件系统、工具和子代理”的开源 Agent 平台底座。
2. 它主要能做什么
2.1 深度研究与报告生成
DeerFlow 继承了 Deep Research 的核心能力,可以围绕一个复杂问题进行资料搜索、网页抓取、信息整理、多角度分析,并输出报告。
适合场景:
| 场景 | 价值 |
|---|---|
| 行业研究 | 自动收集公开资料,形成结构化行业洞察 |
| 竞品分析 | 比较多个产品的定位、能力、价格、生态 |
| 政策/法规跟踪 | 汇总政策原文、提炼影响、形成行动建议 |
| 售前资料准备 | 生成客户背景、痛点、方案建议、PoC 路线 |
2.2 长任务执行
官网强调 DeerFlow 可以处理从几分钟到几小时不等的任务。它通过规划、子任务拆解、文件系统、记忆和 sandbox 执行环境支撑长链路任务。
典型任务:
- 研究一个开源项目并生成分析报告。
- 读取上传资料并生成 PPT 或网页。
- 编写一个小型应用或脚本。
- 分析数据文件并产出图表与解释。
- 多轮迭代一个内容项目或技术方案。
2.3 Sub-agents 并行协作
DeerFlow 的 lead agent 可以动态拉起 sub-agents。每个 sub-agent 拥有独立上下文、工具和终止条件,可以并行处理不同方向,最后由 lead agent 汇总。
售前表达:
DeerFlow 不只是单个 Agent 在一个上下文里硬撑,而是可以把复杂任务拆成多个子任务,让不同子代理并行研究、执行和汇总,更适合复杂业务场景。
2.4 Sandbox 与文件系统
DeerFlow 给 Agent 提供可执行环境。每个任务都有隔离的工作目录,包括上传文件、工作区和输出目录:
/mnt/user-data/
├── uploads/ ← 用户上传文件
├── workspace/ ← Agent 工作目录
└── outputs/ ← 最终交付物
它支持:
- 读写文件
- 编辑文件
- 执行 bash 或代码
- 查看图片
- 生成最终交付物
- 在 Docker 或 Kubernetes 相关模式下隔离执行环境
这使它从“会调用工具的聊天机器人”更接近“有一台可控电脑的 Agent”。
2.5 Skills 与工具扩展
DeerFlow 支持标准 Agent Skill。Skill 通常是一个 SKILL.md,可以包含工作流、最佳实践、参考资料、脚本和模板。
内置和适配方向包括:
- research
- report-generation
- slide-creation
- web-page
- image-generation
- video-generation
- claude-to-deerflow
示例结构:
/mnt/skills/public
├── research/SKILL.md
├── report-generation/SKILL.md
├── slide-creation/SKILL.md
├── web-page/SKILL.md
└── image-generation/SKILL.md
/mnt/skills/custom
└── your-custom-skill/SKILL.md
核心价值:企业可以把内部方法论、行业知识、交付模板、售前流程固化为 Skill,形成可复用的 Agent 能力库。
2.6 长期记忆
DeerFlow 支持跨会话记忆,逐步积累用户画像、偏好、背景知识、工作习惯和常用流程。
适合用于:
- 个人工作助手
- 团队知识助手
- 长期客户跟进助手
- 固定业务流程自动化助手
2.7 多端入口
DeerFlow 不只是后端 SDK,它提供多个使用入口:
| 入口 | 说明 |
|---|---|
| Web UI | Next.js 前端,通过 Nginx 统一入口访问 |
| Gateway API | FastAPI REST + LangGraph-compatible agent runtime |
| Embedded Python Client | 不启动完整 HTTP 服务也能嵌入 Python 使用 |
| Terminal Workbench / TUI | 面向终端用户的交互式工作台 |
| IM Channels | Telegram、Slack、飞书/Lark、企业微信、钉钉、微信等渠道接入 |
| Claude Code Skill | 通过 claude-to-deerflow skill 从 Claude Code 直接控制 DeerFlow |
3. 项目自带示意图和官方视觉资料
3.1 官网定位图与演示入口
官网把 DeerFlow 描述为:开放源码 SuperAgent Harness,可以研究、编码和创作;借助 sandbox、memory、tools、skills 和 subagents 处理不同层级的长任务。
- 官网:https://deerflow.tech
- README 中也包含官方演示视频链接:deer-flow-720p.mp4
3.2 InfoQuest 集成图
DeerFlow README 中展示了 BytePlus InfoQuest 搜索与抓取工具集成。

售前含义:DeerFlow 在“深度研究”场景中不只依赖模型本身,还强调搜索、抓取和资料获取能力。对于客户的公开网页研究、竞品调研、行业信息收集,这类工具链是关键。
3.3 TUI 官方预览图
DeerFlow 项目自带 Terminal Workbench 预览图:
售前含义:它不仅有 Web 体验,也支持终端原生工作流,适合研发、数据、运维和 Agent 工程团队。
3.4 Star History
README 内置 Star History 图:
售前含义:社区关注度高,可以作为开源成熟度和生态热度的辅助证据,但不能等同于生产稳定性。
3.5 后端架构示意
项目后端 README 给出的核心架构可以概括为:
统一入口 :2026"] N --> F["Frontend
Next.js :3000"] N --> G["Gateway API
FastAPI :8001"] G --> R["Embedded LangGraph-compatible Agent Runtime"] R --> L["Lead Agent"] L --> M["Middleware Chain"] L --> T["Tools / MCP / Skills / Sandbox / Subagents"] T --> S["Sandbox FS
uploads / workspace / outputs"] T --> O["Observability
LangSmith / Langfuse"]
关键点:
/api/langgraph/*由 Nginx 转发到 Gateway 的 LangGraph-compatible API。- Gateway 同时承担 REST API 和 Agent Runtime。
- Lead Agent 通过 middleware chain 组合上下文、上传文件、sandbox、记忆、技能、子代理和澄清流程。
4. 核心能力清单
| 能力 | 说明 | 售前价值 |
|---|---|---|
| Deep Research | 搜索、抓取、整理、报告生成 | 从“资料收集”到“报告初稿”自动化 |
| Long-horizon Agent | 支持分钟到小时级任务 | 可演示复杂业务自动化 |
| Sub-agents | 动态拆分子任务,可并行处理 | 适合复杂调研、内容生产和研发任务 |
| Sandbox | 隔离执行命令、代码和文件操作 | 比普通聊天机器人更像执行型 Agent |
| File System | 上传、工作区、输出目录 | 中间结果可沉淀、可追踪、可交付 |
| Skills | 可扩展工作流模块 | 可沉淀行业/客户/交付方法论 |
| MCP | 支持外部工具和服务接入 | 可连接企业内部系统 |
| Memory | 跨会话记忆 | 适合个人/团队长期助手 |
| Web UI | 面向普通用户 | 便于业务演示 |
| TUI | 面向终端用户 | 便于研发和技术团队使用 |
| IM Channels | 接入 Slack、飞书、企业微信等 | 贴近企业日常协作入口 |
| Observability | LangSmith、Langfuse | 支持 trace、排错和评估 |
| Multi-model | 支持 OpenAI-compatible、DeepSeek、OpenAI、Gemini、Doubao 等 | 不绑定单一模型,适合私有化/多模型策略 |
5. 适用场景
5.1 售前和解决方案团队
DeerFlow 很适合做“售前研究助手”:
- 输入客户名称、行业、官网和公开资料。
- 自动完成客户背景、业务痛点、竞品动态、行业趋势整理。
- 输出售前拜访提纲、PoC 建议、方案结构和演示话术。
优势:
- 可以把售前方法论做成 skills。
- 可以把结果写到文件系统,形成可交付材料。
- 可以通过 Web UI 或 IM 入口降低使用门槛。
5.2 企业知识工作自动化
适合部门:
- 市场研究
- 战略分析
- 咨询顾问
- 法务/合规初筛
- 产品运营
- 内容团队
典型任务:
- 行业报告初稿
- 政策影响摘要
- 竞品资料库
- 客户资料整理
- 多文档分析
- 网页/报告/PPT 生成
5.3 研发与技术团队
适合任务:
- 代码仓库理解
- 小型功能实现
- Bug 定位
- 生成脚本和工具
- 代码文档与架构说明
- 通过 TUI 或 API 接入开发流程
项目支持 Codex CLI、Claude Code OAuth、ACP agent、MCP Server、Docker sandbox,对技术团队会比较有吸引力。
5.4 企业级 Agent 平台 PoC
如果客户想建设内部 Agent 平台,而不只是做单个机器人,DeerFlow 可以作为参考底座:
- 统一模型配置
- 统一工具配置
- 统一技能库
- 统一 sandbox 执行
- 统一 Web / API / IM 入口
- 统一 trace 和 memory 管理
5.5 多端企业助手
DeerFlow 支持 Telegram、Slack、飞书/Lark、企业微信、钉钉、微信等 IM 渠道。对于已经高度依赖协同工具的企业,这意味着 Agent 可以嵌入现有工作入口,而不是额外打开一个新系统。
6. 不太适合的场景
| 场景 | 原因 |
|---|---|
| 简单 FAQ 或标准 RAG | DeerFlow 架构偏重,简单问答不需要完整 harness |
| 强事务、强确定性流程 | 传统工作流引擎/BPM/RPA 更可控 |
| 公网裸露部署 | 官方明确提示有高权限操作风险,不应无认证暴露 |
| 对延迟极敏感的简单查询 | 长任务 Agent 的开销和工具调用链路更长 |
| 无法提供模型/API/搜索/沙箱资源的环境 | 很多能力依赖外部模型、工具和运行环境 |
| 生产级多租户但缺少安全隔离能力的客户 | 需要先补认证、隔离、审计、权限、网络安全 |
7. 架构、部署与集成方式
7.1 全栈架构
DeerFlow 是一个完整应用,而不只是库:
| 层级 | 技术/组件 |
|---|---|
| 前端 | Next.js Web UI |
| 统一入口 | Nginx,默认端口 2026 |
| API | FastAPI Gateway,默认端口 8001 |
| Agent Runtime | LangGraph-compatible runtime 嵌入 Gateway |
| Agent 编排 | Lead Agent + middleware chain + subagents |
| 工具 | 内置 tools、MCP、community tools、Python functions |
| 执行环境 | LocalSandboxProvider、AioSandboxProvider、Kubernetes/provisioner |
| 可观测性 | LangSmith、Langfuse |
| 数据和状态 | thread data、memory、checkpointer、uploads、outputs |
7.2 部署方式
官方推荐 Docker 方式,尤其是长期运行或共享环境。
| 部署目标 | 起步配置 | 推荐配置 | 说明 |
|---|---|---|---|
本地体验 / make dev | 4 vCPU、8 GB RAM、20 GB SSD | 8 vCPU、16 GB RAM | 适合单个开发者轻量体验 |
Docker 开发 / make docker-start | 4 vCPU、8 GB RAM、25 GB SSD | 8 vCPU、16 GB RAM | 需要考虑镜像构建和 sandbox 容器 |
长期运行服务 / make up | 8 vCPU、16 GB RAM、40 GB SSD | 16 vCPU、32 GB RAM | 适合共享、多 Agent、报告生成和更重 sandbox |
7.3 模型集成
DeerFlow 模型配置通过 config.yaml 管理。支持:
- OpenAI
- Anthropic
- DeepSeek
- Gemini
- OpenRouter
- vLLM
- Xiaomi MiMo
- Codex CLI
- Claude Code OAuth
- 任意 LangChain-compatible provider
示例:
models:
- name: gpt-5-responses
display_name: GPT-5 (Responses API)
use: langchain_openai:ChatOpenAI
model: gpt-5
api_key: $OPENAI_API_KEY
use_responses_api: true
output_version: responses/v1
售前重点:它可以适配客户已有模型网关、私有化 vLLM、OpenAI-compatible 服务,也可以结合火山引擎/BytePlus 相关模型与 InfoQuest 工具。
7.4 工具和 MCP 集成
DeerFlow 支持:
- web_search
- web_fetch
- image_search
- file read/write
- bash
- MCP Server
- Python functions
- 自定义 skills
这为企业系统集成提供了入口,比如:
- 内部知识库
- CRM
- 工单系统
- 数据库
- BI 平台
- 文档系统
- 私有搜索
- 代码仓库
8. 怎么用
8.1 Docker 推荐路径
git clone https://github.com/bytedance/deer-flow.git
cd deer-flow
make setup
make docker-init
make docker-start
访问:
http://localhost:2026
8.2 本地开发路径
git clone https://github.com/bytedance/deer-flow.git
cd deer-flow
make config
make check
make install
make dev
8.3 TUI 使用
uv pip install 'deerflow-harness[tui]'
deerflow
deerflow --continue
deerflow --resume THREAD
deerflow --print "summarize this repo"
deerflow --json "hello"
注意:PyPI 上名为 deerflow-harness 的包在 2026-06-30 查询时显示为 0.0.1 placeholder,而仓库内 backend/packages/harness/pyproject.toml 标注版本为 2.1.0。因此实际使用应以仓库 README/源码安装方式为准,避免误装占位包。
8.4 Embedded Python Client
from deerflow.client import DeerFlowClient
client = DeerFlowClient()
response = client.chat("Analyze this paper for me", thread_id="my-thread")
for event in client.stream("hello"):
if event.type == "messages-tuple" and event.data.get("type") == "ai":
print(event.data["content"])9. 售前可以怎么讲
9.1 一句话话术
DeerFlow 是一个开源 Super Agent Harness,可以把大模型从“回答问题”升级为“完成任务”:它有沙箱、文件系统、技能、记忆、子代理和多端入口,适合构建企业内部的研究助手、内容助手、研发助手和长任务自动化平台。
9.2 面向业务负责人
它可以帮助团队自动完成资料收集、调研分析、报告生成、PPT/网页初稿、内容生产等重复性知识工作,把人工从“找资料和整理格式”中解放出来,更多聚焦判断和决策。
9.3 面向技术负责人
DeerFlow 基于 LangGraph 和 LangChain,提供完整 agent runtime、middleware chain、sandbox、MCP、skills、memory 和 subagents。它不是一个封闭 SaaS,而是 MIT 开源、可自托管、可扩展,可以作为内部 Agent 平台的工程参考。
9.4 面向安全负责人
DeerFlow 具备系统命令执行、文件读写、业务逻辑调用等高权限能力,所以不能裸露公网。正确方式是本地可信网络、强认证、IP 白名单、网络隔离、沙箱隔离、最小权限和审计追踪。
10. 客户痛点映射
| 客户痛点 | DeerFlow 对应能力 | 售前切入 |
|---|---|---|
| RAG 只能问答,不能执行 | Sandbox、Tools、File System | 从知识问答升级为任务执行 |
| 复杂任务容易丢上下文 | Context Engineering、Memory、Sub-agents | 支撑长任务和多步骤流程 |
| 内部流程难集成 | MCP、Python tools、Gateway API | 接企业系统和工具链 |
| Agent 输出不可控 | Skills、Prompt、Workflow、Human review 可扩展 | 用企业方法论约束输出 |
| 缺少审计和排错 | LangSmith、Langfuse tracing | 可观测、可复盘、可评估 |
| 多入口使用麻烦 | Web UI、TUI、IM Channels | 嵌入现有工作流 |
| 模型选择不确定 | Multi-model、OpenAI-compatible、vLLM | 不绑定单一模型供应商 |
11. 常见客户问题
| 问题 | 建议回答 |
|---|---|
| 它和普通 RAG 有什么区别? | RAG 主要解决“查资料后回答”,DeerFlow 更偏“长任务执行”,能规划、调用工具、写文件、派生子代理并生成交付物。 |
| 它和 LangGraph 是什么关系? | DeerFlow 基于 LangGraph 和 LangChain 构建,LangGraph 更底层,DeerFlow 是更完整的 Agent 应用和 harness。 |
| 能不能私有化部署? | 项目 MIT 开源,支持本地/Docker/生产部署,但需要按官方安全建议配置认证、网络隔离和沙箱。 |
| 能不能接企业微信/飞书/钉钉? | README 显示支持 Telegram、Slack、Feishu/Lark、WeChat、WeCom、DingTalk 等 IM 渠道,实际落地需要配置对应平台密钥。 |
| 能接内部系统吗? | 可以通过 MCP Server、Python tools、API 和文件系统接入,但要做权限控制和审计。 |
| 生产可用吗? | 项目活跃、功能完整,但 2.0 是新重写版本。建议先做 PoC,再做安全、稳定性、性能、版本锁定和回归测试。 |
| 能否用国产模型? | README 推荐 Doubao-Seed-2.0-Code、DeepSeek v3.2、Kimi 2.5,也支持 OpenAI-compatible/vLLM 等方式接入。 |
| 最大风险是什么? | 高权限工具和命令执行带来的安全风险,以及长任务成本、延迟、稳定性和模型工具调用可靠性。 |
12. PoC 建议
12.1 PoC 一:售前调研助手
目标:输入客户名称、官网、行业和竞品,自动生成售前研究报告。
建议验证:
| 指标 | 验证方式 |
|---|---|
| 信息完整性 | 是否覆盖客户背景、业务、竞品、行业趋势 |
| 来源可靠性 | 是否保留来源链接 |
| 交付质量 | 是否可直接形成拜访提纲或方案初稿 |
| 效率提升 | 与人工调研耗时对比 |
| 可控性 | 能否用 skill 固化售前模板 |
12.2 PoC 二:企业文档分析与报告生成
目标:上传多份 PDF/Word/PPT/Excel,生成摘要、风险点、建议和最终报告。
验证重点:
- 文件上传和转换能力
- 长上下文处理能力
- 结果结构化质量
- 输出文件可交付程度
- 敏感资料隔离和权限
12.3 PoC 三:研发代码助手
目标:让 DeerFlow 分析一个真实代码仓库,完成小修复或生成架构说明。
验证重点:
- 仓库理解能力
- 文件读写能力
- bash/test 执行能力
- TUI 使用体验
- 生成变更说明和审计记录
12.4 PoC 四:IM 入口企业助手
目标:在飞书/企业微信/钉钉中接入 DeerFlow,让业务人员通过聊天提交任务。
验证重点:
- 渠道接入成本
- 用户体验
- 权限和身份映射
- 文件上传/下载
- 多轮任务状态管理
13. 风险和注意事项
13.1 安全风险是第一优先级
官方 README 明确提示:DeerFlow 具备系统命令执行、资源操作和业务逻辑调用等高权限能力,默认设计为本地可信环境。公网或不可信网络部署必须采取严格安全措施。
建议:
- 不要裸露公网。
- 使用强认证和反向代理。
- 配置 IP 白名单。
- 网络隔离到专用 VLAN。
- 生产环境优先使用 Docker/Kubernetes sandbox。
- 对高危工具做最小权限和审计。
- 禁止 Agent 直接操作生产数据库写权限。
13.2 Docker Socket 风险
配置文档指出,某些 Docker-outside-of-Docker 模式需要挂载宿主机 Docker socket,而 Docker socket 等价于宿主机 root 级控制能力。多租户或公网环境应优先考虑 provisioner/Kubernetes 隔离方式。
13.3 2.0 重写后的稳定性
DeerFlow 2.0 是 ground-up rewrite,说明架构已经升级,但也意味着:
- 版本可能快速变化。
- 文档和实现可能有更新差异。
- 生产落地需要锁定版本。
- 需要完整回归测试。
13.4 PyPI 包名注意
2026-06-30 查询 deerflow-harness PyPI 显示为 placeholder 0.0.1,而仓库内 harness 版本为 2.1.0。售前演示和 PoC 不应直接依赖 PyPI 占位包,应按仓库官方安装路径执行。
13.5 成本和性能
长任务、子代理、搜索、抓取、代码执行、多模型调用会带来成本和延迟。
PoC 时建议记录:
- 单任务耗时
- 模型调用次数
- token 消耗
- 工具调用次数
- 失败重试次数
- 人工介入次数
- 生成结果可用率
14. 竞争与替代方案视角
| 类别 | 代表 | 与 DeerFlow 的差异 |
|---|---|---|
| RAG 框架 | Dify、RAGFlow、LangChain RAG | 更偏知识问答,长任务和执行环境不是核心 |
| Agent 编排框架 | LangGraph、AutoGen、CrewAI | LangGraph 更底层;DeerFlow 提供完整应用和 harness |
| Deep Research 产品 | 各类研究 Agent/SaaS | DeerFlow 开源、可自托管、可改造 |
| Coding Agent | Claude Code、Codex、Cursor | DeerFlow 覆盖研究、内容、文件、IM、多端入口,不只 coding |
| RPA/BPM | UiPath、Power Automate、传统工作流 | RPA 更确定性;DeerFlow 更适合开放式知识任务 |
售前判断:如果客户想做“企业 Agent 平台 PoC”,DeerFlow 比纯框架更快出效果;如果客户只需要简单问答,则可能过重;如果客户需要严格生产流程控制,则要和工作流/审批/权限系统结合,而不是让 Agent 单独承担全部责任。
15. 我的售前判断
DeerFlow 是一个非常适合作为售前演示和 PoC 底座的开源项目。它的亮点不是单点算法,而是把 Agent 落地需要的一整套工程能力打包在一起:Web UI、Gateway、TUI、IM、sandbox、文件系统、skills、memory、subagents、MCP 和 tracing。
它适合向客户展示“AI 从聊天走向任务执行”的新阶段,尤其适合深度研究、售前资料准备、内容生成、文档分析、研发辅助和企业内部 Agent 平台建设。
但它也不是直接开箱上生产的银弹。真正落地时,安全边界、认证授权、沙箱隔离、工具权限、成本控制、可观测性、评估体系和版本治理都必须同步设计。售前推荐用它做一个边界清晰的 PoC:选择非生产数据、只读系统、有限工具、明确输出指标,让客户先看到长任务 Agent 的业务价值,再讨论生产化改造。