1. 项目概览
| 维度 | 信息 |
|---|---|
| 项目名称 | ComfyUI |
| GitHub | Comfy-Org/ComfyUI |
| 官网 | comfy.org |
| 官方文档 | docs.comfy.org |
| 项目定位 | 节点式 generative AI 工作流引擎与推理后端 |
| GitHub 描述 | The most powerful and modular diffusion model GUI, api and backend with a graph/nodes interface |
| 开源协议 | GNU GPL v3 |
| 主要语言 | Python |
| Python 要求 | pyproject.toml 标注 >=3.10;README 建议 Python 3.13,遇到依赖问题可用 3.12 |
| 当前版本 | 0.26.0 |
| 最新 Release | v0.26.0,2026-06-23 发布 |
| 仓库热度 | 2026-06-30 检查:约 119k stars、13.9k forks、3.8k issues、353 PR |
| 支持平台 | Windows、Linux、macOS;NVIDIA、AMD、Intel、Apple Silicon、Ascend、Cambricon、Iluvatar 等硬件路径 |
| 商业产品线 | Comfy Desktop、Comfy Cloud、Comfy API、Comfy Enterprise、Comfy MCP |
ComfyUI 的一句话定位:它是一个用节点图搭建生成式 AI 流水线的开放工作台。对业务用户,它像一个高级可视化创作工具;对技术团队,它是一个可集成的本地/云端推理后端;对企业客户,它可以成为内部视觉生成、视频生成、3D 生成、营销素材生产和创意自动化的基础设施。
2. 官方示意图和关键视觉资料
2.1 ComfyUI 官方界面截图
README 自带官方界面截图,能直观看出它的节点式工作流形态:
售前解读:这张图适合用来解释 ComfyUI 和普通文生图工具的差异。普通工具通常是一个输入框加几个参数,ComfyUI 则把模型加载、提示词、ControlNet、采样、VAE、后处理、输出等步骤拆成节点,形成可复用、可调试、可版本化的生产流水线。
2.2 Workflow 官方简单示意
官方文档中的简单工作流示意:

2.3 Workflow 官方复杂示意
官方文档中的复杂工作流示意:

售前解读:这两张图可以帮助客户理解从“简单生成”到“复杂生产流程”的跃迁。复杂工作流可以把多模型、多步骤、多控制条件、多后处理串在一起,适合可复用的企业模板。
2.4 App Mode 官方示意
App Mode 可以把复杂节点图包装成更简单的输入/输出界面,面向非技术用户。

售前解读:这是 ComfyUI 从“专业工作台”走向“业务应用”的关键能力。技术或创意专家搭建复杂工作流后,可以把可调参数暴露给业务用户,业务用户只需要上传素材、输入文案、选择参数并点击运行。
2.5 Partner Nodes 官方示意
Partner Nodes 用于在 ComfyUI 工作流中调用闭源或第三方托管模型。

售前解读:这说明 ComfyUI 不只是本地开源模型 UI,也在变成一个“统一生成式 AI 编排界面”,可以把本地开源模型、云端闭源模型、后处理节点和企业流程组合到同一条流水线。
3. 它主要能做什么
3.1 节点式生成工作流
ComfyUI 的核心是 node graph。一个 workflow 是由多个 node 连接形成的 graph,可以生成图片、视频、音频、3D 模型、AI 模型,甚至与 AI agent 流程结合。
节点式工作流的价值:
- 每一步可见:模型、提示词、采样器、尺寸、种子、后处理都在图中。
- 每一步可调:参数不是隐藏在黑盒工具里。
- 每一步可复用:工作流可以保存为 JSON,也可以嵌入生成图片元数据。
- 每一步可组合:本地模型、闭源 API、后处理、上传/下载和自定义节点可以串联。
3.2 图像生成与编辑
README 列出的支持范围包括:
- SD1.x、SD2.x
- SDXL、SDXL Turbo
- Stable Cascade
- SD3 / SD3.5
- PixArt Alpha / Sigma
- AuraFlow
- HunyuanDiT
- Flux、Flux Kontext、Flux 2
- Lumina Image 2.0
- HiDream、HiDream E1.1
- Qwen Image、Qwen Image Edit
- Hunyuan Image 2.1
- Z Image
- Ernie Image
- Inpainting
- ControlNet 和 T2I-Adapter
- Area Composition
- Upscale
- LoRA、Hypernetwork、Textual Inversion
售前可说:它覆盖的是“开放模型生态的一线战场”,新模型出来后社区和官方通常会很快跟进。
3.3 视频、音频和 3D 生成
README 明确列出:
| 类型 | 示例 |
|---|---|
| 视频 | Stable Video Diffusion、Mochi、LTX-Video、Hunyuan Video、Wan 2.1、Wan 2.2、Hunyuan Video 1.5 |
| 音频 | Stable Audio、ACE Step |
| 3D | Hunyuan3D 2.0 |
官网也将应用行业指向 VFX & Animation、Advertising & Creative Studios、Gaming、eCommerce & Fashion 等。
3.4 工作流复用、分享和模板化
ComfyUI 支持:
- 工作流保存为 JSON。
- 生成 PNG/WebP/FLAC 文件中保存完整 workflow 和 seed。
- 拖拽生成图片回网页即可加载当时的 workflow。
- 使用官方 Workflow Templates。
- 使用 Comfy Hub 上的社区工作流。
售前价值:
- 创意流程可以被沉淀为资产。
- 高质量提示词和节点组合可以复用。
- 团队可以建立内部模板库。
- 输出可追溯,便于复盘“这张图是怎么生成的”。
3.5 App Mode:把复杂工作流变成简单应用
官方 App Mode 文档说明:可以为 workflow 定义自定义输入/输出界面,让用户无需编辑节点即可使用复杂工作流。
典型流程:
- 选择要暴露的输入,例如图片上传、文字 prompt、模型选择。
- 选择要展示的输出,例如 Preview 或 Save Image。
- 预览 App 布局。
- 设置默认打开视图为 App 或 Node Graph。
- 通过 Share 生成链接,让别人直接运行 workflow。
售前价值:
- 专家设计工作流,业务用户使用工作流。
- 能把 ComfyUI 从“专家工具”包装成“业务应用”。
- 适合内部营销素材生成器、商品图生成器、海报生成器、风格化头像生成器等场景。
3.6 API、队列和生产集成
官方 server routes 文档说明:Web 客户端提交 workflow 时会 POST 到 /prompt,服务端验证 prompt 后加入执行队列,返回 prompt_id 和队列位置,或返回错误信息。
常见 API:
| 路由 | 用途 |
|---|---|
/ | 加载 Comfy 网页 |
/ws | WebSocket 实时通信 |
/prompt GET/POST | 查看队列状态、提交 workflow |
/queue GET/POST | 查看或管理执行队列 |
/history GET/POST | 查看或管理执行历史 |
/upload/image | 上传图片 |
/view | 查看生成图片 |
/system_stats | 查看 Python、设备、显存等系统信息 |
/object_info | 查看所有节点类型信息 |
/models | 查看模型类型 |
/models/{folder} | 查看某类模型 |
售前价值:
- 可嵌入企业系统,而不是只作为单机 UI。
- 支持排队、进度、历史、上传、输出查看。
- 可对接电商商品图系统、内容平台、素材库、DAM、营销自动化系统。
3.7 Partner Nodes:接入闭源/第三方模型
Partner Nodes 允许在 ComfyUI workflow 中调用外部 API 模型。官方说明其优势包括:
- 使用闭源或第三方托管模型,无需自行部署。
- 与其他 ComfyUI 节点兼容。
- 不需要复杂 API key 管理。
- 预付费 credits,控制成本。
- 完全可选,ComfyUI core 仍保持开源和本地可用。
可用于混合工作流:
- 用 GPT-Image-1 生成底图,再用本地 Wan 节点生成视频。
- 用外部模型生成图像,再走本地超分、风格迁移或后处理。
- 把开源模型和商业模型组合到同一流程。
如果客户不希望外联,可通过:
python main.py --disable-api-nodes
禁用所有 API nodes,并阻止前端与互联网通信。
3.8 Agent Tools / MCP
官方文档说明 ComfyUI 提供 MCP servers 和 Comfy CLI,让 AI agents 和开发者无需总打开画布,也能生成图片、视频、音频和 3D 内容。
| 方式 | 类型 | 适合 |
|---|---|---|
| Comfy Cloud MCP | 远程托管 | Chat-driven agents、模板搜索、云端 GPU |
| Comfy Partner MCP | 本地 MCP server | 通过 30+ partner providers 统一生成 |
| Comfy CLI | 本地 CLI | 脚本、CI、批处理 |
售前价值:
- 可把 ComfyUI 接到 Claude、Cursor、Codex、企业 Agent 平台。
- Agent 可以通过自然语言发起图片、视频、3D、音频生成。
- 适合把 AIGC 能力纳入企业智能体工作流。
4. 适用场景
4.1 广告与创意工作室
适合:
- 海报生成
- 分镜和 moodboard
- 品牌视觉风格探索
- 多版本素材 A/B 测试
- 创意概念图和视觉提案
价值:
- 快速迭代大量视觉方向。
- 节点工作流保证风格和参数可复用。
- App Mode 可让策划、运营、设计助理使用专家工作流。
4.2 电商与商品图生产
适合:
- 商品背景替换
- 模特换装
- 商品场景图
- 批量风格化
- 超分和修复
- SKU 多版本素材生成
价值:
- 将“商品图输入 → 背景/风格/尺寸/输出”流程固化为工作流。
- 可通过 API 接入商品素材库和内容生产平台。
- 适合批处理和规模化生产。
4.3 游戏、美术和概念设计
适合:
- 角色设定
- 场景概念图
- 道具图
- 贴图和风格探索
- 3D 资产初稿
价值:
- 多模型、多 LoRA、多控制条件组合。
- 可记录完整参数和生成路径,方便美术团队复盘。
- 与 Blender/Nuke/Maya 类节点图思维相近,专业用户容易理解。
4.4 影视、动画和 VFX
适合:
- 概念视觉
- 风格参考
- 镜头图
- 视频生成/补帧/风格化
- 背景和素材生成
价值:
- 支持视频模型和复杂后处理流程。
- 节点图适合专业制作链路。
- 可在本地 GPU 环境保障素材和 IP 不外泄。
4.5 企业内部 AIGC 平台
适合建设:
- 内部视觉生成平台
- 可复用工作流模板库
- 品牌规范化生成工具
- 多模型统一入口
- AI agent 调用的生成式媒体能力
价值:
- ComfyUI 作为 workflow engine。
- App Mode 作为业务使用层。
- Local API / Cloud API / MCP 作为系统集成层。
- 自定义节点和 ComfyUI-Manager 扩展企业能力。
5. 不太适合的场景
| 场景 | 原因 |
|---|---|
| 只要最简单的文生图 | Midjourney、即梦、豆包、DALL·E 等产品门槛更低 |
| 非技术用户直接搭复杂流程 | 节点图学习成本较高,需要模板或 App Mode |
| 强 SaaS 托管、零运维要求 | 本地 ComfyUI 需要模型、显卡、依赖、插件维护;可考虑 Comfy Cloud |
| 对开源许可证限制敏感的商业再分发 | GPL v3 有 copyleft 要求,产品化分发需法务评估 |
| 对结果确定性和合规审查要求极高 | 生成式 AI 输出需审核,不能无人工流程直接上线 |
| 大规模高并发生产但无 GPU/队列/监控建设 | 需要专门的算力调度、存储、审计和任务治理 |
6. 核心能力清单
| 能力 | 说明 | 售前价值 |
|---|---|---|
| Node Graph | 节点式可视化 workflow | 专业可控、可复用、可审计 |
| 多模型支持 | 图片、编辑、视频、音频、3D | 一个界面覆盖多种生成任务 |
| 本地离线运行 | core 不主动下载内容,支持完全离线 | 适合数据/IP 敏感客户 |
| API Nodes | 可选调用闭源/第三方模型 | 混合本地与云端 SOTA 能力 |
| App Mode | 复杂流程包装成简单应用 | 降低业务用户使用门槛 |
| Local API | /prompt、/queue、/history、/ws 等 | 可接企业系统和自动化流程 |
| 异步队列 | 提交任务、排队、取消、历史 | 支持生产化任务管理 |
| 增量执行 | 只重新执行变化部分 | 提升迭代效率,节省显存和时间 |
| 智能显存管理 | 低显存可 offload | 降低硬件门槛 |
| 工作流元数据 | PNG/WebP/FLAC 内保存 workflow | 结果可追溯,可复现 |
| Custom Nodes | 社区和企业自定义扩展 | 强生态和定制能力 |
| ComfyUI-Manager | 管理 custom nodes | 降低扩展维护成本 |
| MCP / CLI | Agent 和脚本调用生成能力 | 接入智能体、CI、批处理 |
7. 架构、部署和集成方式
7.1 基础架构理解
7.2 本地部署方式
官方提供多条路径:
| 方式 | 适合 |
|---|---|
| Desktop Application | Windows/macOS 用户快速上手 |
| Windows Portable Package | Windows 用户便携运行,适合 NVIDIA/AMD/Intel 包 |
| comfy-cli | 命令行安装和启动 |
| Manual Install | Windows/Linux/macOS/多硬件平台 |
| Comfy Cloud | 没有本地硬件或希望云端 GPU |
7.3 安装命令示例
使用 comfy-cli:
pip install comfy-cli
comfy install
手动安装:
git clone https://github.com/Comfy-Org/ComfyUI.git
cd ComfyUI
pip install -r requirements.txt
python main.py
NVIDIA PyTorch 示例:
pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu130
启用 ComfyUI-Manager:
pip install -r manager_requirements.txt
python main.py --enable-manager
7.4 生产集成建议
对于企业集成,建议分层设计:
| 层级 | 建议 |
|---|---|
| 创作层 | 用 ComfyUI/Comfy Desktop 给专家搭 workflow |
| 应用层 | 用 App Mode 暴露业务参数 |
| 服务层 | 通过 /prompt、/queue、/history、/ws 接业务系统 |
| 算力层 | 本地 GPU、私有 GPU 集群或 Comfy Cloud |
| 资产层 | 对接 DAM、素材库、对象存储、审核系统 |
| 治理层 | 权限、成本、模型版本、模板版本、日志、内容审核 |
8. 售前可以怎么讲
8.1 面向业务负责人
ComfyUI 可以把图片、视频、3D 和音频生成从“个人试用工具”变成“团队可复用的内容生产流程”。创意专家搭好流程后,业务人员可以通过简化界面运行,减少反复沟通和手工调参。
8.2 面向创意和设计团队
ComfyUI 的优势是控制力。每个模型、参数、处理步骤和输出都可见、可调、可复用。它适合专业视觉团队探索风格、批量生成素材、固化品牌视觉流程。
8.3 面向技术负责人
ComfyUI 既是 GUI,也是 API 和后端。它提供 prompt 队列、WebSocket 进度、系统状态、模型列表、历史记录和对象信息接口,可以接入企业内部生产系统。自定义节点和 MCP 也方便扩展。
8.4 面向安全/合规负责人
ComfyUI core 可以完全本地离线运行;如果企业不希望外联,可通过 --disable-api-nodes 禁用 API nodes。需要注意 GPL v3 许可证、模型权利、训练数据来源、输出内容审核和用户上传素材安全。
9. 客户痛点映射
| 客户痛点 | ComfyUI 对应能力 |
|---|---|
| 单次生成工具不可复用 | Workflow JSON、节点图、模板库 |
| 结果难复现 | 生成图片内嵌 workflow 和 seeds |
| 专业流程太复杂,业务用户不会用 | App Mode |
| 本地开源模型和闭源模型割裂 | Partner Nodes / API Nodes |
| 创意流程需要系统集成 | Local API、Cloud API、MCP、CLI |
| 数据和素材不希望外发 | 本地离线运行、禁用 API nodes |
| 多模型切换和新模型适配快 | 开放模型生态、custom nodes、ComfyUI-Manager |
| 批量任务缺少队列 | 异步队列、history、interrupt |
10. 常见客户问题
| 问题 | 回答建议 |
|---|---|
| ComfyUI 和 Midjourney/即梦这类产品有什么区别? | 那类产品更像开箱即用的生成服务,ComfyUI 更像可控的工作流引擎,适合专业团队和企业流程。 |
| 普通业务人员能用吗? | 直接编辑节点图有门槛,但 App Mode 可以把复杂 workflow 封装成简单表单和输出界面。 |
| 能私有化部署吗? | 可以本地运行,core 可离线;但要自己管理模型、GPU、插件、安全和运维。 |
| 能调用商业模型吗? | 可以通过 Partner/API Nodes 调用闭源或托管模型,也可以完全禁用这些节点。 |
| 能接企业系统吗? | 可以通过本地 API、Cloud API、MCP、CLI 或自定义节点集成。 |
| 许可证有什么注意? | ComfyUI 是 GPL v3。内部使用通常问题较小,但如二次分发、嵌入商业产品或闭源改造,需要法务评估。 |
| 能做视频/3D/音频吗? | README 已列出视频、音频和 3D 模型支持,但具体效果依赖模型、算力和 workflow。 |
| 对硬件要求高吗? | 生成类模型通常依赖 GPU;ComfyUI 有显存管理和 CPU 模式,但 CPU 会慢。也可选择 Comfy Cloud。 |
11. PoC 建议
11.1 PoC 一:品牌营销素材生成器
目标:为客户品牌建立一个可复用工作流,输入产品图、活动主题和尺寸,输出多版本海报或社媒图。
验证指标:
| 指标 | 说明 |
|---|---|
| 品牌一致性 | 风格、色彩、字体、构图是否稳定 |
| 复用性 | 同一 workflow 能否覆盖多个产品/SKU |
| 使用门槛 | App Mode 下业务用户能否独立操作 |
| 效率 | 从需求到初稿耗时减少多少 |
| 审核 | 是否保留 workflow 和参数,便于复盘 |
11.2 PoC 二:电商商品图批处理
目标:接入商品图和 SKU 数据,批量生成背景图、场景图、超分图。
验证指标:
- 批量吞吐量
- 单图生成成本
- 失败率
- 队列管理能力
- 结果一致性
- API 集成便利性
11.3 PoC 三:创意团队工作流模板库
目标:沉淀 5-10 个常用工作流模板,例如头像风格化、背景替换、ControlNet 姿态图、视频封面、短视频风格化。
验证指标:
- 模板可复用度
- 模板分享和版本管理
- custom nodes 依赖稳定性
- 新用户学习成本
11.4 PoC 四:Agent 调用 ComfyUI 生成内容
目标:让企业 Agent 通过 MCP 或 API 调用 ComfyUI,完成“文字需求 → 生成视觉素材 → 返回结果”的流程。
验证指标:
- MCP/CLI/API 调用成功率
- 生成任务状态回传
- 多轮修改体验
- 权限和成本控制
- 内容审核链路
12. 风险和注意事项
12.1 GPL v3 许可证
ComfyUI 使用 GPL v3。对于内部研究、内部使用和自托管通常较友好,但如果客户计划二次分发、嵌入商业软件、闭源修改或提供 SaaS,需要法务确认义务边界。
12.2 模型和素材版权
ComfyUI 是工具,输出合规取决于:
- 使用的模型许可
- LoRA/ControlNet/素材许可
- 输入素材授权
- 生成内容是否侵犯第三方权益
- 客户所在地区的 AI 内容监管要求
售前不要承诺“生成内容天然可商用”,必须让客户按模型和素材来源逐项确认。
12.3 Custom Nodes 生态风险
ComfyUI 的扩展生态强,但 custom nodes 也带来:
- 依赖冲突
- 版本兼容问题
- 安全风险
- 维护者停止更新
- 工作流迁移失败
生产建议:建立企业批准的节点白名单和版本锁定机制。
12.4 API Nodes 外联和费用
Partner Nodes/API Nodes 是可选能力,涉及账号、credits、网络和外部 API 调用。企业若对数据外发敏感,应禁用或单独审批。
12.5 算力和运维
本地部署需要考虑:
- GPU 型号和显存
- 模型存储
- 任务队列
- 并发控制
- 监控告警
- 输出文件存储
- 用户权限
- 插件升级
13. 与相邻方案对比
| 方案 | 更适合 | 与 ComfyUI 的差异 |
|---|---|---|
| Midjourney / 即梦 / DALL·E | 快速出图、低门槛创作 | 控制力、私有化和流程集成较弱 |
| Stable Diffusion WebUI | 个人/半专业 SD 操作 | ComfyUI 更强调节点工作流和可组合性 |
| Photoshop + Firefly | 设计师图像编辑 | 更偏传统设计工具融合,开放模型生态较弱 |
| Runway / Pika / Kling | 视频生成产品 | ComfyUI 可把视频模型纳入更复杂流程 |
| Dify/Agent 平台 | 文本/工具型 Agent | ComfyUI 更偏视觉/多媒体生成引擎 |
| 自研推理服务 | 强定制、规模化生产 | 成本高,ComfyUI 更适合快速搭建和验证 |
14. 我的售前判断
ComfyUI 是 AIGC 视觉生产领域非常值得重点关注的开源项目。它最大的价值不是“又一个文生图 UI”,而是把生成式 AI 变成可视化、可组合、可复用、可追踪的工作流系统。
对售前来说,它适合在以下机会中切入:
- 客户希望建设内部 AIGC 创作平台。
- 客户有大量营销、电商、游戏、影视、设计素材生产需求。
- 客户不满足于单一 SaaS 出图工具,希望掌控模型、参数、流程和数据。
- 客户需要把 AIGC 能力接入业务系统或 Agent 平台。
同时要提醒客户:ComfyUI 本身不是完整企业治理平台。生产落地还需要补齐身份权限、模板治理、节点白名单、模型版权、内容审核、GPU 调度、日志审计、成本控制和合规流程。
一句售前总结:
ComfyUI 适合作为企业视觉 AIGC 工作流引擎:专家用节点图搭流程,业务用 App Mode 跑流程,系统用 API/MCP 调流程,企业用治理和算力平台管流程。