ComfyUI

← 返回项目列表

ComfyUI 是面向视觉生成与多模态内容生产的开源节点式工作流引擎，核心价值是让专业创作者和技术团队精细控制“模型、参数、处理步骤和输出”。它既可以本地离线运行，也可以通过 Desktop、Cloud、API、MCP、App Mode 和 Partner Nodes 延展到企业生产流程。售前场景下，它适合用来讲“从单次生成工具升级为可复用、可审计、可集成的 AIGC 生产流水线”。

1. 项目概览

维度	信息
项目名称	ComfyUI
GitHub	Comfy-Org/ComfyUI
官网	comfy.org
官方文档	docs.comfy.org
项目定位	节点式 generative AI 工作流引擎与推理后端
GitHub 描述	The most powerful and modular diffusion model GUI, api and backend with a graph/nodes interface
开源协议	GNU GPL v3
主要语言	Python
Python 要求	`pyproject.toml` 标注 `>=3.10`；README 建议 Python 3.13，遇到依赖问题可用 3.12
当前版本	`0.26.0`
最新 Release	`v0.26.0`，2026-06-23 发布
仓库热度	2026-06-30 检查：约 119k stars、13.9k forks、3.8k issues、353 PR
支持平台	Windows、Linux、macOS；NVIDIA、AMD、Intel、Apple Silicon、Ascend、Cambricon、Iluvatar 等硬件路径
商业产品线	Comfy Desktop、Comfy Cloud、Comfy API、Comfy Enterprise、Comfy MCP

ComfyUI 的一句话定位：它是一个用节点图搭建生成式 AI 流水线的开放工作台。对业务用户，它像一个高级可视化创作工具；对技术团队，它是一个可集成的本地/云端推理后端；对企业客户，它可以成为内部视觉生成、视频生成、3D 生成、营销素材生产和创意自动化的基础设施。

2. 官方示意图和关键视觉资料

2.1 ComfyUI 官方界面截图

README 自带官方界面截图，能直观看出它的节点式工作流形态：

售前解读：这张图适合用来解释 ComfyUI 和普通文生图工具的差异。普通工具通常是一个输入框加几个参数，ComfyUI 则把模型加载、提示词、ControlNet、采样、VAE、后处理、输出等步骤拆成节点，形成可复用、可调试、可版本化的生产流水线。

2.2 Workflow 官方简单示意

官方文档中的简单工作流示意：

2.3 Workflow 官方复杂示意

官方文档中的复杂工作流示意：

售前解读：这两张图可以帮助客户理解从“简单生成”到“复杂生产流程”的跃迁。复杂工作流可以把多模型、多步骤、多控制条件、多后处理串在一起，适合可复用的企业模板。

2.4 App Mode 官方示意

App Mode 可以把复杂节点图包装成更简单的输入/输出界面，面向非技术用户。

售前解读：这是 ComfyUI 从“专业工作台”走向“业务应用”的关键能力。技术或创意专家搭建复杂工作流后，可以把可调参数暴露给业务用户，业务用户只需要上传素材、输入文案、选择参数并点击运行。

2.5 Partner Nodes 官方示意

Partner Nodes 用于在 ComfyUI 工作流中调用闭源或第三方托管模型。

售前解读：这说明 ComfyUI 不只是本地开源模型 UI，也在变成一个“统一生成式 AI 编排界面”，可以把本地开源模型、云端闭源模型、后处理节点和企业流程组合到同一条流水线。

3. 它主要能做什么

3.1 节点式生成工作流

ComfyUI 的核心是 node graph。一个 workflow 是由多个 node 连接形成的 graph，可以生成图片、视频、音频、3D 模型、AI 模型，甚至与 AI agent 流程结合。

节点式工作流的价值：

每一步可见：模型、提示词、采样器、尺寸、种子、后处理都在图中。
每一步可调：参数不是隐藏在黑盒工具里。
每一步可复用：工作流可以保存为 JSON，也可以嵌入生成图片元数据。
每一步可组合：本地模型、闭源 API、后处理、上传/下载和自定义节点可以串联。

3.2 图像生成与编辑

README 列出的支持范围包括：

SD1.x、SD2.x
SDXL、SDXL Turbo
Stable Cascade
SD3 / SD3.5
PixArt Alpha / Sigma
AuraFlow
HunyuanDiT
Flux、Flux Kontext、Flux 2
Lumina Image 2.0
HiDream、HiDream E1.1
Qwen Image、Qwen Image Edit
Hunyuan Image 2.1
Z Image
Ernie Image
Inpainting
ControlNet 和 T2I-Adapter
Area Composition
Upscale
LoRA、Hypernetwork、Textual Inversion

售前可说：它覆盖的是“开放模型生态的一线战场”，新模型出来后社区和官方通常会很快跟进。

3.3 视频、音频和 3D 生成

README 明确列出：

类型	示例
视频	Stable Video Diffusion、Mochi、LTX-Video、Hunyuan Video、Wan 2.1、Wan 2.2、Hunyuan Video 1.5
音频	Stable Audio、ACE Step
3D	Hunyuan3D 2.0

官网也将应用行业指向 VFX & Animation、Advertising & Creative Studios、Gaming、eCommerce & Fashion 等。

3.4 工作流复用、分享和模板化

ComfyUI 支持：

工作流保存为 JSON。
生成 PNG/WebP/FLAC 文件中保存完整 workflow 和 seed。
拖拽生成图片回网页即可加载当时的 workflow。
使用官方 Workflow Templates。
使用 Comfy Hub 上的社区工作流。

售前价值：

创意流程可以被沉淀为资产。
高质量提示词和节点组合可以复用。
团队可以建立内部模板库。
输出可追溯，便于复盘“这张图是怎么生成的”。

3.5 App Mode：把复杂工作流变成简单应用

官方 App Mode 文档说明：可以为 workflow 定义自定义输入/输出界面，让用户无需编辑节点即可使用复杂工作流。

典型流程：

选择要暴露的输入，例如图片上传、文字 prompt、模型选择。
选择要展示的输出，例如 Preview 或 Save Image。
预览 App 布局。
设置默认打开视图为 App 或 Node Graph。
通过 Share 生成链接，让别人直接运行 workflow。

售前价值：

专家设计工作流，业务用户使用工作流。
能把 ComfyUI 从“专家工具”包装成“业务应用”。
适合内部营销素材生成器、商品图生成器、海报生成器、风格化头像生成器等场景。

3.6 API、队列和生产集成

官方 server routes 文档说明：Web 客户端提交 workflow 时会 POST 到 /prompt，服务端验证 prompt 后加入执行队列，返回 prompt_id 和队列位置，或返回错误信息。

常见 API：

路由	用途
`/`	加载 Comfy 网页
`/ws`	WebSocket 实时通信
`/prompt` GET/POST	查看队列状态、提交 workflow
`/queue` GET/POST	查看或管理执行队列
`/history` GET/POST	查看或管理执行历史
`/upload/image`	上传图片
`/view`	查看生成图片
`/system_stats`	查看 Python、设备、显存等系统信息
`/object_info`	查看所有节点类型信息
`/models`	查看模型类型
`/models/{folder}`	查看某类模型

售前价值：

可嵌入企业系统，而不是只作为单机 UI。
支持排队、进度、历史、上传、输出查看。
可对接电商商品图系统、内容平台、素材库、DAM、营销自动化系统。

3.7 Partner Nodes：接入闭源/第三方模型

Partner Nodes 允许在 ComfyUI workflow 中调用外部 API 模型。官方说明其优势包括：

使用闭源或第三方托管模型，无需自行部署。
与其他 ComfyUI 节点兼容。
不需要复杂 API key 管理。
预付费 credits，控制成本。
完全可选，ComfyUI core 仍保持开源和本地可用。

可用于混合工作流：

用 GPT-Image-1 生成底图，再用本地 Wan 节点生成视频。
用外部模型生成图像，再走本地超分、风格迁移或后处理。
把开源模型和商业模型组合到同一流程。

如果客户不希望外联，可通过：

python main.py --disable-api-nodes

禁用所有 API nodes，并阻止前端与互联网通信。

3.8 Agent Tools / MCP

官方文档说明 ComfyUI 提供 MCP servers 和 Comfy CLI，让 AI agents 和开发者无需总打开画布，也能生成图片、视频、音频和 3D 内容。

方式	类型	适合
Comfy Cloud MCP	远程托管	Chat-driven agents、模板搜索、云端 GPU
Comfy Partner MCP	本地 MCP server	通过 30+ partner providers 统一生成
Comfy CLI	本地 CLI	脚本、CI、批处理

售前价值：

可把 ComfyUI 接到 Claude、Cursor、Codex、企业 Agent 平台。
Agent 可以通过自然语言发起图片、视频、3D、音频生成。
适合把 AIGC 能力纳入企业智能体工作流。

4. 适用场景

4.1 广告与创意工作室

适合：

海报生成
分镜和 moodboard
品牌视觉风格探索
多版本素材 A/B 测试
创意概念图和视觉提案

价值：

快速迭代大量视觉方向。
节点工作流保证风格和参数可复用。
App Mode 可让策划、运营、设计助理使用专家工作流。

4.2 电商与商品图生产

适合：

商品背景替换
模特换装
商品场景图
批量风格化
超分和修复
SKU 多版本素材生成

价值：

将“商品图输入 → 背景/风格/尺寸/输出”流程固化为工作流。
可通过 API 接入商品素材库和内容生产平台。
适合批处理和规模化生产。

4.3 游戏、美术和概念设计

适合：

角色设定
场景概念图
道具图
贴图和风格探索
3D 资产初稿

价值：

多模型、多 LoRA、多控制条件组合。
可记录完整参数和生成路径，方便美术团队复盘。
与 Blender/Nuke/Maya 类节点图思维相近，专业用户容易理解。

4.4 影视、动画和 VFX

适合：

概念视觉
风格参考
镜头图
视频生成/补帧/风格化
背景和素材生成

价值：

支持视频模型和复杂后处理流程。
节点图适合专业制作链路。
可在本地 GPU 环境保障素材和 IP 不外泄。

4.5 企业内部 AIGC 平台

适合建设：

内部视觉生成平台
可复用工作流模板库
品牌规范化生成工具
多模型统一入口
AI agent 调用的生成式媒体能力

价值：

ComfyUI 作为 workflow engine。
App Mode 作为业务使用层。
Local API / Cloud API / MCP 作为系统集成层。
自定义节点和 ComfyUI-Manager 扩展企业能力。

5. 不太适合的场景

场景	原因
只要最简单的文生图	Midjourney、即梦、豆包、DALL·E 等产品门槛更低
非技术用户直接搭复杂流程	节点图学习成本较高，需要模板或 App Mode
强 SaaS 托管、零运维要求	本地 ComfyUI 需要模型、显卡、依赖、插件维护；可考虑 Comfy Cloud
对开源许可证限制敏感的商业再分发	GPL v3 有 copyleft 要求，产品化分发需法务评估
对结果确定性和合规审查要求极高	生成式 AI 输出需审核，不能无人工流程直接上线
大规模高并发生产但无 GPU/队列/监控建设	需要专门的算力调度、存储、审计和任务治理

6. 核心能力清单

能力	说明	售前价值
Node Graph	节点式可视化 workflow	专业可控、可复用、可审计
多模型支持	图片、编辑、视频、音频、3D	一个界面覆盖多种生成任务
本地离线运行	core 不主动下载内容，支持完全离线	适合数据/IP 敏感客户
API Nodes	可选调用闭源/第三方模型	混合本地与云端 SOTA 能力
App Mode	复杂流程包装成简单应用	降低业务用户使用门槛
Local API	`/prompt`、`/queue`、`/history`、`/ws` 等	可接企业系统和自动化流程
异步队列	提交任务、排队、取消、历史	支持生产化任务管理
增量执行	只重新执行变化部分	提升迭代效率，节省显存和时间
智能显存管理	低显存可 offload	降低硬件门槛
工作流元数据	PNG/WebP/FLAC 内保存 workflow	结果可追溯，可复现
Custom Nodes	社区和企业自定义扩展	强生态和定制能力
ComfyUI-Manager	管理 custom nodes	降低扩展维护成本
MCP / CLI	Agent 和脚本调用生成能力	接入智能体、CI、批处理

7. 架构、部署和集成方式

7.1 基础架构理解

flowchart TB U["用户 / 业务系统 / Agent"] --> UI["ComfyUI Web / Desktop / App Mode"] U --> API["Local API / Cloud API / MCP / CLI"] UI --> S["ComfyUI Server"] API --> S S --> Q["Prompt Queue / Execution"] Q --> G["Workflow Graph"] G --> N["Nodes"] N --> M["Local Open Models"] N --> P["Partner/API Nodes"] N --> C["Custom Nodes"] Q --> O["Images / Video / Audio / 3D / Files"]

7.2 本地部署方式

官方提供多条路径：

方式	适合
Desktop Application	Windows/macOS 用户快速上手
Windows Portable Package	Windows 用户便携运行，适合 NVIDIA/AMD/Intel 包
comfy-cli	命令行安装和启动
Manual Install	Windows/Linux/macOS/多硬件平台
Comfy Cloud	没有本地硬件或希望云端 GPU

7.3 安装命令示例

使用 comfy-cli：

pip install comfy-cli
comfy install

手动安装：

git clone https://github.com/Comfy-Org/ComfyUI.git
cd ComfyUI
pip install -r requirements.txt
python main.py

NVIDIA PyTorch 示例：

pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu130

启用 ComfyUI-Manager：

pip install -r manager_requirements.txt
python main.py --enable-manager

7.4 生产集成建议

对于企业集成，建议分层设计：

层级	建议
创作层	用 ComfyUI/Comfy Desktop 给专家搭 workflow
应用层	用 App Mode 暴露业务参数
服务层	通过 `/prompt`、`/queue`、`/history`、`/ws` 接业务系统
算力层	本地 GPU、私有 GPU 集群或 Comfy Cloud
资产层	对接 DAM、素材库、对象存储、审核系统
治理层	权限、成本、模型版本、模板版本、日志、内容审核

8. 售前可以怎么讲

8.1 面向业务负责人

ComfyUI 可以把图片、视频、3D 和音频生成从“个人试用工具”变成“团队可复用的内容生产流程”。创意专家搭好流程后，业务人员可以通过简化界面运行，减少反复沟通和手工调参。

8.2 面向创意和设计团队

ComfyUI 的优势是控制力。每个模型、参数、处理步骤和输出都可见、可调、可复用。它适合专业视觉团队探索风格、批量生成素材、固化品牌视觉流程。

8.3 面向技术负责人

ComfyUI 既是 GUI，也是 API 和后端。它提供 prompt 队列、WebSocket 进度、系统状态、模型列表、历史记录和对象信息接口，可以接入企业内部生产系统。自定义节点和 MCP 也方便扩展。

8.4 面向安全/合规负责人

ComfyUI core 可以完全本地离线运行；如果企业不希望外联，可通过 --disable-api-nodes 禁用 API nodes。需要注意 GPL v3 许可证、模型权利、训练数据来源、输出内容审核和用户上传素材安全。

9. 客户痛点映射

客户痛点	ComfyUI 对应能力
单次生成工具不可复用	Workflow JSON、节点图、模板库
结果难复现	生成图片内嵌 workflow 和 seeds
专业流程太复杂，业务用户不会用	App Mode
本地开源模型和闭源模型割裂	Partner Nodes / API Nodes
创意流程需要系统集成	Local API、Cloud API、MCP、CLI
数据和素材不希望外发	本地离线运行、禁用 API nodes
多模型切换和新模型适配快	开放模型生态、custom nodes、ComfyUI-Manager
批量任务缺少队列	异步队列、history、interrupt

10. 常见客户问题

问题	回答建议
ComfyUI 和 Midjourney/即梦这类产品有什么区别？	那类产品更像开箱即用的生成服务，ComfyUI 更像可控的工作流引擎，适合专业团队和企业流程。
普通业务人员能用吗？	直接编辑节点图有门槛，但 App Mode 可以把复杂 workflow 封装成简单表单和输出界面。
能私有化部署吗？	可以本地运行，core 可离线；但要自己管理模型、GPU、插件、安全和运维。
能调用商业模型吗？	可以通过 Partner/API Nodes 调用闭源或托管模型，也可以完全禁用这些节点。
能接企业系统吗？	可以通过本地 API、Cloud API、MCP、CLI 或自定义节点集成。
许可证有什么注意？	ComfyUI 是 GPL v3。内部使用通常问题较小，但如二次分发、嵌入商业产品或闭源改造，需要法务评估。
能做视频/3D/音频吗？	README 已列出视频、音频和 3D 模型支持，但具体效果依赖模型、算力和 workflow。
对硬件要求高吗？	生成类模型通常依赖 GPU；ComfyUI 有显存管理和 CPU 模式，但 CPU 会慢。也可选择 Comfy Cloud。

11. PoC 建议

11.1 PoC 一：品牌营销素材生成器

目标：为客户品牌建立一个可复用工作流，输入产品图、活动主题和尺寸，输出多版本海报或社媒图。

验证指标：

指标	说明
品牌一致性	风格、色彩、字体、构图是否稳定
复用性	同一 workflow 能否覆盖多个产品/SKU
使用门槛	App Mode 下业务用户能否独立操作
效率	从需求到初稿耗时减少多少
审核	是否保留 workflow 和参数，便于复盘

11.2 PoC 二：电商商品图批处理

目标：接入商品图和 SKU 数据，批量生成背景图、场景图、超分图。

验证指标：

批量吞吐量
单图生成成本
失败率
队列管理能力
结果一致性
API 集成便利性

11.3 PoC 三：创意团队工作流模板库

目标：沉淀 5-10 个常用工作流模板，例如头像风格化、背景替换、ControlNet 姿态图、视频封面、短视频风格化。

验证指标：

模板可复用度
模板分享和版本管理
custom nodes 依赖稳定性
新用户学习成本

11.4 PoC 四：Agent 调用 ComfyUI 生成内容

目标：让企业 Agent 通过 MCP 或 API 调用 ComfyUI，完成“文字需求 → 生成视觉素材 → 返回结果”的流程。

验证指标：

MCP/CLI/API 调用成功率
生成任务状态回传
多轮修改体验
权限和成本控制
内容审核链路

12. 风险和注意事项

12.1 GPL v3 许可证

ComfyUI 使用 GPL v3。对于内部研究、内部使用和自托管通常较友好，但如果客户计划二次分发、嵌入商业软件、闭源修改或提供 SaaS，需要法务确认义务边界。

12.2 模型和素材版权

ComfyUI 是工具，输出合规取决于：

使用的模型许可
LoRA/ControlNet/素材许可
输入素材授权
生成内容是否侵犯第三方权益
客户所在地区的 AI 内容监管要求

售前不要承诺“生成内容天然可商用”，必须让客户按模型和素材来源逐项确认。

12.3 Custom Nodes 生态风险

ComfyUI 的扩展生态强，但 custom nodes 也带来：

依赖冲突
版本兼容问题
安全风险
维护者停止更新
工作流迁移失败

生产建议：建立企业批准的节点白名单和版本锁定机制。

12.4 API Nodes 外联和费用

Partner Nodes/API Nodes 是可选能力，涉及账号、credits、网络和外部 API 调用。企业若对数据外发敏感，应禁用或单独审批。

12.5 算力和运维

本地部署需要考虑：

GPU 型号和显存
模型存储
任务队列
并发控制
监控告警
输出文件存储
用户权限
插件升级

13. 与相邻方案对比

方案	更适合	与 ComfyUI 的差异
Midjourney / 即梦 / DALL·E	快速出图、低门槛创作	控制力、私有化和流程集成较弱
Stable Diffusion WebUI	个人/半专业 SD 操作	ComfyUI 更强调节点工作流和可组合性
Photoshop + Firefly	设计师图像编辑	更偏传统设计工具融合，开放模型生态较弱
Runway / Pika / Kling	视频生成产品	ComfyUI 可把视频模型纳入更复杂流程
Dify/Agent 平台	文本/工具型 Agent	ComfyUI 更偏视觉/多媒体生成引擎
自研推理服务	强定制、规模化生产	成本高，ComfyUI 更适合快速搭建和验证

14. 我的售前判断

ComfyUI 是 AIGC 视觉生产领域非常值得重点关注的开源项目。它最大的价值不是“又一个文生图 UI”，而是把生成式 AI 变成可视化、可组合、可复用、可追踪的工作流系统。

对售前来说，它适合在以下机会中切入：

客户希望建设内部 AIGC 创作平台。
客户有大量营销、电商、游戏、影视、设计素材生产需求。
客户不满足于单一 SaaS 出图工具，希望掌控模型、参数、流程和数据。
客户需要把 AIGC 能力接入业务系统或 Agent 平台。

同时要提醒客户：ComfyUI 本身不是完整企业治理平台。生产落地还需要补齐身份权限、模板治理、节点白名单、模型版权、内容审核、GPU 调度、日志审计、成本控制和合规流程。

一句售前总结：

ComfyUI 适合作为企业视觉 AIGC 工作流引擎：专家用节点图搭流程，业务用 App Mode 跑流程，系统用 API/MCP 调流程，企业用治理和算力平台管流程。

1. 项目概览

2. 官方示意图和关键视觉资料

2.1 ComfyUI 官方界面截图

2.2 Workflow 官方简单示意

2.3 Workflow 官方复杂示意

2.4 App Mode 官方示意

2.5 Partner Nodes 官方示意

3. 它主要能做什么

3.1 节点式生成工作流

3.2 图像生成与编辑

3.3 视频、音频和 3D 生成

3.4 工作流复用、分享和模板化

3.5 App Mode：把复杂工作流变成简单应用

3.6 API、队列和生产集成

3.7 Partner Nodes：接入闭源/第三方模型

3.8 Agent Tools / MCP

4. 适用场景

4.1 广告与创意工作室

4.2 电商与商品图生产

4.3 游戏、美术和概念设计

4.4 影视、动画和 VFX

4.5 企业内部 AIGC 平台

5. 不太适合的场景

6. 核心能力清单

7. 架构、部署和集成方式

7.1 基础架构理解

7.2 本地部署方式

7.3 安装命令示例

7.4 生产集成建议

8. 售前可以怎么讲

8.1 面向业务负责人

8.2 面向创意和设计团队

8.3 面向技术负责人

8.4 面向安全/合规负责人

9. 客户痛点映射

10. 常见客户问题

11. PoC 建议

11.1 PoC 一：品牌营销素材生成器

11.2 PoC 二：电商商品图批处理

11.3 PoC 三：创意团队工作流模板库

11.4 PoC 四：Agent 调用 ComfyUI 生成内容

12. 风险和注意事项

12.1 GPL v3 许可证

12.2 模型和素材版权

12.3 Custom Nodes 生态风险

12.4 API Nodes 外联和费用

12.5 算力和运维

13. 与相邻方案对比

14. 我的售前判断

15. 参考资料