ComfyUI近日宣布完成一轮3000万美元融资,公司估值约5亿美元。该公司为创作者提供基于节点的工作流程工具,用于精细控制扩散模型生成的图像、视频和音频输出。
本轮融资由Craft Ventures领投,Pace Capital、Chemistry和TruArrow等投资方参投。此前在2024年底,ComfyUI已完成1900万美元A轮融资,投资方包括Chemistry Ventures、Cursor Capital以及Vercel创始人Guillermo Rauch。
ComfyUI于2023年以开源项目形式启动,彼时扩散模型刚刚兴起,Midjourney和OpenAI的DALL-E等工具仍存在明显局限,例如在生成图像时经常出现手部多出手指等错误。项目创始人据此开发出一套模块化框架,使创作者能够对生成过程的各个步骤进行细粒度控制。
随着工具在创意专业群体中获得关注,ComfyUI逐步从开源项目发展为正式创业公司。公司表示,目前其用户数量已超过400万,主要集中在视觉特效、动画、广告以及工业设计等领域。ComfyUI称,该工具已成为技术美术师和其他创意从业者的常用软件,一些工作室在招聘启事中直接标注“ComfyUI艺术家”或“ComfyUI工程师”等岗位名称。

ComfyUI联合创始人兼首席执行官Yoland Yan在接受TechCrunch采访时表示,相较于仅依赖文本提示的生成方式,创作者对更可控的工作流程需求正在上升。他提到,在典型的基于提示的系统(如Midjourney或ChatGPT)中,用户发出请求后,生成结果往往只有约60%至80%符合预期,而要调整剩余部分则需要反复尝试。
Yan将这种反复调整的过程比作“赌场游戏”,因为在提示式模型中,即便是对提示做出细微修改,也可能导致输出结果发生巨大变化,甚至改变用户原本已经满意的部分。他表示,通过ComfyUI的节点式界面,创作者可以将生成流程中的特定组件串联起来,从而对最终输出质量实现更全面的控制。“你很难在基础模型的提示框中直接表达这种复杂的控制需求,”Yan说。
尽管图像和视频扩散模型本身的生成质量持续提升,Yan认为,这些模型距离“完美”仍有差距,对类似ComfyUI这类增强控制工具的需求仍然强劲。他表示,在AI生成内容日益普及的环境下,ComfyUI所代表的人机交互方式将持续获得关注。
据介绍,ComfyUI在市场上也面临其他工具的竞争,其中包括初创公司Weavy。Weavy已于去年被Figma收购。
