模型特点

本ControlNet在4个双模块结构上进行了增强。

该模型基于100万张涵盖通用内容及人物主题的高质量图像数据集,从头开始训练了10,000步。训练采用1328分辨率与BFloat16精度,批处理大小为64,学习率为2e-5,文本丢弃率为0.10。

支持多种控制条件(包括Canny边缘检测、HED边缘识别、深度图、姿态估计和MLSD直线检测),可像标准ControlNet一样使用。

同时支持修复模式。

可通过调整controlnet_conditioning_scale参数(建议范围0.65~0.80)增强控制效果并优化细节保留。为提升稳定性,强烈建议使用详细提示词。

尽管Flux.2-dev具备部分图像编辑能力,但在处理多图时生成速度会下降,且可能出现相似度问题或未能完全遵循控制图像的情况。相较于基于编辑的方法,使用ControlNet能更可靠地遵循控制指令,并更容易实现多类型控制的协同应用。