WAN2.2-14B-Rapid-AllInOne(MEGA 版)
MEGA版本的模型不再需要单独的I2V和T2V版本。
无需加载 VAE、CLIP、T5 等附加模型,无需加载加速LoRA。
仅用1个模型即可实现文生视频、图生视频、首尾帧视频。
模型已经融合了VACE Fun、SkyReels、FunReward以及常用的4步加速器/CLIP/VAE组合。
推荐采样步数:4 ~ 8 步。
-------------------------------------------------------
MEGA 工作流地址
https://www.liblib.art/modelinfo/d471d50bbf8f4f5bad26f6dc35cadbd3
-------------------------------------------------------
模型版本
文件:wan2.2-rapid-mega-aio-v6.safetensors
-------------------------------------------------------
WAN2.2-14B-Rapid-AllInOne(MEGA v5版)
MEGA v1:
模型不再需要单独的I2V和T2V版本。
I2V不再有噪声问题!
MEGA v1: 基于WAN 2.2 "lowT2V",
然后添加了VACE Fun、SkyReels、FunReward以及常用的加速器/CLIP/VAE组合。
推荐使用ipndm/sgm_uniform采样器/调度器。
MEGA v2: 移除了导致面部偏移的 FunReward LORA。我确实注意到在nsfw合并中仍然存在一些轻微的面部偏移,我认为这是由于 LORA 混合造成的,但已经有所改进。还稍微减少了一些 SkyReels LORA。推荐使用 ipndm/beta。
MEGA v3: 使用非常不同的合并方法,基于 SkyReels 2.1 作为 33% 基础和 WAN 2.2 作为 66% 上层。我现在还为每个版本(2.1 和 2.2)匹配加速器,然后合并。我认为通过基于设计用于 1 个采样器(2.1)的模型来构建“mega”,然后将大部分 WAN 2.2 带入上层,可以获得更好的结果。我希望这将改善摄像机控制、LORA 兼容性和保持面部特征。推荐使用 ipndm/beta。
MEGA v4: WAN 2.2微调(同时也对加速器强度进行了微小调整)
MEGA v5: 新的合并方法,带有非常实验性的加速器混合!我在 WAN22和 SkyReels 720p 之上加入了少量许多 I2V 和 T2V 加速器,再加上 VACE。目标是提高 I2V 的一致性而不损害 T2V。我认为质量、细节和一致性都有所提高,但我希望摄像机控制能更好。推荐使用 euler_a/beta。
MEGA v6: 调整了加速器,引入了更多的旧版 Lightx2v,因为过度依赖最新的 WAN 2.2 Lightning 会损害运动效果。在我的测试中,与 v5 相比,我看到了更好的镜头运动和更准确的提示遵循。还调整了 nsfw LORAs。推荐使用 sa_solver/beta。
MEGA v7: 现在使用 3 种不同的加速器混合在一起:lightx2v、WAN 2.2 Lightning (250928) 和 rCM。运动效果似乎进一步改善。euler_a/beta 似乎表现相当好。
-------------------------------------------------------
MEGA v7版
已更新上传 MEGA v7版本,注意区分nsfw和sfw版本按需下载
下载地址:https://www.liblib.art/modelinfo/5caa822e208d4458ae48f64454a16da8
-------------------------------------------------------
MEGA Merge: 这是“一统天下”的版本,几乎可以做所有事情。它可以处理文本到视频、图像到视频以及第一帧到最后帧和仅最后一帧(因为它包含了VACE)。在mega-v3/文件夹中包含了一个使用这些合并的具体工作流程,由于其灵活性,这个流程稍微复杂一些(但不应该更慢)。请参见下文关于“mega”使用的截图。
NSFW Merges: 堕落者应远离这些合并,因为它们只适用于最有文化素养的人或科学研究人员。这些合并了各种WAN 2.1+2.2 LORA,通常强度较低,提供了“全能但不精通”的一体式解决方案。如果您没有得到想要的结果,可以添加更多LORA或者直接使用非NSFW版本并挑选特定的LORA。
您只需要使用基本的ComfyUI “Load Checkpoint”节点即可,因为您可以从一个AIO safetensors文件(保存在您的'checkpoints'文件夹中)中获取VAE、CLIP和Model。所有模型都设计为使用1 CFG和4步。请参阅下面每个版本的采样器推荐。
WAN 2.1 LORA兼容性通常仍然很好,“低噪声”WAN 2.2 LORA兼容性也较好(不要使用“高噪声”LORA)。不过,您可能需要调整LORA强度(增加或减少)以获得想要的结果。
---------------------------------------
WAN2.2-14B-Rapid-AllInOne 是由社区开发者 Phr00t 打包发布的「一体化极速版」视频生成大模型,核心定位是“把原版 WAN 2.2 的 14B 参数能力做成最低门槛、最快出片”。一句话概括:14B 量级、FP8 精度、4 步采样、8 GB 显存可跑,图像/文本都能直接出视频,ComfyUI 基础节点就能加载,无需再单独准备 VAE、CLIP、T5 等附加模型。