模型概述
Qwen-Image-Edit-2511-Lightning 是一系列针对图像编辑任务优化的模型,它利用步骤蒸馏和量化技术来实现高效的推理性能。该代码库包含三个具有不同特征的核心模型文件:
| Model File Name | Type | Key Features |
|---|---|---|
Qwen-Image-Edit-2511-Lightning-4steps-V1.0-bf16.safetensors | 四步精炼 LoRA | BF16 高精度、轻量级、4 步推理 |
Qwen-Image-Edit-2511-Lightning-4steps-V1.0-fp32.safetensors | 四步精炼 LoRA | FP32 精度高,准确度高,4 步推理 |
qwen_image_edit_2511_fp8_e4m3fn_scaled_lightning.safetensors | FP8 定量 | FP8(e4m3fn 缩放)精度,融合四步蒸馏 LoRa,针对低内存部署进行了优化 |
使用说明
该模型套件支持两种主流使用框架,以下提供详细指南:
1. Qwen-Image-Lightning 框架
有关 Qwen-Image-Lightning 生态系统中模型使用的完整文档(包括环境设置、推理流程和自定义),请参阅: Qwen-Image-Lightning GitHub 仓库
2. LightX2V 框架
这些模型与 LightX2V 轻量级视频/图像生成推理框架完全兼容。有关分步使用示例、配置模板和性能优化技巧,请参阅: LightX2V Qwen 图像编辑文档
关键优化
- 步骤蒸馏 :LoRA 模型将原始推理步骤减少到仅 4 个步骤,实现了显著的速度提升(比标准的 40 步推理快 ≈10 倍),同时保持了图像编辑质量。
- FP8 量化 :量化基础模型平衡了性能和资源效率,与 FP32 相比,在保持编辑保真度的同时,减少了约 50% 的 GPU 内存使用量。