基础算法 V1.5,在高质量数据集上进行大量微调而开发。采用了 classifier-free guidance sampling 技术,通过适当的文本条件丢弃率来提升生成图像的质量和多样性。
类型:基于扩散模型的文本到图像生成模型
- 扩散模型:是一种生成模型,通过逐步去除噪声来生成数据。它从高斯噪声开始,逐步逆向生成目标数据(如图像)。扩散模型在图像生成任务中表现出色,能够生成高质量的图像。
- 文本到图像生成(Text-to-Image Generation):该模型能够根据输入的文本提示生成相应的图像。例如,输入“一只在草地上奔跑的金色毛发的狗”,模型可以生成符合描述的图像。