基于扩散模型的文本到图像生成模型。

这是一个可以根据文本提示生成和修改图像的模型。它是一个潜在扩散模型,使用固定的预训练文本编码器。