Molmo 7B--D 基于 Qwen2--7B,使用 OpenAI CLIP 作为视觉骨干。

实测下来,效果很好。

所以也写了一个节点,方便大家在ComfyUI里面使用。

之前看到大家因为安装JoyCaption,

遇到各种依赖,环境问题,

既然装不上,那就换个更好的。


说明文档

https://xiaobot.net/post/7acb0de5-1c96-4075-9949-35b92695c710

由于AI技术更新迭代,请以文档更新为准

更多内容收录在⬇️

https://xiaobot.net/p/GoToComfyUI

网盘

https://pan.quark.cn/s/882aea39f59c

ComfyUI-Molmo 节点

https://github.com/CY-CHENYUE/ComfyUI-Molmo

视频

https://www.bilibili.com/video/BV1ghx8esEE2/