Molmo 7B--D 基于 Qwen2--7B,使用 OpenAI CLIP 作为视觉骨干。
实测下来,效果很好。
所以也写了一个节点,方便大家在ComfyUI里面使用。
之前看到大家因为安装JoyCaption,
遇到各种依赖,环境问题,
既然装不上,那就换个更好的。
说明文档
https://xiaobot.net/post/7acb0de5-1c96-4075-9949-35b92695c710
由于AI技术更新迭代,请以文档更新为准
更多内容收录在⬇️
https://xiaobot.net/p/GoToComfyUI
网盘
https://pan.quark.cn/s/882aea39f59c
ComfyUI-Molmo 节点
https://github.com/CY-CHENYUE/ComfyUI-Molmo
视频
https://www.bilibili.com/video/BV1ghx8esEE2/