通过使用阿里云百炼api,使用通义千问2.5-VL-72B或通义千问2.5-VL-7B 对图像反推打标
节点下载: https://github.com/arvinyang629/comfyui-qwen2.5vl-Label
可以再model_name中选择不同的模型,72B的效果更好一些但是花费也略微多一些
加载图像:
1、左侧加载图像中-路径中选择图片存放的文件夹路径
2、图像加载上限中填入文件夹中的图片数量(例如:文件夹中有20个图,这里就填20)
通义千问VL图像分析:
1、在model_name中选择模型(qwen2.5-vl-7b-instruct或qwen2.5-vl-72b-instruct)
2、填写api_key(在阿里云百炼申请好后,粘贴进来即可)(地址: https://bailian.console.aliyun.com/ )
3、系统提示词(可不修改直接使用,也可根据自己的需求重写填写)
LayerUtility:String:
如果需要触发词,就在这里填写,工作路最终会把反推的提示词和触发词合并在一起,如果不需要就不用填写了
LayerUtility:Image Tagger Save
1、在custom_path中填写输入文件保存的路径(你电脑中文件夹地址)
2、filename_prefix填写文件名(最终的图像和txt文件都将会使用此文字作为开头重新命名)