通过使用阿里云百炼api,使用通义千问2.5-VL-72B或通义千问2.5-VL-7B 对图像反推打标

节点下载: https://github.com/arvinyang629/comfyui-qwen2.5vl-Label

可以再model_name中选择不同的模型,72B的效果更好一些但是花费也略微多一些

加载图像:

1、左侧加载图像中-路径中选择图片存放的文件夹路径

2、图像加载上限中填入文件夹中的图片数量(例如:文件夹中有20个图,这里就填20)

通义千问VL图像分析:

1、在model_name中选择模型(qwen2.5-vl-7b-instruct或qwen2.5-vl-72b-instruct)

2、填写api_key(在阿里云百炼申请好后,粘贴进来即可)(地址: https://bailian.console.aliyun.com/

3、系统提示词(可不修改直接使用,也可根据自己的需求重写填写)

LayerUtility:String:

如果需要触发词,就在这里填写,工作路最终会把反推的提示词和触发词合并在一起,如果不需要就不用填写了

LayerUtility:Image Tagger Save

1、在custom_path中填写输入文件保存的路径(你电脑中文件夹地址)

2、filename_prefix填写文件名(最终的图像和txt文件都将会使用此文字作为开头重新命名)