功能介绍

该工作流集成Qwen image edit(千问图片编辑初版)、Qwen image edit 2509(千问图片编辑2509版)、Nano Banana(大香蕉)、Seedream 4.0(即梦/豆包4.0)四大模型功能,帮你轻松实现各种图片编辑功能,比如:多图溶合、最为实用的个人艺术写真照、时下热门的动漫图片手办化、动漫图片真人化等各种功能,随附TTP 高清放大,以解决Nano Banana出图像素不够、不清晰等问题。具体案例见下方图片展示,以及返图区。


主要功能介绍:

一、双图溶合、三图溶合

用提示词的形式,把两张、三张甚至更多张图片,溶合成一张图。你可以在一边溶合的过程中,一边用提示词修改图中的物品。大香蕉、千问均能做到这点。

  

 


二、各种预设功能

预设了一些功能,可以免去手动输入提示词的麻烦,目前有以下几种,不断扩充中:

1、自行输入提示词:通过自行输入提示词,来实现各种图片编辑效果。

2、动漫转真人:预设效果,无需输入提示词。


3、超真实手办场景:预设效果,无需输入提示词。分晨间、黄昏、夜晚等环境光线设计,背景有手办柜、宅屋(手办柜+抱枕+挂画)等。


4、风格迁徙文生图:你上传一张你想复刻画风的图片,然后输入你要生成画面的提示词,比如“一个女孩和她的小伙伴们在院子里跳绳”,即可生成与上传图片同样画风的小女孩跳绳图片。你无需输入那种画风的名字,比如你无需输入什么“像素风”“乐高风”“皮克斯风”等词语,你上传一张图片足矣。Nano复刻的画风比Qwen更多,甚至可复刻日系不知名画师画风,详见返图区各种示例。


5、提取图片人物的衣服:你上传一个穿了衣服的人物,通过输入提示词,提取该人物身上的服饰。想偷懒,可直接写“提取图中的衣物”;想要精确提取,可采取类似“提取图中的一顶帽子、一件白色卫衣、一条黑色裙子、一双白色袜子、一双白色鞋子,”这样的写法,以辅助模型实现精确提取。注意,应根据图片实际情况来写提示词,图中没有的服饰配件不要写,否则会无中生有。


提取人物衣服:


进阶功能,指定衣服文生图(提示词见返图区):


6、场景转3D模型:预设效果,无需输入提示词。将场景转为桌面3D模型效果,分为“写实模型”和“可爱风模型”两种,其中:大香蕉更擅长写实模型,千问更擅长可爱风模型。


写实风模型,共分为三种款式(高写实模型、低多边形模型、白模),可搭配三款场景(暗调展台、木质桌子、窗户室内),下图查看相关效果(右键查看放大):


可爱风模型,共分两款,下图查看相关效果(右键查看放大):



7、游戏UI界面:将原图人物变成游戏UI界面中的人物。可对“表情、手持物品、台词”三项内容进行控制,详见工作流内注释。


8、AR界面:预设效果,无需输入提示词。将图片转为AR界面展示效果,勾勒物体轮廓,标注相关信息。有多种界面风格可选,包括:通用界面、赛博朋克故障艺术、军事战术平视显示器、苹果风极简主义、生物科技有机共生体、工程蓝图建筑师草稿、复古像素8-bit游戏界面。







9、个人写真馆:预设效果,无需输入提示词。原创版块,将你的一张照片(大头照亦可)传入,生成各种各样的艺术写真照片。本版块高度推荐使用即梦Seedream 4.0 模型,该模型对亚洲人脸有着极好的一致性。需要注意的是,无论你使用Seedream 4.0 还是Nano Banana模型,你都需要找到一张能充分代表你面相、骨相的照片,这张照片中,你的脸部不一定要很清晰,甚至有时模糊点的都行,但这张照片一定要很有你长相的“神韵”,这点非常关键!特别是Nano Banana,对“脸部的神韵”非常挑剔,否则生出来的图就不像,所以用Nano Banana比较难找到适合的原图。找到这张你的“金标脸”照片后,你就可以将其用于一切场景生成了,那种实现写真自由的感觉,真的很爽!(注意:即梦出图0.2元一张,无论出什么尺寸,都是这个价格,请前往工作流【设定即梦出图尺寸】区,决定好要使用横构图还是竖构图,并设置好相应的出图尺寸。注意:大画幅下,横构图或竖构图会带来完全不同的画面观感效果;有些主题在不同画幅下,人物姿态可能会完全不同,可多尝试各种画幅下的表现;如果你使用动漫人物的图片,那可能可以生成二、三次元溶合的跨次元照片,详见返图区)



10、其他预设:集成一些无需手动输入提示词的预设效果,多适用于Nano Banana,目前有:修复老照片并上色、机械产品内部结构爆炸图(适用于机械物品)、动漫特效 - 焦急挥手。



三、扩图

原图为320x312的模糊小图:


千问扩图后:





四、其他功能

如提示词更改画面元素等,其他功能,不一而足,详见返图区和网络上各种案例。


注意事项:

① 在进行千问生图时,请认真确认出图尺寸。不恰当的出图尺寸,将限制AI 模型的编辑发挥能力,无法得到想要的效果。比如,你要将一个人物头部扩展成全身图,但出图尺寸却设置得太小,那样AI 模型是不可能给你生成全身图的。


② 开启Nano Banana(大香蕉)相关节点后,会大幅消耗算力。比如目前我这里,用千问编辑一张图片消耗7点算力,用大香蕉编辑一张图片则消耗115点算力。注意关注页面右上角算力消耗的实时变化(有时会延迟显示)。


③ 注意“Qwen image edit 2509模型”这个模型。相比初版的Qwen image edit 模型,这个模型大大强化了多图溶合下的人物一致性表现,效果不输于大香蕉。但是,在风格化转换方面,该模型相比初版模型被大大削弱,比如:该模型已经难以像初版模型那样进行动漫图片转真人的操作(勉强转出效果也不如初版);该模型在其他一些风格转换方面(比如本工作流的“场景转3D模型·可爱风”),美学价值也被大大削弱。因此,如果你在本地使用Qwen edit 模型,有需要的话,建议同时保留这两个版本的模型文件。


④ Lightx2v针对两款Qwen image edit模型,发布了数量众多、版本多次迭代的加速lora。目前,针对初版的Qwen image edit 模型,我使用的是“Qwen-Image-Lightning-8steps-V2.0”加速lora,我发现这个lora在某些风格转换上,效果会好于edit的lora(比如我工作流中的“场景转3D”预设)。针对Qwen image edit 2509模型,目前我使用的是新发布的“Qwen-Image-Edit-2509-Lightning-8steps-V1.0-fp32”加速lora。总之,如果你需要换成其他加速lora,请自行在工作流的【后台工作区】中进行更换。如果你不使用任何加速lora,记得在K采样器中将步数调节成20步、cfg调节成2.5。




操作指南

① 哩布的扣费(算力)机制比较奇怪,有些功能你串在一起一步实现,相比它们单个单个分步实现,耗费的总算力还要多出不少。与本地电脑上操作不同,在哩布网页运行工作流时,建议按照工作流上方的《操作建议》来进行各种编辑操作,【功能模组开关】内的开关不要随意打开,免得造成高额算力消耗。


② 所有操作基本在工作流的【参数输入区】内可实现,包括:上传图片、写提示词、选择预设效果、设定编辑图片数量、设定全局种子、设定出图尺寸、TTP 高清放大等等。


③ 工作流默认使用fp8的主模型和clip,如果日后哩布有人上传了全精度模型,可换成全精度模型以获得更好效果。


④ 需要生成真人美女时,可在“Loar堆加载器”中增加一些Qwen Image的美女Lora,以求女孩样貌的真实多样。在线版的“Lora堆加载器”,似乎无法将不需要的Lora设成“无”,可将不需要的Lora权重设为0或右键“Reload Node”。




更新历史

【v6.8】

新增写真馆预设主题。


【v6.6】

调整Qwen image edit 2509模型使用的加速lora。


【v6.5】

集成Qwen image edit 2509模型。


【v6.3】

新增写真馆预设主题。


【v6.0】

新增【个人写真馆】模块。


【v5.0】

集成“即梦Seedream 4.0模型”到工作流中,优化工作流布局;重写工作流《操作建议》部分,你可以根据你的出图需求,在《操作建议》中找到更好的指导。


【v4.7】

更新预设“AR界面”。


【v4.5】

重新布局工作流界面,更新预设“游戏UI界面”、“修复老照片并上色”、“机械产品内部结构爆炸图”、“动漫特效 - 焦急挥手”。


【v4.3】

重新布局工作流界面,更新预设“场景转3D模型”。


【V4.0】

① 加入多图溶合功能。

② 调整了工作流结构,适配了哩布的扣费机制,去除TTP高清放大的自动化操作,避免高额算力浪费,改为手动操作TTP,详见工作流内《操作建议》。


【V3.0】

加入TTP 高清放大。Nano Banana生图可能会细节不够、模糊,必要时可用SeedVR2高清一下再TTP放大,但请注意算力消耗。


【V2.1】

对预设效果中的第8项“风格迁徙文生图”进行指令优化,详见返图区,查看Qwen和Nano能迁移的风格。更多风格请自行尝试。


【V2.0】

① 将Nano Banana集成进工作流,只有两个节点(Google Gemini Image、Nano生图预览框),默认均已关闭,有需要请自行开启,注意开启后会增加算力消耗。

② 增加预设效果,请细看工作流内注释说明。

 

【v1.0】

① 上传一张动漫图片,即可转换成超真实手办场景(可选择环境光线、可选择宅屋背景),详细见工作流内注释说明。

② 上传一张动漫图片,即可转换成真实人物摄影,详细见工作流内注释说明。

③ 默认生成图片尺寸为1536x1536,如有需要可在工作流内自行输入尺寸。

④ 建议使用bf16全精度模型(38G)、以及全精度clip模型(15G)以获得最好的出图效果!!