千梦香蕉！Nano Banana × Seedream x Qwen 写真馆-工作流-NinjaK-LiblibAI

☞ 功能介绍

该工作流集成Qwen image edit（千问图片编辑初版）、Qwen image edit 2509（千问图片编辑2509版）、Nano Banana（大香蕉）、Seedream 4.0（即梦/豆包4.0）四大模型功能，帮你轻松实现各种图片编辑功能，比如：多图溶合、最为实用的个人艺术写真照、时下热门的动漫图片手办化、动漫图片真人化等各种功能，随附TTP 高清放大，以解决Nano Banana出图像素不够、不清晰等问题。具体案例见下方图片展示，以及返图区。

主要功能介绍：

一、双图溶合、三图溶合

用提示词的形式，把两张、三张甚至更多张图片，溶合成一张图。你可以在一边溶合的过程中，一边用提示词修改图中的物品。大香蕉、千问均能做到这点。

二、各种预设功能

预设了一些功能，可以免去手动输入提示词的麻烦，目前有以下几种，不断扩充中：

1、自行输入提示词：通过自行输入提示词，来实现各种图片编辑效果。

2、动漫转真人：预设效果，无需输入提示词。

3、超真实手办场景：预设效果，无需输入提示词。分晨间、黄昏、夜晚等环境光线设计，背景有手办柜、宅屋（手办柜+抱枕+挂画）等。

4、风格迁徙文生图：你上传一张你想复刻画风的图片，然后输入你要生成画面的提示词，比如“一个女孩和她的小伙伴们在院子里跳绳”，即可生成与上传图片同样画风的小女孩跳绳图片。你无需输入那种画风的名字，比如你无需输入什么“像素风”“乐高风”“皮克斯风”等词语，你上传一张图片足矣。Nano复刻的画风比Qwen更多，甚至可复刻日系不知名画师画风，详见返图区各种示例。

5、提取图片人物的衣服：你上传一个穿了衣服的人物，通过输入提示词，提取该人物身上的服饰。想偷懒，可直接写“提取图中的衣物”；想要精确提取，可采取类似“提取图中的一顶帽子、一件白色卫衣、一条黑色裙子、一双白色袜子、一双白色鞋子，”这样的写法，以辅助模型实现精确提取。注意，应根据图片实际情况来写提示词，图中没有的服饰配件不要写，否则会无中生有。

提取人物衣服：

进阶功能，指定衣服文生图（提示词见返图区）：

6、场景转3D模型：预设效果，无需输入提示词。将场景转为桌面3D模型效果，分为“写实模型”和“可爱风模型”两种，其中：大香蕉更擅长写实模型，千问更擅长可爱风模型。

写实风模型，共分为三种款式（高写实模型、低多边形模型、白模），可搭配三款场景（暗调展台、木质桌子、窗户室内），下图查看相关效果（右键查看放大）：

可爱风模型，共分两款，下图查看相关效果（右键查看放大）：

7、游戏UI界面：将原图人物变成游戏UI界面中的人物。可对“表情、手持物品、台词”三项内容进行控制，详见工作流内注释。

8、AR界面：预设效果，无需输入提示词。将图片转为AR界面展示效果，勾勒物体轮廓，标注相关信息。有多种界面风格可选，包括：通用界面、赛博朋克故障艺术、军事战术平视显示器、苹果风极简主义、生物科技有机共生体、工程蓝图建筑师草稿、复古像素8-bit游戏界面。

9、个人写真馆：预设效果，无需输入提示词。原创版块，将你的一张照片（大头照亦可）传入，生成各种各样的艺术写真照片。本版块高度推荐使用即梦Seedream 4.0 模型，该模型对亚洲人脸有着极好的一致性。需要注意的是，无论你使用Seedream 4.0 还是Nano Banana模型，你都需要找到一张能充分代表你面相、骨相的照片，这张照片中，你的脸部不一定要很清晰，甚至有时模糊点的都行，但这张照片一定要很有你长相的“神韵”，这点非常关键！特别是Nano Banana，对“脸部的神韵”非常挑剔，否则生出来的图就不像，所以用Nano Banana比较难找到适合的原图。找到这张你的“金标脸”照片后，你就可以将其用于一切场景生成了，那种实现写真自由的感觉，真的很爽！（注意：即梦出图0.2元一张，无论出什么尺寸，都是这个价格，请前往工作流【设定即梦出图尺寸】区，决定好要使用横构图还是竖构图，并设置好相应的出图尺寸。注意：大画幅下，横构图或竖构图会带来完全不同的画面观感效果；有些主题在不同画幅下，人物姿态可能会完全不同，可多尝试各种画幅下的表现；如果你使用动漫人物的图片，那可能可以生成二、三次元溶合的跨次元照片，详见返图区）

10、其他预设：集成一些无需手动输入提示词的预设效果，多适用于Nano Banana，目前有：修复老照片并上色、机械产品内部结构爆炸图（适用于机械物品）、动漫特效 - 焦急挥手。

三、扩图

原图为320x312的模糊小图：

千问扩图后：

四、其他功能

如提示词更改画面元素等，其他功能，不一而足，详见返图区和网络上各种案例。

注意事项：

① 在进行千问生图时，请认真确认出图尺寸。不恰当的出图尺寸，将限制AI 模型的编辑发挥能力，无法得到想要的效果。比如，你要将一个人物头部扩展成全身图，但出图尺寸却设置得太小，那样AI 模型是不可能给你生成全身图的。

② 开启Nano Banana（大香蕉）相关节点后，会大幅消耗算力。比如目前我这里，用千问编辑一张图片消耗7点算力，用大香蕉编辑一张图片则消耗115点算力。注意关注页面右上角算力消耗的实时变化（有时会延迟显示）。

③ 注意“Qwen image edit 2509模型”这个模型。相比初版的Qwen image edit 模型，这个模型大大强化了多图溶合下的人物一致性表现，效果不输于大香蕉。但是，在风格化转换方面，该模型相比初版模型被大大削弱，比如：该模型已经难以像初版模型那样进行动漫图片转真人的操作（勉强转出效果也不如初版）；该模型在其他一些风格转换方面（比如本工作流的“场景转3D模型·可爱风”），美学价值也被大大削弱。因此，如果你在本地使用Qwen edit 模型，有需要的话，建议同时保留这两个版本的模型文件。

④ Lightx2v针对两款Qwen image edit模型，发布了数量众多、版本多次迭代的加速lora。目前，针对初版的Qwen image edit 模型，我使用的是“Qwen-Image-Lightning-8steps-V2.0”加速lora，我发现这个lora在某些风格转换上，效果会好于edit的lora（比如我工作流中的“场景转3D”预设）。针对Qwen image edit 2509模型，目前我使用的是新发布的“Qwen-Image-Edit-2509-Lightning-8steps-V1.0-fp32”加速lora。总之，如果你需要换成其他加速lora，请自行在工作流的【后台工作区】中进行更换。如果你不使用任何加速lora，记得在K采样器中将步数调节成20步、cfg调节成2.5。

☞ 操作指南

① 哩布的扣费（算力）机制比较奇怪，有些功能你串在一起一步实现，相比它们单个单个分步实现，耗费的总算力还要多出不少。与本地电脑上操作不同，在哩布网页运行工作流时，建议按照工作流上方的《操作建议》来进行各种编辑操作，【功能模组开关】内的开关不要随意打开，免得造成高额算力消耗。

② 所有操作基本在工作流的【参数输入区】内可实现，包括：上传图片、写提示词、选择预设效果、设定编辑图片数量、设定全局种子、设定出图尺寸、TTP 高清放大等等。

③ 工作流默认使用fp8的主模型和clip，如果日后哩布有人上传了全精度模型，可换成全精度模型以获得更好效果。

④ 需要生成真人美女时，可在“Loar堆加载器”中增加一些Qwen Image的美女Lora，以求女孩样貌的真实多样。在线版的“Lora堆加载器”，似乎无法将不需要的Lora设成“无”，可将不需要的Lora权重设为0或右键“Reload Node”。

☞ 更新历史

【v6.8】

新增写真馆预设主题。

【v6.6】

调整Qwen image edit 2509模型使用的加速lora。

【v6.5】

集成Qwen image edit 2509模型。

【v6.3】

新增写真馆预设主题。

【v6.0】

新增【个人写真馆】模块。

【v5.0】

集成“即梦Seedream 4.0模型”到工作流中，优化工作流布局；重写工作流《操作建议》部分，你可以根据你的出图需求，在《操作建议》中找到更好的指导。

【v4.7】

更新预设“AR界面”。

【v4.5】

重新布局工作流界面，更新预设“游戏UI界面”、“修复老照片并上色”、“机械产品内部结构爆炸图”、“动漫特效 - 焦急挥手”。

【v4.3】

重新布局工作流界面，更新预设“场景转3D模型”。

【V4.0】

① 加入多图溶合功能。

② 调整了工作流结构，适配了哩布的扣费机制，去除TTP高清放大的自动化操作，避免高额算力浪费，改为手动操作TTP，详见工作流内《操作建议》。

【V3.0】

加入TTP 高清放大。Nano Banana生图可能会细节不够、模糊，必要时可用SeedVR2高清一下再TTP放大，但请注意算力消耗。

【V2.1】

对预设效果中的第8项“风格迁徙文生图”进行指令优化，详见返图区，查看Qwen和Nano能迁移的风格。更多风格请自行尝试。

【V2.0】

① 将Nano Banana集成进工作流，只有两个节点（Google Gemini Image、Nano生图预览框），默认均已关闭，有需要请自行开启，注意开启后会增加算力消耗。

② 增加预设效果，请细看工作流内注释说明。

【v1.0】

① 上传一张动漫图片，即可转换成超真实手办场景（可选择环境光线、可选择宅屋背景），详细见工作流内注释说明。

② 上传一张动漫图片，即可转换成真实人物摄影，详细见工作流内注释说明。

③ 默认生成图片尺寸为1536x1536，如有需要可在工作流内自行输入尺寸。

④ 建议使用bf16全精度模型（38G）、以及全精度clip模型（15G）以获得最好的出图效果！！