Nano Banana Pro正式发布 —— 带提示词测试全解析
Google 已于2025年11月20日正式发布 Nano Banana Pro (也就是大家持续关注和期待的Nano Banana 2),这是基于全新 Gemini 3.0 Pro 系统构建的下一代图像生成和编辑模型。
数月以来,社区只能看到一些线索:Gemini 界面中泄露的 Gempix-2 代号,以及开发者暗示的重大升级。现在,Nano Banana Pro 已全面上线,长期的猜测终于得到证实。
作为专注于智能设计工作流的团队,我们在 Mew Design 对新模型进行了广泛测试 —— Nano Banana Pro 确实是一次真正的飞跃。
Nano Banana Pro 已在 Mew Design 上线
基于Nano Banana Pro 和 Gemini 3,Mew Design 帮助创作者生成高质量图形设计,无文字失真。创作海报、社媒图片、品牌素材等 —— 现在拥有更强的文字准确性和布局控制。
免费试用 Nano Banana Pro
Nano Banana Pro 通过”时钟与满杯红酒”测试
想要看看 Nano Banana Pro 有多强大,只需看看这张现在很出名的照片:一个显示 11:15 的时钟,旁边是一杯倒满的红酒杯。
图片来源:x@synthwavedd
为什么这如此令人印象深刻?在AI 图像领域,有一个压力测试,没有任何 AI 能够持续掌握:时钟与满杯红酒挑战。
挑战很简单:向 AI 输入提示词:
“时钟显示 11:15,还有一个倒满的红酒杯。”
看看它是否能正确渲染两者。大多数模型 —— 从 Arena、Seedream 4.0,到 Nano Banana 1.0 —— 完全无法通过这个测试。
但 Nano Banana Pro 成功通过了。
Nano Banana Pro vs Nano Banana 1.0:更高分辨率、更好的文字、更多世界知识
Google 确认 Nano Banana Pro 由 Gemini 3.0 Pro 驱动,带来多项核心升级:
- 更高的原生分辨率,带来更锐利的边缘和更干净的光照
- 更强的提示词理解能力,处理复杂指令
- 显著改进的文字渲染,支持多种语言
- 更好的世界和文化知识,能够准确生成 UI、截图、信息图
- 更准确的角色一致性
这些改进即使在随意测试中也很明显。
看看下面这两张图片 —— 都以一个汽车模型在海边高速公路上摆姿势为主题。
你能看出哪张是 Nano Banana Pro 创作的吗?
图片来源:x@Azinha810
乍一看,它们可能看起来相似。但注意色调和整体氛围 —— 第一张图片感觉更自然、更有电影感、色调更准确,而第二张带有早期 AI 生成照片典型的略微”塑料感”外观。
图片来源:x@Azinha810
现在比较这两张科幻风格的渲染图 —— 差异更加明显。
第二张图片比第一张拥有更丰富的电影氛围和更精细的视觉细节。
仔细观察两张图片中的控制面板和仪表盘元素。
在第一张中,仪表看起来风格化和合成化 —— 非常像那种老的”AI 艺术”外观。
在第二张中,Nano Banana Pro 提供了一个更加真实、有质感、技术准确的仪表盘,证明了其渲染引擎已经进化得多么远。
基于 Gemini 3.0 Pro 构建,配备全新多步骤工作流
Google 表示 Nano Banana Pro 由 Gemini 3.0 Pro 驱动,内部标签为 Gempix-2 —— 一种全新的图像架构。
该模型引入了几项突出的升级:
- 处理复杂的视觉逻辑 —— 准确的文字、高级光照和透视控制,这是 1.0 无法做到的。
示例:提示词”把水变成粉色”,Nano Banana Pro.0 渲染出微妙、真实的变化,远超 Nano Banana 1.0。图片来源:x@Angaisb_
-
全新的多步骤工作流,感觉更像设计师而不是生成器:
- 规划输出
- 生成草稿
- 内部审查
- 修复检测到的问题
- 在交付最终图像之前迭代
-
更高分辨率和灵活的长宽比。它现在支持更广泛的长宽比范围 —— 包括 1:1、2:3、3:2、3:4、4:3、9:16、16:9,甚至超宽 21:9 格式 —— 为创作者在从社媒帖子到电影级渲染的各个方面提供更多灵活性。Nano Banana Pro 还提供多种输出分辨率,包括 1K、2K 和完整的 4K 模式。
在所有升级中,新的多步骤工作流可能是 Nano Banana Pro 最大的游戏规则改变者。
我们之前在 ComfyUI 等工具中看到过类似的概念,这些工具允许用户构建图像或视频生成管道。
但这次,Nano Banana 将这个流程直接集成到模型内部 —— 无需额外设置,无需节点编辑。
对于高精度图像生成来说,这是一个巨大的飞跃。
当然,真正的证明在于图片 —— 让我们来看看一些在网上流传的 Nano Banana Pro 测试结果。
Nano Banana Pro 亮点与测试结果 [含提示词]
1. 文字渲染终于可靠了
Nano Banana Pro 的文字渲染确实令人惊艳。
在一个例子中,它生成了一个 Windows 11 桌面截图,显示 Chrome 中打开的 YouTube,包括一个 MrBeast 缩略图 —— 像素级完美且完全清晰可读。
只需上传 Windows 桌面截图。提示词:生成一个 Windows 11 桌面截图,Chrome 打开,显示 YouTube.com 上 MrBeast 的 YouTube 缩略图。| 图片来源:x@synthwavedd
更进一步,Nano Banana Pro 甚至可以生成一个完全详细的 Google DeepMind 网页截图 —— 令人印象深刻的是,所有密集的文字都能正确渲染,没有任何乱码。
图片来源:x@synthwavedd
话虽如此,细心的用户已经注意到 Nano Banana Pro 并不完美。在这个例子中,有一些小错误,比如”Gemini 31”和”Google DeepMind – Nevdscl”。
乍一看,如果你只看主要标题和副标题,这些错误几乎察觉不到。然而,当文字内容较小或密度较低时,错误发生的可能性会显著降低。
在这个电视直播新闻截图中,屏幕上的所有文字都准确且格式一致。令人印象深刻的是,甚至地面上文字的反射也被正确渲染。
图片来源:x@synthwavedd
类似地,另一张电视广播截图显示主播位于屏幕右侧,经典的新闻滚动条在底部运行 —— 同样,每一段文字都完美渲染。
提示词:50mm 大预算直播 8k 照片特写,一位有魅力的 30 岁意大利女性新闻主播,表情狡黠。她坐在新闻台前,身后屏幕上有生物工程的香蕉,文字显示”Nano Banana Pro live on Media .IO?”。直播新闻镜头。图片底部有一个红色和蓝色的滚动条,显示”Breaking News: Nano Banana Pro on Media.IO?”
图片来源:x@BrentLynch
我们也用同样的提示词测试了 Nano Banana 1.0。
这个版本”AI 生成感”稍弱。然而,背景屏幕有轻微模糊,使其看起来不太像真实的新闻场景。文字的反射也显得有些人工,尽管对主播本身的聚焦仍然很强且视觉清晰。
2. 更好的世界知识和文化背景
由于现在运行在 Gemini 3.0 Pro 上,该模型具有更强的内置世界知识。
这就是为什么它能够:
- 识别真实的游戏预告片
- 识别真人改编作品中的演员
- 理解品牌 UI 布局
- 在白板上写出数学解答
那个臭名昭著的时钟和红酒测试不是偶然 —— Nano Banana Pro 始终能理解那些难倒其他 AI 的提示词。Reddit 用户用其他模型(如 Grok 和 ChatGPT)生成的图片刷屏了评论区 —— 但没有一个能达到 Nano Banana Pro 的准确性。
一些用户甚至挑战 Nano Banana Pro 把汉堡变成玻璃。令人惊讶的是,只有 Nano Banana Pro 成功将整个汉堡变成玻璃,而其他模型如字节跳动的 Seedream 和 Riverflow 只渲染了面包为透明。
提示词:把汉堡做成玻璃的。
第一张图片由 Nano Banana Pro 生成。| 图片来源:x@Angaisb_
改进的世界知识使 Nano Banana Pro 能够更好地理解提示词,严格遵循指令,甚至让用户简化提示词而不失精度。
它还能准确处理流行文化背景。例如,一位用户要求 Nano Banana Pro 生成 GTA 6 预告片 —— 它生成了一个包含实际 GTA 6 Logo 的 YouTube 页面。
图片来源:x@jewgibor
另一个测试涉及提示词”One Piece live action Netflix”。Nano Banana 不仅识别了 Netflix Logo,还正确识别了真人版演员阵容。
提示词:One Piece live action Netflix。
图片来源:x@jewgibor
结合世界知识和精确的文字渲染,Nano Banana Pro 甚至可以在黑板上解答数学问题 —— 这比在聊天窗口中滚动长长的数学解释要令人满意得多。
上传数学问题的截图。提示词:解决这个数学问题,并在白板上写下完整解答。
图片来源:x@MagusWazir
这是 Nano Banana 1.0 和 Nano Banana Pro 在这个案例中的并排比较:
3. 核心图像质量大幅提升
Nano Banana Pro 改进了光照、构图、真实感和动态场景 —— 证实了早期测试者注意到的内容。
在 x@legit_api 分享的测试中,Nano Banana Pro 重现了一个情感化的《东京食尸鬼》场景 —— 金木研在雪中抱着他的朋友 —— 具有电影级的真实感。
提示词:金木研在雪中抱着他的朋友,《东京食尸鬼》。
图片来源:x@legit_api
它在赛博朋克、肖像和电影风格镜头方面也表现出色。
提示词:赛博朋克黑客机器人在多台显示器前工作。
图片来源:x@testingcatalog
即使是”表情包风格”的肖像和风格化的团体照片也显示出显著的凝聚力和情绪。
图片来源:x@MicahBerkley
结语
Nano Banana Pro 作为 Google 迄今为止最可靠的图像模型之一问世。从具有挑战性的逻辑场景 —— 如 11:15 时钟和满杯红酒测试 —— 到更清晰的排版和更丰富的视觉效果,很明显这次发布将 AI 成像推向了更加可靠的领域。
对于创作者、营销人员和设计师来说,这次升级不仅仅是一个技术里程碑。它意味着更快的的工作流、更少的修正,以及从一个提示词就能获得更高质量的素材。
你可以直接在 Mew Design 中尝试这些Nano Banana Pro提示词,它与 Seedream 4.0 一起运行,支持从海报到产品拍摄的一切。改进是立即可见的 —— 它们使创作过程比以往更加顺畅。
关于 Nano Banana Pro 的常见问题
什么是 Nano Banana Pro?
Nano Banana Pro 是 Google 最新的 AI 图像和编辑模型,基于 Gemini 3.0 Pro 构建。它提供比原始 Nano Banana 更高的分辨率图像、更好的提示词准确性和更一致的角色渲染。这次升级重塑了创作者在营销、设计、广告和社媒视觉方面可以做什么。
Nano Banana Pro 与早期模型有何不同?
它提供更锐利的输出、更强的场景稳定性、改进的文字理解,以及更好的光照和反射处理。总的来说,它产生更干净、更可靠的图像 —— 特别是对于人物、物体和风格化构图。
为什么 GemPix 2 与 Nano Banana Pro 相关?
GemPix 2 是 Google 在 Nano Banana Pro 内部使用的渲染模块的内部代号。它处理光照、表面反射、阴影和整体视觉一致性。换句话说,GemPix 2 作为 Nano Banana Pro 管道的一部分工作。
Nano Banana Pro AI 图像生成器是否免费使用?
是的。你可以在 Mew Design 免费试用 Nano Banana Pro。新用户可以生成或编辑高分辨率图像,包括 4K 输出,无需任何费用。
处理图像或文字提示词需要多长时间?
使用 Gemini 3.0 Pro,生成时间通常在 10 到 15 秒之间。速度可能会根据分辨率和提示词的复杂性而变化。
Nano Banana Pro 何时发布?
Google 于 2025 年 11 月 20 日正式发布 Nano Banana Pro。