跳转到内容

即梦4.5官方发布:实测多图合成、精细编辑与设计实战体验

字节跳动已正式在火山引擎上发布了新的 豆包即梦4.5 (Doubao-Seedream-4.5)图像生成模型。在使用各种提示和参考图像对其进行测试后,即梦4.5(Seedream-4.5)感觉像是对 即梦4.0 的一个坚实、可用于生产的升级,特别是对于编辑、多图合成以及海报和 Logo 等设计用例。

即梦4.5 与 即梦4.0 对比

即梦4.5 vs 即梦4.0(内部评估供参考)

以下是从产品测试角度进行的简明评测。

什么是即梦4.5?

Doubao-Seedream-4.5 是字节跳动最新的图像创作模型,可在火山引擎上使用。它专为以下方面设计:

  • 多图合成和角色连续性
  • 具有强大细节和色调保留的高保真照片编辑
  • 人像美化和小脸处理
  • 用于海报、UI 和品牌宣传的清晰小文本生成
  • 更好的视觉美感和对复杂提示的更强推理能力

与即梦4.0 相比,4.5 版本旨在使编辑更加可控,并使概念艺术和设计更具创造力。

1. 多图合成:稳定的角色连续性

最大的升级之一是多图合成。在我们的测试中,Seedream-4.5 可靠地识别了多个输入图像中的主体,并保持了该主体的视觉一致性。

测试 1:多重参考背景替换

提示词: “把图1中女人的背景替换成图2的海边,并在天空中添加两个图3的热气球。”

即梦4.5 测试 1 参考图 1

参考图 1

即梦4.5 测试 1 参考图 2

参考图 2

即梦4.5 测试 1 参考图 3

参考图 3

即梦4.5 测试 1 结果图

结果图

结果: 模型使女人的脸部、发型和服装与原图保持高度一致。海边背景和热气球融合自然,光线和颜色调整为连贯的场景,而不是看起来像复制粘贴的。

测试 2:将多人合并到一个具有参考风格的场景中

提示词: “使用图4的风格,将图1、2和3中的人物合并到一张图像中。”

即梦4.5 测试 2 参考图 1

参考图 1

即梦4.5 测试 2 参考图 2

参考图 2

即梦4.5 测试 2 参考图 3

参考图 3

即梦4.5 测试 2 参考图 4

参考图 4

即梦4.5 测试 2 结果图

结果图

结果: Seedream-4.5 在保留每个人物的身份和表情的同时,将他们统一到目标风格中表现良好。肤色、服装和姿势得以保留,但整体色调、光线和纹理与参考图像的风格相匹配。与经常在渲染之间改变面孔或扭曲比例的典型多图模型相比,角色连续性明显更稳定。

总体而言,对于需要多个参考图像(情绪板、角色表、产品照片)的创意工作流,4.5 的多图功能感觉成熟且可靠。

2. 极致的原图保留:面部、光线和细节

Seedream-4.5 也被定位为一个强大的编辑模型。在直接测试中,它在保持原始面部、光线和详细结构方面明显优于即梦4.0。

人像中的主体一致性

示例提示词:

“使用图1作为参考,生成一张逼真的街头摄影人像:现代城市街道背景,白天,强烈的氛围,主体看着镜头,自然光,干净的背景。”

即梦4.5 测试 3 参考图 1

参考图

即梦4.5 测试 3 结果图

结果图

结果: 生成的图像非常接近原始人物的面部结构和特征。光照方向和肤色与原图保持一致,而背景和构图则按要求进行了更新。输出看起来像是真实的实地拍摄,而不是完全合成的面孔。

编辑对象和道具

示例提示词:

“使用橘猫的正面图作为参考,生成同一只猫戴着防蓝光眼镜和格子衬衫的正面照片,坐在电脑前的桌子上。它的爪子随意地在键盘上打字,周围有咖啡杯和一堆文件。精确保持橘色毛发颜色和胖乎乎的脸,具有照片级的逼真度。”

即梦4.5 测试 4 参考图 1

参考图

即梦4.5 测试 4 结果图

结果图

结果: 模型保留了猫的毛色和脸型,增加的眼镜、服装和办公室环境看起来很自然,不像是贴上去的。毛发细节和眼镜上的光照与场景一致,这正是许多模型打破沉浸感的地方。

在保留核心对象的同时进行创意转换

示例提示词:

“使用参考图的排球概念,创建一个新的创意排球主题图像。”

即梦4.5 测试 5 参考图 1

参考图

即梦4.5 测试 5 结果图

结果图

结果: “排球”的核心理念和原始视觉风格得以延续,但模型产生了一个全新的构图,而不仅仅是简单的复制。它似乎理解了像素复制之外的概念。

这使得 Seedream-4.5 特别适合作为摄影、电子商务和品牌资产的“智能修饰工具”:你可以要求进行大的改动,同时保留原始主体的身份和核心特征。

3. 结构与姿势保留:精细编辑

当被要求编辑图像的特定部分同时保持姿势和整体几何结构时,Seedream-4.5 表现出了强大的控制力。

固定姿势下的材质和光照变化

示例提示词:

“保持模特的姿势和液体裙子的流动形状不变。将裙子的材质从银色金属改为完全透明的玻璃。透过流动的水,我们可以看到皮肤细节。将光照从反射改为折射。”

即梦4.5 测试 6 参考图 1

参考图

即梦4.5 测试 5 结果图

结果图

结果: 姿势和轮廓与输入几乎完全相同。模型成功地将材质切换为玻璃般的外观,具有可信的折射和皮肤可见性。它在改变材质和光照的同时保留了姿势和液体形状,这是编辑一致性提高的关键标志。

添加复杂的背景元素

示例提示词:

“人物身后有一座漂浮的‘天空之城’:一座被绿色覆盖的浮岛城堡,欧式建筑,周围环绕着云彩,奇幻风格。”

即梦4.5 测试 7 参考图 1

参考图

即梦4.5 测试 7 结果图

结果图

结果: 主要人物保持清晰且未变。天空之城融合得很好,具有适当的深度和大气透视,没有使主体变形或破坏边缘。这种前景保留和背景创造力的平衡非常强大,特别是对于奇幻人像海报。

这些测试证实了 Seedream-4.5 在“外科手术式编辑”方面的优势:保持构图和姿势,但改变材质、环境和效果。

4. 海报、Logo 和小文本:为设计工作做好准备

对于设计场景,Seedream-4.5 明确针对专业布局和排版任务。

海报布局和品牌推广

在我们使用海报风格提示词的测试中,Seedream-4.5 生成了具有清晰层次结构的结构化构图:主视觉、标题、副标题和较小的文案都适合于平衡良好的布局。取景很少感觉随机,并且有清晰的前景、中景和背景感。

即梦4.5 测试海报设计示例 1

即梦4.5 海报设计示例 1

即梦4.5 测试海报设计示例 2

即梦4.5 海报设计示例 2

即梦4.5 测试海报设计示例 3

即梦4.5 海报设计示例 3

即梦4.5 测试海报设计示例 4

即梦4.5 海报设计示例 4

小文本清晰度

示例提示词:

“插画风格海报,几个黑色的圆形可爱卡通人物,后面有 ‘SHH HIDE AWAY’ 字样,右下角有一个英文故事”

即梦4.5 测试小文本清晰度

即梦4.5 生成带有小文本的海报

结果: 与即梦4.0 相比,Seedream-4.5 中的小文本更易读,失真更少。虽然你仍然不应期望像矢量编辑器那样完全可控的排版,但对于许多社交媒体海报、营销视觉效果和模型来说,可读性已经足够好了。对于“快速设计草稿”或艺术指导来说,这是非常有用的。

对于需要快速生成 Logo、品牌视觉效果和活动海报原型的团队来说,Seedream-4.5 在创意质量和文本清晰度之间提供了很好的平衡。

5. 整体美学:电影感、光影、构图

从纯粹的图像质量角度来看,Seedream-4.5 在以下方面显示出明显的改进:

  • 电影质感: 许多输出具有受控对比度和色彩分级的电影般外观。

即梦4.5 测试电影感示例 1

即梦4.5 电影感示例 1

即梦4.5 测试电影感示例 2

即梦4.5 电影感示例 2

  • 光影: 光照感觉与场景更加连贯。反射、高光和阴影方向更加自然,特别是在金属、玻璃和夜景中。

即梦4.5 测试光影示例 1

即梦4.5 光影示例 1

即梦4.5 测试光影示例 2

即梦4.5 光影示例 2

  • 构图: 取景更加深思熟虑。主体通常放置得更加平衡,有引导线和负空间。结果通常看起来更接近专业摄影或概念艺术,而不是“随机的 AI 艺术”。

即梦4.5 测试构图示例 1

即梦4.5 构图示例 1

即梦4.5 测试构图示例 2

即梦4.5 构图示例 2

即梦4.5 测试构图示例 3

即梦4.5 构图示例 3

结合更强的推理能力,Seedream-4.5 比 4.0 更好地处理在一句话中描述多个对象、风格和约束的复杂提示词。对于许多实际生产任务,更容易获得“一次尝试即可用”的图像。

6. 如何访问 Seedream-4.5

你可以通过火山引擎的 Ark 平台使用 Doubao-Seedream-4.5。

开发者可以将 Seedream-4.5 集成到产品管线中,用于:

  • 图像生成和编辑工具
  • 设计和营销平台
  • 电子商务图像工作流
  • 内部创意助手和内容制作系统

7. 定价和限制

收费简单,基于使用量:

  • 按调用付费(后付费): 每张图像 0.25 元人民币
  • 并发限制:
    • 公测期(2025-12-03 至 2025-12-09):IPM(每分钟图像数)限制 50
    • 2025-12-10 正式发布后:IPM 限制 500
    • 更高并发:联系火山引擎销售团队

这个定价对于个人创作者和企业级管线来说都是合理的,特别是如果你进行批量生成或运行预定任务。

8. 现在如何尝试

Mew Design(推荐)

如今体验 Seedream 4.5 最简单的方式是通过 Mew Design,它已经集成了最新的模型。你可以直接在 Mew Design 界面中生成和编辑图像,无需额外部署。

其他火山引擎入口

如果你更喜欢直接使用火山引擎,你也可以通过图像生成控制台或 API 访问 Seedream 4.5。这让你能够更好地控制高级参数并将其集成到你自己的工作流中。Ark 体验中心: https://console.volcengine.com/ark/region:ark+cn-beijing/experience/vision?modelId=doubao-seedream-4-5-251128&tab=GenImage

你可以轻松测试如下提示词:

  • 用于人像、产品照或概念艺术的单图生成
  • 使用多个参考图像的多图合成
  • 编辑实验(改变背景、服装、材质或光照)
  • 带有小文本的海报和 Logo 草稿

最后的想法

Seedream-4.5 感觉像是对即梦4.0 的一次有意义的提升。在实际测试中,该模型:

  • 使面部、光线和细节更接近原图
  • 更可靠地处理多图合成和角色连续性
  • 为海报和 UI 模型生成更清晰的小文本
  • 生成更具电影感、美学上更令人愉悦且构图更好的图像
  • 在复杂、多元素的提示词上显示出更强的推理能力

对于需要在图像生成中同时兼顾创造力和控制力的团队——特别是用于编辑、品牌推广和设计——Doubao-Seedream-4.5 已经准备好作为一个严肃的生产工具,而不仅仅是一个演示模型来使用。