复杂编辑任务怎么办?涂抹、框选、箭头:Seedream 4.5 的标注式 Prompt

复杂编辑任务怎么办?涂抹、框选、箭头:Seedream 4.5 的标注式 Prompt

用文字描述"改图里的哪个位置"这件事,有时候很麻烦。

你说"把左边那个东西去掉",左边有三个东西,模型不知道你说的是哪个。你说"把标题字放大",图里有两行文字,哪个是标题?

Seedream 4.5 提供了一个解决方案:直接在图上做标注——涂抹、画框、标箭头,然后在文字指令里引用这些标注。

这个功能在官方 Prompt Guide 里叫做"视觉提示"(visual cues),支持三种标注方式。下面逐个说。


01 涂抹标注(Doodle)

最直观的方式。你在图上用颜色涂抹出想要修改的区域,然后在指令里引用这个颜色。

官方案例:一张空房间的照片,用红色涂抹了一块区域,用蓝色涂抹了另一块区域。指令是"在红色标记的位置放一台电视,在蓝色标记的位置放一张沙发。保持原有的木质风格不变"。

模型的工作流程是:识别红色和蓝色区域→在对应位置生成电视和沙发→保持其余画面不变。

这个方式适合什么场景?你想往图里"加东西",但加的位置用文字描述很费劲的时候。"房间右侧中间偏下的位置"不如直接涂一块红色来得清楚。

注意事项:涂抹的颜色要跟图片本身的主色调有明显区分。如果你的图本来就是红色调的,用红色涂抹模型可能分不清哪是标注哪是原图。换个绿色或者蓝色。


02 框选标注(Bounding Box)

画一个矩形框,框住你想要操作的区域。

官方案例:一张音乐海报,画了一个红色矩形框圈住标题区域。指令是"把标题放大到跟红色框一样大,风格改成跟萨克斯图标一致"。

这里的红色框同时传达了两个信息:操作的目标区域,和目标的大小。模型需要把标题文字放大到填满框的范围,同时改变字体风格。

框选比涂抹更精确——涂抹是"大概这个区域",框选是"就这么大的矩形范围"。当你需要精确控制生成内容的尺寸和位置时,框选更合适。

适用场景:调整文字大小和位置、指定新元素的精确放置区域、标记需要替换的矩形区块。


03 什么时候用哪种

没有绝对规则,但有一些经验判断:

不规则区域用涂抹。你想改的东西形状不规则——一片云、一个人的头发、地上的一滩水——涂抹最方便。

规则区域用框选。你要操作的区域可以用矩形近似——一块广告牌、一个文字区域、一张桌面——框选更精确。

两种方式可以叠加使用。同一张图上,用红色涂抹标记区域 A,用蓝色框选标记区域 B,然后在指令里分别说明"红色区域做 X,蓝色框内做 Y"。


04 标注式 Prompt 的写法模板

结合官方指南和实际测试反馈,一条好的标注式编辑指令通常包含三个部分:

标注引用 + 目标操作 + 约束条件

举几个例子:

在红色标记的区域放一台电视(标注引用),保持原有的木质装修风格(约束条件)。

把红色框内的标题放大到框的大小(标注引用 + 目标操作),字体风格改成跟旁边的萨克斯图标一致(操作细化)。

让红色涂抹位置的单词变成蓝色斜体文字(标注引用 + 颜色修改 + 字体修改)。

几个容易踩的坑:

标注颜色写错。你用绿色涂的,指令里写成了"红色区域",模型会懵。标注颜色和指令里的引用颜色必须一致。

标注太潦草。涂抹的时候随便划了几下,区域边界模糊不清。模型识别标注区域的精度有限,涂抹太随意它可能误判范围。

指令里没提标注。你辛辛苦苦在图上做了标注,但指令里一句都没引用,模型可能完全忽略标注,按照纯文字理解去执行。标注和指令必须配合使用。


05 一个迭代策略

复杂编辑任务不要试图一步到位。

比如你想做的事情是:把图里左上角的文字删掉→在那个位置加一个新的 Logo→调整 Logo 大小→改变 Logo 的颜色跟画面配色统一。

不要把这四步写成一条超长指令。拆开来,每次只做一步:

第一轮:涂抹标记左上角文字区域,指令"删掉红色标记区域的文字,背景自然填充"。

第二轮:在删干净的区域画一个框,指令"在红色框内放置一个圆形 Logo,Logo 内容是字母 S"。

第三轮:如果 Logo 大小不合适,调整框的大小重来。

第四轮:指令"把 Logo 的颜色改成跟背景相近的深蓝色"。

每一步都锁定种子值,确认当前步骤的结果满意后再进入下一步。这种做法的总耗时可能比"一条指令搞定"长,但成功率高得多。

官方 Prompt Guide 里的原话是:"每次只修改一个部分,而非完全重写。"实际操作中,这条建议省了我不少重跑的次数。


参考来源:

← 返回博客列表