让 AI 生成的海报不再"字丑字错字糊":Nano Banana 2 中文排版实战

让 AI 生成的海报不再"字丑字错字糊":Nano Banana 2 中文排版实战

用 AI 生图做过海报的人都有一个共同的痛:文字。

英文还好,中文简直是灾难。要么缺笔画,要么多一横,要么字体丑得没法看。Stable Diffusion 要靠 ControlNet 叠加文字层,Midjourney 对中文基本放弃治疗。

Google 最新的 Nano Banana 2(Gemini 3.1 Flash Image)宣称文字渲染能力大幅提升,还支持图内翻译。我拿中文场景做了一轮测试,看看到底好不好使。

测试一:中文标题直出

最基本的需求:在图里写几个中文大字。

Prompt

"一张新年促销海报,红色背景,金色大字写着'新春大吉',下方小字'全场五折起',中国风"

结果

  • "新春大吉"四个字完整出现了,没有缺笔画
  • 字体自动匹配了毛笔风格,和"中国风"的指令一致
  • "全场五折起"的小字也是可读的,字间距合理

但要注意,中文字体的选择范围比英文窄很多。模型倾向于生成宋体或手写体,如果你想要特定字体(比如思源黑体),目前没法精确控制。

测试二:长文本的稳定性

短标题能写对,长一点的呢?

Prompt

"一张咖啡馆菜单,白底黑字,列出以下品项:美式咖啡 ¥18 / 拿铁 ¥22 / 卡布奇诺 ¥25 / 抹茶拿铁 ¥28,底部写着'每日新鲜现磨'"

结果

  • 四个品项和价格全部正确
  • 价格符号 ¥ 渲染正确
  • 排列是竖向列表格式,看起来像真的菜单
  • "每日新鲜现磨"出现在底部,位置合理

不过我测了三次,有一次"卡布奇诺"写成了"卡布奇洛"。三次里错一次,准确率大概 70%。如果是批量生成,还是需要人工抽检。

测试三:图内翻译

这是从 Pro 下放的功能。给一张已有图片,让模型把里面的文字翻译成另一种语言。

Prompt

先生成一张英文路牌写着 "Native Wildlife: Please Observe from a Distance",然后要求"把图里的文字翻译成中文"

结果

  • 翻译后的图里路牌写着"本地野生动物:请远距离观察"
  • 字体风格和原图保持一致(木质手写风格)
  • 字随着牌子的弧度有轻微倾斜,不是平贴上去的

翻译质量本身还行,但"远距离观察"不如"请保持距离"自然。模型做的是直译,不会帮你润色。

中文排版的常见失败模式

测试中我总结了几个容易出错的情况:

  1. 生僻字容易错:比如"饕餮"这种笔画复杂的词,大概率会画错
  2. 竖排文字不稳定:要求竖排中文时,字序有时会乱
  3. 小字号崩坏:当文字很小(比如图片角落的版权信息),笔画容易糊成一团
  4. 中英文混排有对齐问题:同一行里中文和英文混在一起时,字号和基线有时对不齐

实用建议

如果你要用 Nano Banana 2 做带中文的图,几个建议:

  • 把文字内容放在 Prompt 的最前面,模型对靠前的指令遵循度更高
  • 控制字数,标题控制在 8 个字以内最稳
  • 不要依赖一次出图,生成 2-3 张挑一张最好的
  • 长段落文字(超过 20 字)建议后期用 PS 或 Figma 单独叠加,不要交给 AI
  • 翻译功能适合做粗稿,正式发布前需要人工校对译文

和其他工具的对比

维度 Nano Banana 2 DALL-E 3 Midjourney v6 Ideogram 2
英文文字
中文文字 良(偶尔错字) 中(经常错)
图内翻译 支持 不支持 不支持 不支持
速度 ~8s ~15s ~45s ~12s

Nano Banana 2 在中文文字上不是满分,但在目前的主流模型里算是最好的那一档。加上图内翻译的独特能力,做多语言物料的效率提升很明显。


参考链接

  1. Google 官方博客 - Nano Banana 2
  2. TechCrunch - Google launches Nano Banana 2
  3. Nano Banana 2 Prompt Guide
  4. Gemini API - Image Generation Docs
← 返回博客列表