60 秒的世界:为什么 Project Genie 必须限时

60 秒的世界:为什么 Project Genie 必须限时

你花 250 美元订阅 Google AI Ultra,兴冲冲打开 Project Genie,创建了一个森林世界,操控一只柴犬开始探索。

然后 60 秒后,世界结束了。

不是卡住,不是报错,就是到时间了。你得重新生成一个世界,重新开始。

为什么?

技术限制:模型会"忘事"

Genie 3 的工作方式是:根据之前的画面和你的动作,预测下一帧。它没有一个真正的 3D 场景数据库在后台,一切都是边走边画。

问题在于,它能"记住"的历史是有限的。DeepMind 说 Genie 3 的视觉记忆大约能覆盖一分钟。再往前的内容,模型的注意力就照顾不到了。

这会导致什么?你往前走两分钟,转头回看,发现刚才经过的小屋变了个样子。或者干脆消失了。这种"世界失忆"会彻底破坏沉浸感。

把体验时长卡在 60 秒,刚好在记忆边界之内。用户看到的世界至少是自洽的。

算力成本:实时生成很贵

传统视频生成是离线渲染——你提交任务,等几分钟,拿到结果。Sora 生成一分钟视频可能要跑好几分钟。

Genie 3 不一样。它必须在你按下键盘的瞬间就给出响应,每秒要画 24 帧,每帧都是 720p。这对算力的要求完全不在一个量级。

让每个用户无限时长地探索,服务器扛不住。60 秒是一个在"体验完整性"和"服务成本"之间取的平衡点。

商业模式:区分付费层级的抓手

AI Ultra 订阅每月 250 美元,已经是 Google AI 产品线最贵的档位。如果无限时长探索,这个价格可能根本 cover 不住成本。

限制单次时长还有另一个好处:如果未来推出更贵的"专业版",无限时长或者更长时长就成了差异化功能。

内容风险:跑久了更容易出问题

时间越长,模型出错的概率越高。画面可能开始扭曲,物体可能穿模,角色可能卡进地形里。

更麻烦的是,长时间交互增加了"生成不当内容"的窗口。一个 60 秒的世界,人工审核团队还能抽查。一个跑几十分钟的世界,监控成本就高多了。

The Verge 的测试记者发现,Project Genie 会动态调整内容策略——测试开始时能生成的任天堂风格世界,测试结束时就被封了。这种实时策略调整在短时长体验里更容易执行。

60 秒够用吗

说实话,不够。

The Verge 那篇体验文章的标题是"Google 的 AI 帮我做了些烂任天堂仿作"。作者说最大的乐趣来自于尝试生成各种奇怪的组合,而不是真正"玩"这些世界。因为 60 秒加上输入延迟,根本来不及做什么有意义的事。

但这可能正是 Google 现阶段想要的状态。Project Genie 目前的定位是"实验性研究原型",不是成熟产品。让用户能体验到核心能力,收集反馈,但不要太沉浸以至于暴露太多问题。

什么时候能更长

当以下条件满足时:

  1. 模型的长期记忆能力提升(需要架构层面的改进)
  2. 推理成本下降(需要硬件或优化层面的进步)
  3. 内容安全策略成熟(需要更多实战经验)

这不是一两个月能解决的事。如果你期待的是"在 AI 生成的世界里玩一个下午",可能要等相当长一段时间。

现在的 60 秒,是 Google 在技术、成本、安全三个维度找到的一个临时平衡点。它确实短,但它让 Project Genie 能以一个可控的形态先跑起来。

← 返回博客列表