60 秒的世界:为什么 Project Genie 必须限时
你花 250 美元订阅 Google AI Ultra,兴冲冲打开 Project Genie,创建了一个森林世界,操控一只柴犬开始探索。
然后 60 秒后,世界结束了。
不是卡住,不是报错,就是到时间了。你得重新生成一个世界,重新开始。
为什么?
技术限制:模型会"忘事"
Genie 3 的工作方式是:根据之前的画面和你的动作,预测下一帧。它没有一个真正的 3D 场景数据库在后台,一切都是边走边画。
问题在于,它能"记住"的历史是有限的。DeepMind 说 Genie 3 的视觉记忆大约能覆盖一分钟。再往前的内容,模型的注意力就照顾不到了。
这会导致什么?你往前走两分钟,转头回看,发现刚才经过的小屋变了个样子。或者干脆消失了。这种"世界失忆"会彻底破坏沉浸感。
把体验时长卡在 60 秒,刚好在记忆边界之内。用户看到的世界至少是自洽的。
算力成本:实时生成很贵
传统视频生成是离线渲染——你提交任务,等几分钟,拿到结果。Sora 生成一分钟视频可能要跑好几分钟。
Genie 3 不一样。它必须在你按下键盘的瞬间就给出响应,每秒要画 24 帧,每帧都是 720p。这对算力的要求完全不在一个量级。
让每个用户无限时长地探索,服务器扛不住。60 秒是一个在"体验完整性"和"服务成本"之间取的平衡点。
商业模式:区分付费层级的抓手
AI Ultra 订阅每月 250 美元,已经是 Google AI 产品线最贵的档位。如果无限时长探索,这个价格可能根本 cover 不住成本。
限制单次时长还有另一个好处:如果未来推出更贵的"专业版",无限时长或者更长时长就成了差异化功能。
内容风险:跑久了更容易出问题
时间越长,模型出错的概率越高。画面可能开始扭曲,物体可能穿模,角色可能卡进地形里。
更麻烦的是,长时间交互增加了"生成不当内容"的窗口。一个 60 秒的世界,人工审核团队还能抽查。一个跑几十分钟的世界,监控成本就高多了。
The Verge 的测试记者发现,Project Genie 会动态调整内容策略——测试开始时能生成的任天堂风格世界,测试结束时就被封了。这种实时策略调整在短时长体验里更容易执行。
60 秒够用吗
说实话,不够。
The Verge 那篇体验文章的标题是"Google 的 AI 帮我做了些烂任天堂仿作"。作者说最大的乐趣来自于尝试生成各种奇怪的组合,而不是真正"玩"这些世界。因为 60 秒加上输入延迟,根本来不及做什么有意义的事。
但这可能正是 Google 现阶段想要的状态。Project Genie 目前的定位是"实验性研究原型",不是成熟产品。让用户能体验到核心能力,收集反馈,但不要太沉浸以至于暴露太多问题。
什么时候能更长
当以下条件满足时:
- 模型的长期记忆能力提升(需要架构层面的改进)
- 推理成本下降(需要硬件或优化层面的进步)
- 内容安全策略成熟(需要更多实战经验)
这不是一两个月能解决的事。如果你期待的是"在 AI 生成的世界里玩一个下午",可能要等相当长一段时间。
现在的 60 秒,是 Google 在技术、成本、安全三个维度找到的一个临时平衡点。它确实短,但它让 Project Genie 能以一个可控的形态先跑起来。