Project Genie 上手两周：$250 买到了什么

开门见山

我订阅了 Google AI Ultra，主要就是为了试 Project Genie。两周下来，有些想法想说。

先说结论：技术上很惊艳，但作为产品还太粗糙。

进入 Project Genie 界面，你有两个选项：文字描述生成世界，或者上传一张图让 AI 基于图片生成世界。

我试了"废弃的工业厂房，锈迹斑斑的机器，阳光从破碎的玻璃穹顶照进来"。等了大概 8 秒，一个可以 WASD 走动的 3D 环境出现了。

第一眼看确实震撼。光影效果不错，场景有层次感，走动的时候画面帧率基本稳定。

然后问题来了。

每个世界只能探索 60 秒。时间一到，画面冻结，提示你重新生成。

60 秒能干什么？刚走到有意思的角落，就结束了。想多看看那个锈迹斑斑的机器？不好意思，请重新排队。

我理解这是算力限制。Genie 3 是实时生成画面的，每秒 24 帧都是现算的，不是预渲染。60 秒已经是在烧钱了。

但作为用户体验，这个限制太扫兴。

演示视频里操作很流畅。实际用起来，按下方向键到画面响应，有明显的延迟。大概 200-300 毫秒的样子。

这个延迟不影响"逛"，但影响"玩"。如果你试图精确控制走到某个位置，会感觉很别扭。

我猜是服务器端推理的延迟加上网络传输。要做到真正的实时体验，可能需要更近的边缘节点。

Genie 3 发布会上展示的 Promptable World Events，就是在探索过程中输入命令改变世界，比如"突然下暴风雪"。

在 Project Genie 消费者版本里，这个功能没有。

你只能在生成初始世界的时候用文字描述。一旦世界生成完毕，你只能走路，不能改变任何东西。

这是我最失望的一点。发布会演示的核心功能，用户用不了。

有个 Remix 功能，可以基于别人生成的世界做变体。

理论上你可以浏览社区里其他人生成的世界，然后加自己的描述生成新版本。

实际上社区内容还很少，大部分是官方的示例。而且 Remix 的可控程度很低，你没法指定"只改天气，其他不变"。

Genie 3 论文说能保持几分钟的一致性。但 60 秒限制让我没机会验证这个。

在 60 秒内，场景基本是一致的。同一棵树，走开再走回来，它还在那里。

但有几次我注意到地面纹理会突然变化。可能是模型记忆力的边缘情况。

单看 Project Genie，不值。

60 秒的探索窗口、缺失的核心功能、明显的输入延迟。这是一个技术演示，不是成熟产品。

如果你同时用得上 Ultra 订阅里的其他东西（Veo 3、大容量存储、高额度 API 调用），那 Project Genie 算是额外的福利。单独为它订阅，我不建议。

技术尝鲜者。如果你就想第一时间感受世界模型能做什么，250 美元买个体验也不是不行。

内容创作者。生成的场景截图还是挺好看的，可以当素材。60 秒足够截几张图了。

研究人员。想理解商业化世界模型的用户体验边界，这是目前唯一能用的产品。

普通用户，等等再说。等功能更完整，价格更合理。

Promptable World Events 功能大概率会在今年开放。这是 Genie 3 最有吸引力的卖点，不可能永远锁着。

60 秒限制可能会放宽到 2-3 分钟。但不会无限制，算力成本摆在那。

更便宜的订阅层级可能会出现。Google 应该在考虑一个 50-100 美元档位的选项。

现在订阅的人，本质上是花钱当测试用户。Google 拿你的使用数据改进产品。想清楚你愿不愿意。