Project Genie 上手两周:$250 买到了什么

Project Genie 上手两周:$250 买到了什么

开门见山

我订阅了 Google AI Ultra,主要就是为了试 Project Genie。两周下来,有些想法想说。

先说结论:技术上很惊艳,但作为产品还太粗糙。

实际能玩到什么

进入 Project Genie 界面,你有两个选项:文字描述生成世界,或者上传一张图让 AI 基于图片生成世界。

我试了"废弃的工业厂房,锈迹斑斑的机器,阳光从破碎的玻璃穹顶照进来"。等了大概 8 秒,一个可以 WASD 走动的 3D 环境出现了。

第一眼看确实震撼。光影效果不错,场景有层次感,走动的时候画面帧率基本稳定。

然后问题来了。

60 秒的尴尬

每个世界只能探索 60 秒。时间一到,画面冻结,提示你重新生成。

60 秒能干什么?刚走到有意思的角落,就结束了。想多看看那个锈迹斑斑的机器?不好意思,请重新排队。

我理解这是算力限制。Genie 3 是实时生成画面的,每秒 24 帧都是现算的,不是预渲染。60 秒已经是在烧钱了。

但作为用户体验,这个限制太扫兴。

输入延迟明显

演示视频里操作很流畅。实际用起来,按下方向键到画面响应,有明显的延迟。大概 200-300 毫秒的样子。

这个延迟不影响"逛",但影响"玩"。如果你试图精确控制走到某个位置,会感觉很别扭。

我猜是服务器端推理的延迟加上网络传输。要做到真正的实时体验,可能需要更近的边缘节点。

演示里的功能呢

Genie 3 发布会上展示的 Promptable World Events,就是在探索过程中输入命令改变世界,比如"突然下暴风雪"。

在 Project Genie 消费者版本里,这个功能没有。

你只能在生成初始世界的时候用文字描述。一旦世界生成完毕,你只能走路,不能改变任何东西。

这是我最失望的一点。发布会演示的核心功能,用户用不了。

Remix 模式

有个 Remix 功能,可以基于别人生成的世界做变体。

理论上你可以浏览社区里其他人生成的世界,然后加自己的描述生成新版本。

实际上社区内容还很少,大部分是官方的示例。而且 Remix 的可控程度很低,你没法指定"只改天气,其他不变"。

世界一致性问题

Genie 3 论文说能保持几分钟的一致性。但 60 秒限制让我没机会验证这个。

在 60 秒内,场景基本是一致的。同一棵树,走开再走回来,它还在那里。

但有几次我注意到地面纹理会突然变化。可能是模型记忆力的边缘情况。

值 $250 吗

单看 Project Genie,不值。

60 秒的探索窗口、缺失的核心功能、明显的输入延迟。这是一个技术演示,不是成熟产品。

如果你同时用得上 Ultra 订阅里的其他东西(Veo 3、大容量存储、高额度 API 调用),那 Project Genie 算是额外的福利。单独为它订阅,我不建议。

适合谁

技术尝鲜者。如果你就想第一时间感受世界模型能做什么,250 美元买个体验也不是不行。

内容创作者。生成的场景截图还是挺好看的,可以当素材。60 秒足够截几张图了。

研究人员。想理解商业化世界模型的用户体验边界,这是目前唯一能用的产品。

普通用户,等等再说。等功能更完整,价格更合理。

我的预测

Promptable World Events 功能大概率会在今年开放。这是 Genie 3 最有吸引力的卖点,不可能永远锁着。

60 秒限制可能会放宽到 2-3 分钟。但不会无限制,算力成本摆在那。

更便宜的订阅层级可能会出现。Google 应该在考虑一个 50-100 美元档位的选项。

现在订阅的人,本质上是花钱当测试用户。Google 拿你的使用数据改进产品。想清楚你愿不愿意。

← 返回博客列表