Google 搞了个能"凭空生成游戏世界"的 AI,我玩了一下午

Google 搞了个能"凭空生成游戏世界"的 AI,我玩了一下午

封面图建议:一个人站在电脑前,屏幕上显示奇幻 3D 世界的画面


前两天刷推特,看到一堆人在讨论 Google 的新玩意儿。

叫 Project Genie。

简单说就是:你打几个字描述一个场景,它直接给你生成一个能走进去逛的 3D 世界。

不是图片。不是视频。是你能用方向键控制角色在里面跑来跑去的那种。

我当时的反应是:吹吧,又是 PPT。


然后我真的试了一下

(注:目前只对美国地区的 Google AI Ultra 订阅用户开放,月费 250 美元。我是蹭朋友账号玩的。)

打开网页,界面很简单。一个输入框,让你描述想要的世界。

我试着输入:

"废弃的太空站,从破碎的舷窗能看到地球"

等了大概十几秒。

然后屏幕上真的出现了一个太空站。

舷窗是碎的。地球在远处转。我按方向键,角色开始在走廊里飘。

说实话,当时有点发愣。

配图位置:太空站场景截图


这东西到底是怎么做到的

技术上叫"世界模型"。

你可以理解成:AI 看过海量的游戏视频和现实视频,学会了"世界应该长什么样"、"往左走画面会怎么变"这些规律。

然后根据你的描述,实时"想象"出一个世界来。

注意是"想象",不是"搭建"。

传统游戏引擎是程序员一块砖一块砖垒出来的,物理规则是写死的,每个物体都有精确的坐标。

这个不一样。它更像是一边走一边现编。你往前走,它就现编前面的路。你回头看,它再编身后的场景。

有点像做梦。梦里的世界也是这样,只有你正在看的地方是清晰的。


好玩归好玩,问题也不少

玩了一下午,说几个真实感受:

1. 经常"失忆"

我在一个森林里找到一棵特别大的树,标记了一下位置。走远了再走回来,那棵树不见了,换成了一片灌木。

这是因为 AI 的"记忆"只有大概一分钟。超过这个时间,它就忘了之前生成过什么。

2. 物理有时候很搞笑

我生成了一个有瀑布的山谷。水是在往下流的,但流到一半突然拐了个弯往上走。

还见过人物倒着跑、球悬在空中不掉下来之类的。

3. 生成啥很看运气

同样的描述词,每次生成的结果都不一样。有时候很惊艳,有时候一塌糊涂。没法精确控制。


那这东西有啥用?

Google 自己说:这是通向 AGI 的一步。

让 AI 理解"世界是怎么运转的",是通用人工智能的基础能力。

听起来很宏大,对普通人来说有点远。

实际一点的用途可能是:

游戏原型设计。 策划脑子里有个想法,以前要画概念图、找美术、搭场景。现在打几个字就能看到效果,几分钟定稿。

训练机器人。 让机器人在 AI 生成的各种环境里练习走路、避障。比真实测试便宜太多。

纯粹娱乐。 有人已经在用它生成各种奇怪的世界然后录视频发 YouTube 了。


250 美元一个月,值吗?

说实话,不值。

这东西目前更像一个技术演示,而不是成熟产品。

"失忆"问题没解决,就没法做出连贯的体验。物理不稳定,就没法做任何需要精确交互的事情。

花 250 美元/月买这个,相当于花钱当测试员。

除非你是游戏策划需要快速出原型,或者是研究 AI 的需要第一时间上手体验,否则建议等等。

等它更成熟,或者等开源社区做出免费的替代品。

配图位置:Google AI Ultra 订阅页面截图


对普通人意味着什么

我觉得最值得关注的不是这个产品本身,而是它代表的趋势:

"创造"的门槛在快速降低。

以前做一个 3D 场景,需要学 Maya、学 Blender、学 Unity。现在打几个字就有了。

以前写一段代码,需要学编程语言、学框架。现在描述需求就能生成。

以前拍一个视频,需要脚本、设备、剪辑。现在 Sora、Veo 之类的工具也在做这个事。

当"创造"变得越来越容易,什么变得更重要?

我猜是"知道要创造什么"。

会用工具的人会越来越多。但知道这个工具应该做出什么东西、什么东西是好的、什么东西是有价值的——这种判断力可能会变得更稀缺。


写在最后

Project Genie 让我想起第一次用 ChatGPT 的感觉。

当时也是一边玩一边想:"这玩意儿以后会变成什么样?"

两年过去,ChatGPT 已经是很多人工作流的一部分了。

Genie 呢?说不准。可能两年后它变得特别强,也可能被别的技术替代。

但有一件事是确定的:AI 能做的事情清单又多了一项。

而且这项有点厉害。


你对这类 AI 生成世界的技术怎么看?评论区聊聊。

觉得有用的话,点个「在看」👇

← 返回博客列表