AI 生成的世界能训练出 AGI 吗

AI 生成的世界能训练出 AGI 吗

Google 宣传 Genie 3 是"通向 AGI 的垫脚石"。这个说法有一个核心假设:在模拟世界里训练出来的 AI,能够迁移到真实世界中。

这个假设成立吗?

论点

支持者的逻辑大概是这样的。

人类之所以能发展出通用智能,是因为我们生活在一个丰富的物理世界里。我们通过与世界的交互学会了因果推理、空间认知、物体操控。这些能力不是从书本上学来的,而是从经验中长出来的。

当前的大语言模型只接触文本数据。文本是对世界的二手描述,不是世界本身。模型可以知道"杯子掉下来会摔碎",但它没有真正"体验"过这个过程。这种抽象的知识可能不足以支撑通用智能。

世界模型提供了一个解决方案:让 AI 在模拟的物理环境中学习。Genie 3 可以生成无限多样的 3D 世界,AI Agent 可以在里面自由探索、尝试、犯错。这种体验式学习可能是通向 AGI 的关键。

反驳

质疑者也有自己的论点。

模拟不等于真实。Genie 3 生成的世界只是"看起来像"真实世界,物理规则是从统计数据中学来的,不是精确模拟的。在这样的世界里学到的东西,能迁移到真实世界吗?

一个经典的例子:机器人在模拟器里学会了走路,放到真实环境里可能就摔倒。模拟器里的地面摩擦力、关节阻尼、传感器噪声都和真实不一样。这个问题有个专门的名字叫"sim-to-real gap",是机器人领域的老大难。

Genie 3 的 sim-to-real gap 可能更大。它甚至不是基于物理引擎的精确模拟,而是神经网络的近似生成。

计算成本问题。用世界模型训练 AI,每走一步都要生成一帧画面。这比在传统模拟器里运行要昂贵得多。如果成本太高,实际能做的实验就很有限。

可能走错方向。也许 AGI 根本不需要物理世界的经验。人类的智能确实依赖身体交互,但那可能只是演化的偶然结果,不是智能的本质需求。AI 可以走一条完全不同的路。

中间派的观点

我觉得更合理的立场在两个极端之间。

世界模型对某些类型的 AI 肯定有价值。需要与物理世界交互的系统——机器人、自动驾驶、游戏 NPC——确实需要某种形式的"物理直觉"。在模拟环境中预训练,再在真实环境中微调,这个路线是可行的。

但把这一点外推到"世界模型是 AGI 的必经之路",跳得太远了。

AGI 的定义本身就有争议。如果 AGI 只是"能做很多事情的 AI",那么当前的大模型已经有这个趋势。如果 AGI 是"像人一样思考的 AI",那需要的可能不只是更多数据或更好的训练环境。

DeepMind 的赌注

Google DeepMind 在世界模型上投入重注,这不是偶然。

这家实验室的基因来自强化学习。AlphaGo、AlphaStar、AlphaFold 都是让 AI 在特定环境中学习解决问题。世界模型是这个思路的自然延伸:如果环境可以自动生成,学习的范围就不再受限于人工设计的任务。

Demis Hassabis 多次表达过对"世界模型"的重视。他认为智能的核心是建立对世界的内在模型,然后用这个模型进行规划和推理。从这个角度看,Genie 不只是一个产品,而是整个 AGI 研究战略的一部分。

当然,这只是一种理论。DeepMind 的竞争对手们有不同的看法。OpenAI 更侧重于语言模型的规模扩展,Anthropic 关注安全和对齐,Meta 押注开源生态。没人知道哪条路会先到达终点。

目前能观察到什么

放下宏大的 AGI 叙事,看看现在实际能做到什么。

DeepMind 已经用 Genie 2 训练过 AI Agent(他们叫 SIMA)。这些 Agent 能在生成的 3D 环境中导航、完成简单任务。表现不算惊艳,但证明了这条路线的可行性。

问题是,这些 Agent 的能力还很窄。它们能在 Genie 生成的世界里走来走去,但放到不同风格的环境里就可能失效。泛化能力有限。

这可能正是需要解决的问题。如果能训练出一个在任意 Genie 环境中都能工作的 Agent,那离"通用"就近了一步。但目前还没有看到这样的成果。

我的判断

把世界模型和 AGI 挂钩,更像是一种叙事策略而不是技术论断。

"我们在做一个能生成 3D 场景的工具"听起来不够激动人心。"我们在建造通向 AGI 的垫脚石"就能引起关注、吸引投资、招募人才。

这不是说 DeepMind 在骗人。他们可能真的相信这个愿景。但愿景和现实之间有很大的距离,而且通向愿景的路可能有很多条。

对于普通观察者来说,把 Genie 3 当作一个有趣的技术产品来看待就够了。它能生成可交互的 3D 世界,这本身就有价值。至于能不能通向 AGI,让时间来验证吧。

如果五年后 AGI 真的出现了,而 Genie 是其中的关键组件,那 Google 的赌注就赢了。如果 AGI 从另一条完全不同的路走出来,Genie 仍然可以作为一个独立的产品存在,只是少了光环加持。

不管怎样,这个方向值得关注。世界模型是 AI 研究的前沿领域,接下来几年会有很多有意思的进展。

← 返回博客列表