博客

探索 AI 技术的前沿动态与深度洞察

DeepMind 有两个看起来独立的项目：

Genie 3 最让人意外的功能之一是 Promptable World Events。简单说：你可以在探索世界的过程中，用文字命令改变世界。

DeepMind 说 Genie 3 可以用来训练 AI 智能体。思路是：在虚拟世界里大量练习，然后迁移到现实世界。

DeepMind 的 Genie 系列论文只说了"我们做到了什么"，没开源代码，没公开数据集。你想复现？门都没有。

传统游戏引擎和世界模型，做的是同一件事：创造可交互的虚拟环境。但技术路线完全不同。

最近有篇 Medium 文章的标题很吓人："Google DeepMind Genie 3's Billion-Frame Secret: The $100M AI Engine That Just Made 40% of Indie De

The Verge 记者 Sean Hollister 是最早拿到 Project Genie 测试资格的人之一。他的测评标题很直接："Google's AI helped me make bad Nintendo knockoffs"。

DeepMind 在 Genie 3 的论文和博客里详细描述了模型架构、训练方法、能力展示。但有一个问题他们几乎不提：训练数据从哪来？

用 Midjourney 生成图片的时候，你写一段提示词就行。用 Sora 生成视频，也是一段提示词。

Genie 3 的演示视频看起来惊艳：720p 实时交互，画面一致性保持几分钟，森林、海洋、火山什么场景都能生成。

2026 年 1 月 29 日，Google Labs 正式向 AI Ultra 订阅用户开放 Project Genie——一个基于 Genie 3 世界模型的可交互环境生成工具。对于正在折腾 Agentic AI 的开发者来说，这不只是

你训练了一个家用服务机器人。它能端茶倒水、收拾房间、帮老人拿药。

Hacker News 上关于 Genie 3 的讨论帖里，点赞最高的一条评论提到一个想法：未来的机器人可能会在梦里学习。

The Verge 的测试记者在 Project Genie 里玩"Rollerball"——一个蓝色球在雪地上滚动，滚过的地方会留下颜料痕迹。

看 Genie 3 的演示视频，第一反应是：这是不是要革游戏行业的命？