博客
探索 AI 技术的前沿动态与深度洞察
DeepMind 有两个看起来独立的项目:
Genie 3 最让人意外的功能之一是 Promptable World Events。简单说:你可以在探索世界的过程中,用文字命令改变世界。
DeepMind 说 Genie 3 可以用来训练 AI 智能体。思路是:在虚拟世界里大量练习,然后迁移到现实世界。
DeepMind 的 Genie 系列论文只说了"我们做到了什么",没开源代码,没公开数据集。你想复现?门都没有。
传统游戏引擎和世界模型,做的是同一件事:创造可交互的虚拟环境。但技术路线完全不同。
最近有篇 Medium 文章的标题很吓人:"Google DeepMind Genie 3's Billion-Frame Secret: The $100M AI Engine That Just Made 40% of Indie De
The Verge 记者 Sean Hollister 是最早拿到 Project Genie 测试资格的人之一。他的测评标题很直接:"Google's AI helped me make bad Nintendo knockoffs"。
DeepMind 在 Genie 3 的论文和博客里详细描述了模型架构、训练方法、能力展示。但有一个问题他们几乎不提:训练数据从哪来?
用 Midjourney 生成图片的时候,你写一段提示词就行。用 Sora 生成视频,也是一段提示词。
Genie 3 的演示视频看起来惊艳:720p 实时交互,画面一致性保持几分钟,森林、海洋、火山什么场景都能生成。
2026 年 1 月 29 日,Google Labs 正式向 AI Ultra 订阅用户开放 Project Genie——一个基于 Genie 3 世界模型的可交互环境生成工具。对于正在折腾 Agentic AI 的开发者来说,这不只是
你训练了一个家用服务机器人。它能端茶倒水、收拾房间、帮老人拿药。
Hacker News 上关于 Genie 3 的讨论帖里,点赞最高的一条评论提到一个想法:未来的机器人可能会在梦里学习。
The Verge 的测试记者在 Project Genie 里玩"Rollerball"——一个蓝色球在雪地上滚动,滚过的地方会留下颜料痕迹。
看 Genie 3 的演示视频,第一反应是:这是不是要革游戏行业的命?