如果你最近在技术圈看到 Clawdbot、Moltbot、OpenClaw 这几个名字轮番出现,不确定它们是不是同一个东西,这篇文章帮你理清楚。
上周一个叫 Clawdbot 的开源 AI Agent 工具突然爆火。GitHub 一周涨了 12 万星,总数冲到 18 万。据说还带动了 Mac Mini 销量,因为用户想买台专门的机器跑这玩意。
Moltbook 的翻车,让"Agent Internet"(AI 互联网)这个概念蒙上了一层阴影。
OpenClaw 这一周的经历,像极了一个孩子突然被迫长大的过程。
Google 把 Genie 3 叫做"通向 AGI 的垫脚石"。这句话在发布会上一闪而过,但值得认真拆解一下。
上周 Google 开放了 Project Genie 的访问权限。我花了 $249.99 订阅了 AI Ultra,试用了几天,来说说真实体验。
有人用 Genie 3 花了 10 分钟做出一个类似塞尔达的冒险游戏原型。另一个人用它生成了马里奥风格的平台跳跃关卡。这些视频在推特上传开后,游戏开发者的反应两极分化。
Genie 3 生成的世界不是传统意义上的 3D 场景。没有多边形网格,没有纹理贴图,没有光线追踪。它做的事情更接近"实时视频生成"。
2024 年 12 月,Google DeepMind 发布 Genie 2。2025 年 8 月,Genie 3 亮相。2026 年 1 月,Project Genie 向付费用户开放。
Genie 3 的视觉记忆能维持"数分钟"。听起来比 Genie 2 的 10 秒强多了,但放到实际使用场景里,这个时长仍然很短。
Google 宣传 Genie 3 是"通向 AGI 的垫脚石"。这个说法有一个核心假设:在模拟世界里训练出来的 AI,能够迁移到真实世界中。
有人看到 Genie 3 的演示后问:这东西以后会不会取代 Unity 和 Unreal?
这两天我刷到 Moltbook 最多的画面,不是官方介绍页,而是各种截图:一群“机器人账号”在热烈辩论、互怼、抱团、拉人进群。乍看像赛博戏剧,细看更像一个严肃的产品实验:如果网络的主要用户不是人类,而是能自主行动的智能体,会发生什么?
你给 AI 接一个日历工具,要写一套 Function Calling 的 schema。接一个数据库查询,再写一套。接 Slack、Jira、GitHub,各写一套。每个工具一种接法,每个模型提供商的 tool_call 格式还不完全一样
2024 年做 Agent,标准操作是用 LangChain 的 AgentExecutor:定义工具、写 prompt、跑一个 ReAct 循环。模型思考→调工具→拿结果→再思考→输出。链式执行,一步接一步。
别再后期配音了,ByteDance 的新模型让声音和画面一起"长"出来。
"同时生成音频和视频"这句话说起来很简单,但做起来需要在模型架构上动刀子。
"AI 视频能说话了"这个卖点听上去很酷,但具体好用到什么程度?踩了哪些坑?
别再后期配音了,ByteDance 的新模型让声音和画面一起“长”出来。
上周帮朋友做一个产品宣传视频,他让我用 AI 生成。