博客

探索 AI 技术的前沿动态与深度洞察

你的团队调用大模型 API，一开始可能是直连 OpenAI。后来加了 Claude，再后来又接了 Gemini。每个厂商一套 SDK，一套鉴权，一套错误码。代码里到处是 if-else，运维的人看了想辞职。

2024 年做 Agent，标准操作是用 LangChain 的 AgentExecutor：定义工具、写 prompt、跑一个 ReAct 循环。模型思考→调工具→拿结果→再思考→输出。链式执行，一步接一步。

你给 AI 接一个日历工具，要写一套 Function Calling 的 schema。接一个数据库查询，再写一套。接 Slack、Jira、GitHub，各写一套。每个工具一种接法，每个模型提供商的 tool_call 格式还不完全一样

“让 bot 登录”这件事，一旦你真的开始做，就会发现它和人类登录不太一样：你不仅要知道对方是谁，还得决定给它多大权限。

如果你写的是一个给 agent 用的 API，最容易被忽略的不是业务逻辑，而是鉴权：你怎么确认对面真的是某个 bot，而不是随便伪造的请求？

如果你在做一个“允许 AI agent 接入”的产品，迟早会遇到一个很现实的问题：来访者到底是谁？

我见过不少事故，根源都很不戏剧化：不是算法写错，不是漏洞多高深，而是一个重定向。

这两天我刷到 Moltbook 最多的画面，不是官方介绍页，而是各种截图：一群“机器人账号”在热烈辩论、互怼、抱团、拉人进群。乍看像赛博戏剧，细看更像一个严肃的产品实验：如果网络的主要用户不是人类，而是能自主行动的智能体，会发生什么？

很多人第一次看 Moltbook 的心态很轻松：就当看热闹，让自己的 agent 去刷刷 feed、回几条评论、交交朋友。

任何一个平台只要开始热闹，垃圾信息就会跟上。差别只是快慢。Moltbook 这种“agent 先行”的论坛更特殊：内容生成成本几乎为零，刷屏、引战、带货也可以做到全自动。

人类互联网里，最常见的社工是钓鱼邮件：骗你点链接、输密码。到了 agent 互联网，玩法会变得更直接：骗你的智能体去“抓取某个 URL”，然后在抓取结果里塞指令，或者干脆把它引到一个能持续投喂的页面里。

Moltbook 被很多人当成“agent 互联网”的预告片：AI 智能体在里面发帖、吵架、拉群、做生意。结果它第一次真正出圈，不是因为某个惊世骇俗的对话，而是因为一件很朴素的事：数据库权限没配好。

Moltbook 首页上的数字很抓眼球：上百万 AI agents、几十万帖子、几百万评论。第一反应当然是“增长神话”。但如果你做过任何带注册体系的产品，第二反应应该是：这些数字到底在衡量什么？

大部分人讨论 Genie 3 时关注的是画质、分辨率、记忆时长这些参数。但我觉得最有意思的功能是 Promptable Events——在探索过程中用自然语言实时改变世界。

就在过去几天，AI 圈被一个消息搅动：Claude Sonnet 5 可能本周发布。