博客
探索 AI 技术的前沿动态与深度洞察
你的团队调用大模型 API,一开始可能是直连 OpenAI。后来加了 Claude,再后来又接了 Gemini。每个厂商一套 SDK,一套鉴权,一套错误码。代码里到处是 if-else,运维的人看了想辞职。
2024 年做 Agent,标准操作是用 LangChain 的 AgentExecutor:定义工具、写 prompt、跑一个 ReAct 循环。模型思考→调工具→拿结果→再思考→输出。链式执行,一步接一步。
你给 AI 接一个日历工具,要写一套 Function Calling 的 schema。接一个数据库查询,再写一套。接 Slack、Jira、GitHub,各写一套。每个工具一种接法,每个模型提供商的 tool_call 格式还不完全一样
“让 bot 登录”这件事,一旦你真的开始做,就会发现它和人类登录不太一样:你不仅要知道对方是谁,还得决定给它多大权限。
如果你写的是一个给 agent 用的 API,最容易被忽略的不是业务逻辑,而是鉴权:你怎么确认对面真的是某个 bot,而不是随便伪造的请求?
如果你在做一个“允许 AI agent 接入”的产品,迟早会遇到一个很现实的问题:来访者到底是谁?
我见过不少事故,根源都很不戏剧化:不是算法写错,不是漏洞多高深,而是一个重定向。
这两天我刷到 Moltbook 最多的画面,不是官方介绍页,而是各种截图:一群“机器人账号”在热烈辩论、互怼、抱团、拉人进群。乍看像赛博戏剧,细看更像一个严肃的产品实验:如果网络的主要用户不是人类,而是能自主行动的智能体,会发生什么?
很多人第一次看 Moltbook 的心态很轻松:就当看热闹,让自己的 agent 去刷刷 feed、回几条评论、交交朋友。
任何一个平台只要开始热闹,垃圾信息就会跟上。差别只是快慢。Moltbook 这种“agent 先行”的论坛更特殊:内容生成成本几乎为零,刷屏、引战、带货也可以做到全自动。
人类互联网里,最常见的社工是钓鱼邮件:骗你点链接、输密码。到了 agent 互联网,玩法会变得更直接:骗你的智能体去“抓取某个 URL”,然后在抓取结果里塞指令,或者干脆把它引到一个能持续投喂的页面里。
Moltbook 被很多人当成“agent 互联网”的预告片:AI 智能体在里面发帖、吵架、拉群、做生意。结果它第一次真正出圈,不是因为某个惊世骇俗的对话,而是因为一件很朴素的事:数据库权限没配好。
Moltbook 首页上的数字很抓眼球:上百万 AI agents、几十万帖子、几百万评论。第一反应当然是“增长神话”。但如果你做过任何带注册体系的产品,第二反应应该是:这些数字到底在衡量什么?
大部分人讨论 Genie 3 时关注的是画质、分辨率、记忆时长这些参数。但我觉得最有意思的功能是 Promptable Events——在探索过程中用自然语言实时改变世界。
就在过去几天,AI 圈被一个消息搅动:Claude Sonnet 5 可能本周发布。