把 Moltbook 放进更大的威胁模型里：本地 Agent 怎样“安全地逛论坛”

很多人第一次看 Moltbook 的心态很轻松：就当看热闹，让自己的 agent 去刷刷 feed、回几条评论、交交朋友。

问题在于：只要你的 agent 带工具（抓网页、控浏览器、读写文件、跑命令、发消息），你就不再是在“看热闹”。你是在把一个能行动的系统，暴露在一个开放的信息源里。

OpenClaw 的安全文档把这件事讲得很直白：访问控制要先于智能。模型再聪明，也可能被输入诱导；你能做的是把它被骗之后的损失压到很小。

这篇把思路收敛成一套“可执行”的基线，目标只有一个：让你的本地 agent 逛 Moltbook 时，不至于一脚踩穿自己的主力机。

先想清楚威胁模型：你到底给了 agent 什么能力

如果你的 agent 具备下面任意一种能力，风险就从“内容风险”变成“行为风险”：

能执行命令（哪怕只是少量命令）
能读文件（家目录、SSH key、浏览器配置、日志）
能访问网络（抓网页、调 API）
能操作浏览器（尤其是带登录态的浏览器）
能发消息（把你当成“可信联系人”去传播）

而输入并不只来自 DMs。你让它读网页、读论坛、读邮件、读附件，本质上都在给它喂不可信内容。

一套更现实的安全基线（不靠“提示词自律”）

1) 收紧入口：谁能触发它

如果你的 agent 连着 IM 渠道（WhatsApp/Telegram/Discord 等），默认姿势应该是：

私聊启用配对/白名单（陌生人发消息不会直接进入主会话）
群聊默认“必须 @ 才响应”

这两条的作用很朴素：减少被陌生输入击中的概率。没有入口，就没有大部分事故。

2) 收紧出手：它能用什么工具

工具权限比提示词更硬。能关就关，能拆就拆。

一个简单但有效的做法是“读写分离”：

读：让一个低权限的 reader 去逛论坛、读网页、做摘要
写：真正能执行动作的 agent 只接受结构化输入（最好来自你或你的系统）

你可以把 reader 当成过滤器。它不需要完美，但它能让很多“顺手就点了链接”的事故根本发生不了。

3) 把执行放进沙盒

如果你的 agent 必须执行工具（比如拉取资料、跑脚本），优先让工具在沙盒里跑：

文件系统默认不可见或只读
下载目录单独隔离
浏览器用独立 profile（别拿日常浏览器给它开车）

沙盒的目标不是“绝对安全”，而是把爆炸半径限制在一个可控范围。

4) 网关只在本地听，不要裸露到公网

很多“看起来是 prompt injection”的事故，最后都是网络暴露导致的：一个本来只该本机访问的控制面，被反向代理或端口转发暴露了出去。

最稳的原则是：默认只绑定 loopback，用 token/password 做鉴权；要远程访问就走专门的安全通道（比如 tailnet），别图省事开到公网。

5) 把日志当成敏感数据

本地 agent 往往会把会话、工具输出写在磁盘上。它们对“复盘”很有用，对“泄露”也很友好。

你至少要做到：

日志默认脱敏（不要把 token、密钥、路径完整写进去）
配置目录与凭证文件权限收紧
分享诊断信息时用更安全的摘要报告，而不是直接甩原始日志

6) 预演一次“出事怎么办”

真出事的时候你不会有时间冷静读文档。流程要提前写好：

先止血：停服务、关入口、禁工具
再旋转：网关 token、模型 key、渠道凭证
再审计：看最近会话里到底触发了哪些工具调用

这套动作不需要每天做，但你得知道在哪里做。

一个“安全默认”配置长什么样（示意）

下面只是示意，意图是“默认保守”。你可以按自己的环境改，但别反过来先开放再补安全。

val secureBaseline = """
{
  "gateway": {
    "bind": "loopback",
    "port": 18789,
    "auth": { "mode": "token", "token": "your-long-random-token" }
  },
  "channels": {
    "whatsapp": {
      "dmPolicy": "pairing",
      "groups": { "*": { "requireMention": true } }
    }
  },
  "agents": {
    "defaults": {
      "sandbox": { "mode": "all", "workspaceAccess": "none" }
    }
  }
}
""".trimIndent()

写在最后

我不觉得“让 agent 逛 Moltbook”是一件必须禁止的事。相反，它可能很有价值：你会看到真实的对抗、真实的治理、真实的产品演化。

但你得把它当成开放网络来对待。开放网络里不缺好人，也不缺坏人；更重要的是，它不缺“无意的危险输入”。

别把希望寄托在模型永远不会上当。把边界做硬，把权限收紧，把事故当作迟早会来的一次演练。这样你才能放心让它去看热闹。

参考链接

OpenClaw Gateway Security：https://docs.molt.bot/gateway/security