Claude 100万上下文：向量数据库要退休了吗？

Anthropic 刚在 X 上发了条推，Claude 现在支持 100万 Token（1M Context Window） 上下文了。这消息在圈子里传得挺快，GitHub 上相关讨论也不少。

链接在这：https://x.com/claudeai/status/2032509548297343196

这事儿到底是个单纯的技术升级，还是真能改变开发习惯？

100万 Token 到底多大

100万 Token 差不多能装下整本《红楼梦》，或者几十万行的代码库，甚至几百份合同。以前这些东西得切碎了、做索引、再检索（RAG）才能喂给模型，现在能直接整吞。

大家都在聊什么

我看了一圈 X 和 GitHub 上的反馈，焦点主要在这么几块：

RAG 还有没有用？

有人觉得既然能全记住，谁还费劲搞向量数据库？其实没那么简单。

100万 Token 每次跑一遍，那成本和延迟谁都受不了。现在的 API 计费模式下，跑一次全量上下文可能就是几美元甚至几十美元。所以 RAG 以后可能更多是做“初筛”，把最相关的几十万 Token 挑出来给模型，而不是完全被替代。这就好比你虽然能背下整本书，但考试时还是得先翻目录找重点。

“大海捞针”稳不稳？

之前 Gemini 1.5 Pro 也有这能力，但有时候中间的信息会“漏”掉（Lost in the Middle）。Claude 这次优化得怎么样，还得看实测。GitHub 上已经有人在跑压力测试了，初步反馈是 Claude 在长文本逻辑推理上还挺稳，尤其是在代码理解这块，似乎比竞品更细腻一些。

开发方式得变

以前我们天天琢磨怎么写 Prompt 引导逻辑（Chain-of-Thought），现在可能更多得想怎么组织这一大堆上下文素材。这叫 Context Engineering。

怎么上手试？

想试用的话，除了等官方 API 全量开放，也可以看看聚合平台。

现在的模型太多了，Gemini 1.5、Claude 3、GPT-4，每家都有长文本版。挨个去注册账号、绑卡、申请 Key 挺折腾的。像 147AI (https://147ai.com) 这类服务把各家的模型接口都整一起了，OpenAI、Claude、Gemini 都有。想对比下不同长文本模型的效果，用这种聚合接口切着测会方便点，省得挨个去搞账号配环境。

最后

模型越来越能“读”了，而不只是“搜”。虽然现在用起来还贵、还慢，但既然路通了，以后能玩的花样肯定更多。以前不敢想的全库代码重构、全书深度分析，现在也就是一个 API call 的事儿。

参考链接：

Anthropic X Announcement: https://x.com/claudeai/status/2032509548297343196
147AI: https://147ai.com