Claude 100万上下文:向量数据库要退休了吗?

Claude 100万上下文:向量数据库要退休了吗?

Anthropic 刚在 X 上发了条推,Claude 现在支持 100万 Token(1M Context Window) 上下文了。这消息在圈子里传得挺快,GitHub 上相关讨论也不少。

链接在这:https://x.com/claudeai/status/2032509548297343196

这事儿到底是个单纯的技术升级,还是真能改变开发习惯?

100万 Token 到底多大

100万 Token 差不多能装下整本《红楼梦》,或者几十万行的代码库,甚至几百份合同。以前这些东西得切碎了、做索引、再检索(RAG)才能喂给模型,现在能直接整吞。

大家都在聊什么

我看了一圈 X 和 GitHub 上的反馈,焦点主要在这么几块:

RAG 还有没有用?

有人觉得既然能全记住,谁还费劲搞向量数据库?其实没那么简单。

100万 Token 每次跑一遍,那成本和延迟谁都受不了。现在的 API 计费模式下,跑一次全量上下文可能就是几美元甚至几十美元。所以 RAG 以后可能更多是做“初筛”,把最相关的几十万 Token 挑出来给模型,而不是完全被替代。这就好比你虽然能背下整本书,但考试时还是得先翻目录找重点。

“大海捞针”稳不稳?

之前 Gemini 1.5 Pro 也有这能力,但有时候中间的信息会“漏”掉(Lost in the Middle)。Claude 这次优化得怎么样,还得看实测。GitHub 上已经有人在跑压力测试了,初步反馈是 Claude 在长文本逻辑推理上还挺稳,尤其是在代码理解这块,似乎比竞品更细腻一些。

开发方式得变

以前我们天天琢磨怎么写 Prompt 引导逻辑(Chain-of-Thought),现在可能更多得想怎么组织这一大堆上下文素材。这叫 Context Engineering。

怎么上手试?

想试用的话,除了等官方 API 全量开放,也可以看看聚合平台。

现在的模型太多了,Gemini 1.5、Claude 3、GPT-4,每家都有长文本版。挨个去注册账号、绑卡、申请 Key 挺折腾的。像 147AI (https://147ai.com) 这类服务把各家的模型接口都整一起了,OpenAI、Claude、Gemini 都有。想对比下不同长文本模型的效果,用这种聚合接口切着测会方便点,省得挨个去搞账号配环境。

最后

模型越来越能“读”了,而不只是“搜”。虽然现在用起来还贵、还慢,但既然路通了,以后能玩的花样肯定更多。以前不敢想的全库代码重构、全书深度分析,现在也就是一个 API call 的事儿。


参考链接:

  1. Anthropic X Announcement: https://x.com/claudeai/status/2032509548297343196
  2. 147AI: https://147ai.com
← 返回博客列表