AI 自己写代码、自己跑测试,AWS 这次把事情做大了
最近两天,X 和 GitHub 上关于 Claude Code + AWS Bedrock 的讨论又热了起来,而且讨论的重心和之前完全不同。
之前大家聊的是"直连 Anthropic 还是走 AWS""认证会不会出问题""配额怎么算"。这回呢?话题变成了:AI 现在能不能自己写代码、自己跑测试、自己看结果,然后自己改?
答案是,可以了。至少在 AWS 的环境里,这件事正在变成现实。
AWS 开放了一个很关键的能力
3 月 17 日,AWS 宣布 Bedrock AgentCore Runtime 支持 shell 命令执行。
翻译成人话就是:以前 AI Agent 只能"想"和"写",现在它还能自己"动手"了。
你可以让它在云端直接跑测试、装依赖、执行 git 操作。这些命令在 Agent 自己的运行环境里执行,输出实时返回,不需要开发者额外写调度代码。
这意味着,AI 编程正在从"帮你补代码",变成"帮你干活"。
Claude Code 是什么
Claude Code 是 Anthropic 推出的智能体编程工具。你在终端或者 VS Code 里给它一个任务,它能自己拆步骤、读文件、写代码、跑命令、看报错、再改。
现在它可以直接接入 AWS Bedrock 作为后端。好处是:数据不出 AWS 环境,权限走 IAM,费用走统一账单。
而且 AWS 新推出的 Prompt 缓存功能,可以让连续工作时的重复上下文只收十分之一的价格。这对 Claude Code 这种"在同一个项目里连续干活几小时"的场景来说非常划算。
和 GPT-5.4 的差距在哪
很多人会问,Claude 4.6 和 GPT-5.4 比,到底谁更强。
客观来说,两家在模型能力上已经非常接近。单轮问答、代码生成、推理分析,两边各有擅长,很难说谁碾压谁。
真正拉开差距的,是背后的基础设施。
Claude 4.6 目前在 AWS 生态里的集成深度更强:AgentCore 提供了 Agent 运行时、shell 执行、MCP 服务器;Bedrock 提供了统一的权限、监控、缓存和计费体系。这套东西合在一起,让 Claude 在企业场景里的落地效率更高。
而 GPT-5.4 在 Azure OpenAI 上也有自己的优势,尤其是和微软生态的集成。但在"智能体自主编程"这个方向上,AWS + Claude 这波走得更快。
国内用户能不能用
老规矩,说实话。
AWS 海外账号注册、Bedrock 模型权限申请,这些对国内个人开发者来说依然有门槛。AgentCore 目前支持 14 个区域,包括亚太的东京和新加坡,但没有中国区。国内直连海外的网络延迟也会影响 Claude Code 的实时交互体验。
所以对于大多数国内用户来说,这套东西目前更适合关注和学习,直接使用的条件还不太成熟。
不过值得关注的是,Prompt 缓存和 Agent 工作流设计的方法论是通用的。即使你用的不是 AWS,这些思路也可以应用到其他平台和场景里。
这波热潮的信号
这两天 X 和 GitHub 上的讨论,传递了一个很明确的信号:AI 编程正在从"辅助工具"变成"自主工作流"。
当 AI 不只是帮你写代码,而是能自己跑测试、自己看结果、自己改 bug 的时候,开发者和 AI 的关系会发生根本性的变化。
这件事,可能比任何一次模型发布都更值得关注。
参考链接:
- https://aws.amazon.com/about-aws/whats-new/2026/03/bedrock-agentcore-runtime-shell-command/
- https://aws.amazon.com/blogs/machine-learning/supercharge-your-development-with-claude-code-and-amazon-bedrock-prompt-caching
- https://code.claude.com/docs/en/amazon-bedrock
- https://github.com/aws-samples/anthropic-on-aws