AI 自己写代码、自己跑测试，AWS 这次把事情做大了

最近两天，X 和 GitHub 上关于 Claude Code + AWS Bedrock 的讨论又热了起来，而且讨论的重心和之前完全不同。

之前大家聊的是"直连 Anthropic 还是走 AWS""认证会不会出问题""配额怎么算"。这回呢？话题变成了：AI 现在能不能自己写代码、自己跑测试、自己看结果，然后自己改？

答案是，可以了。至少在 AWS 的环境里，这件事正在变成现实。

AWS 开放了一个很关键的能力

3 月 17 日，AWS 宣布 Bedrock AgentCore Runtime 支持 shell 命令执行。

翻译成人话就是：以前 AI Agent 只能"想"和"写"，现在它还能自己"动手"了。

你可以让它在云端直接跑测试、装依赖、执行 git 操作。这些命令在 Agent 自己的运行环境里执行，输出实时返回，不需要开发者额外写调度代码。

这意味着，AI 编程正在从"帮你补代码"，变成"帮你干活"。

Claude Code 是 Anthropic 推出的智能体编程工具。你在终端或者 VS Code 里给它一个任务，它能自己拆步骤、读文件、写代码、跑命令、看报错、再改。

现在它可以直接接入 AWS Bedrock 作为后端。好处是：数据不出 AWS 环境，权限走 IAM，费用走统一账单。

而且 AWS 新推出的 Prompt 缓存功能，可以让连续工作时的重复上下文只收十分之一的价格。这对 Claude Code 这种"在同一个项目里连续干活几小时"的场景来说非常划算。

很多人会问，Claude 4.6 和 GPT-5.4 比，到底谁更强。

客观来说，两家在模型能力上已经非常接近。单轮问答、代码生成、推理分析，两边各有擅长，很难说谁碾压谁。

真正拉开差距的，是背后的基础设施。

Claude 4.6 目前在 AWS 生态里的集成深度更强：AgentCore 提供了 Agent 运行时、shell 执行、MCP 服务器；Bedrock 提供了统一的权限、监控、缓存和计费体系。这套东西合在一起，让 Claude 在企业场景里的落地效率更高。

而 GPT-5.4 在 Azure OpenAI 上也有自己的优势，尤其是和微软生态的集成。但在"智能体自主编程"这个方向上，AWS + Claude 这波走得更快。

老规矩，说实话。

AWS 海外账号注册、Bedrock 模型权限申请，这些对国内个人开发者来说依然有门槛。AgentCore 目前支持 14 个区域，包括亚太的东京和新加坡，但没有中国区。国内直连海外的网络延迟也会影响 Claude Code 的实时交互体验。

所以对于大多数国内用户来说，这套东西目前更适合关注和学习，直接使用的条件还不太成熟。

不过值得关注的是，Prompt 缓存和 Agent 工作流设计的方法论是通用的。即使你用的不是 AWS，这些思路也可以应用到其他平台和场景里。

这两天 X 和 GitHub 上的讨论，传递了一个很明确的信号：AI 编程正在从"辅助工具"变成"自主工作流"。

当 AI 不只是帮你写代码，而是能自己跑测试、自己看结果、自己改 bug 的时候，开发者和 AI 的关系会发生根本性的变化。

这件事，可能比任何一次模型发布都更值得关注。

参考链接：