AgentCore 支持 shell 执行：Claude Code 在 AWS 上的工程化进展

近期，X 与 GitHub 上围绕 Claude Code + AWS Bedrock 的讨论出现了新的焦点。与此前集中在架构选型、配额治理和可观测性不同，这一轮讨论更关注智能体编程（Agentic Coding）在云端的工程化落地能力。

三个最受关注的进展分别是：AgentCore Runtime 新增 shell 命令执行、Bedrock Prompt 缓存正式 GA，以及 Claude Code 在 IDE 中的 Bedrock 后端集成。

AgentCore Runtime shell 命令执行

3 月 17 日，AWS 正式发布 InvokeAgentRuntimeCommand API，允许开发者在 AgentCore Runtime 的运行会话中直接执行 shell 命令。

AI Agent 在实际工作流中，往往需要穿插执行确定性操作：运行测试、安装依赖、执行 git 命令、调用 CLI 工具。此前，这类操作需要开发者在容器内自行实现命令调度、进程管理和输出捕获逻辑。InvokeAgentRuntimeCommand 将这一层能力下沉为平台级服务。

这一能力的出现，使得 AWS 上的 AI Agent 可以在不依赖自定义命令执行层的情况下完成完整的开发闭环：代码生成 → 命令执行 → 结果反馈 → 迭代修正。

对于构建企业级代码审查、自动化测试、CI/CD 集成等系统的团队来说，这意味着更少的自定义基础设施代码，更标准化的 Agent 运行时行为。

Bedrock 的 Prompt 缓存功能已正式 GA。对于 Claude Code 这类高频、长上下文的智能体编程场景，其成本影响值得认真评估。

当连续调用共享相同的 prompt 前缀时，Bedrock 在服务端缓存该部分内容，后续命中缓存的调用按缓存读取价格计费。以 Claude Opus 4.6 为例：

缓存 TTL 为 5 分钟。在 Claude Code 的典型使用模式下（同一项目连续操作），项目上下文的复用率很高，缓存命中率通常在 60-80%。

对于非实时场景（如批量代码审查、测试用例生成），Bedrock Batch API 可提供标准价格 50% 的折扣。与 Prompt 缓存叠加后，在高频使用场景下的综合 token 成本可以得到有效控制。

需要注意的是，缓存写入 token 也会计入 TPM 配额（权重为 1.25x）。在做容量规划时，不能只看账单侧的缓存折扣，还需要将缓存写入对配额的影响纳入计算。

Claude Code 现已支持以 AWS Bedrock 作为模型后端，在终端、VS Code 和 JetBrains 中均可使用。

AWS 还提供了 AgentCore MCP Server，可作为 Claude Code 的外部工具接入点，让 Agent 在编码过程中直接调用 AWS 资源和服务。这进一步扩展了 Agent 的操作能力边界。

AgentCore Runtime 的 shell 命令执行目前覆盖 14 个 AWS 区域，不含中国区。如果研发团队的主要环境在国内，完整使用这套能力存在区域限制。

Claude Code 的操作是实时交互式的。国内直连海外 AWS 区域的延迟，会直接影响 Agent 的操作节奏和开发者体验。

海外 AWS 账号的注册维护、Bedrock 模型的访问权限申请，对国内团队仍然构成开通门槛。

Claude Opus 4.6 的输出 token 定价为 $25/百万。对于高频 Agent 编码场景，即使输入侧有 Prompt 缓存优化，输出侧的成本仍需纳入预算。

从 AgentCore shell 执行，到 Prompt 缓存 GA，再到 Claude Code 的 Bedrock 集成，AWS 正在系统性地构建 Agentic Coding 所需的云端基础设施。

这种基础设施的补齐，比模型本身的迭代更值得企业架构团队关注。因为对于企业来说，模型能力是可替换的（今天用 Claude 4.6，明天可能换 GPT-5.4），但基础设施的选型会长期影响系统架构和运维成本。

参考链接：