AgentCore 支持 shell 执行:Claude Code 在 AWS 上的工程化进展

AgentCore 支持 shell 执行:Claude Code 在 AWS 上的工程化进展

近期,X 与 GitHub 上围绕 Claude Code + AWS Bedrock 的讨论出现了新的焦点。与此前集中在架构选型、配额治理和可观测性不同,这一轮讨论更关注智能体编程(Agentic Coding)在云端的工程化落地能力。

三个最受关注的进展分别是:AgentCore Runtime 新增 shell 命令执行、Bedrock Prompt 缓存正式 GA,以及 Claude Code 在 IDE 中的 Bedrock 后端集成。

AgentCore Runtime shell 命令执行

3 月 17 日,AWS 正式发布 InvokeAgentRuntimeCommand API,允许开发者在 AgentCore Runtime 的运行会话中直接执行 shell 命令。

解决的问题

AI Agent 在实际工作流中,往往需要穿插执行确定性操作:运行测试、安装依赖、执行 git 命令、调用 CLI 工具。此前,这类操作需要开发者在容器内自行实现命令调度、进程管理和输出捕获逻辑。InvokeAgentRuntimeCommand 将这一层能力下沉为平台级服务。

技术特性

  • 命令在 Agent 会话的同一容器和文件系统内执行
  • 输出通过 HTTP/2 实时流式返回
  • 支持并发调用,不阻塞 Agent 推理
  • 覆盖 14 个 AWS 区域(含亚太的东京、新加坡、悉尼、首尔、孟买)

对企业 Agent 架构的意义

这一能力的出现,使得 AWS 上的 AI Agent 可以在不依赖自定义命令执行层的情况下完成完整的开发闭环:代码生成 → 命令执行 → 结果反馈 → 迭代修正。

对于构建企业级代码审查、自动化测试、CI/CD 集成等系统的团队来说,这意味着更少的自定义基础设施代码,更标准化的 Agent 运行时行为。

Bedrock Prompt 缓存与 Claude Code 的成本优化

Bedrock 的 Prompt 缓存功能已正式 GA。对于 Claude Code 这类高频、长上下文的智能体编程场景,其成本影响值得认真评估。

缓存机制

当连续调用共享相同的 prompt 前缀时,Bedrock 在服务端缓存该部分内容,后续命中缓存的调用按缓存读取价格计费。以 Claude Opus 4.6 为例:

计费类型 价格(每百万 token)
标准输入 $5.00
缓存读取 $0.50
标准输出 $25.00

缓存 TTL 为 5 分钟。在 Claude Code 的典型使用模式下(同一项目连续操作),项目上下文的复用率很高,缓存命中率通常在 60-80%。

与 Batch API 叠加

对于非实时场景(如批量代码审查、测试用例生成),Bedrock Batch API 可提供标准价格 50% 的折扣。与 Prompt 缓存叠加后,在高频使用场景下的综合 token 成本可以得到有效控制。

容量规划提醒

需要注意的是,缓存写入 token 也会计入 TPM 配额(权重为 1.25x)。在做容量规划时,不能只看账单侧的缓存折扣,还需要将缓存写入对配额的影响纳入计算。

Claude Code 的 Bedrock 后端集成

Claude Code 现已支持以 AWS Bedrock 作为模型后端,在终端、VS Code 和 JetBrains 中均可使用。

企业价值

  • 数据不离开 AWS 环境,满足 VPC 级隔离要求
  • 权限通过 IAM 管控,可精细到角色和策略级别
  • 费用纳入 AWS 统一账单,便于成本归集
  • 支持 SSO、IAM Identity Center 等企业级认证方式

与 AgentCore MCP Server 联动

AWS 还提供了 AgentCore MCP Server,可作为 Claude Code 的外部工具接入点,让 Agent 在编码过程中直接调用 AWS 资源和服务。这进一步扩展了 Agent 的操作能力边界。

国内团队的现实限制

区域覆盖

AgentCore Runtime 的 shell 命令执行目前覆盖 14 个 AWS 区域,不含中国区。如果研发团队的主要环境在国内,完整使用这套能力存在区域限制。

网络与交互体验

Claude Code 的操作是实时交互式的。国内直连海外 AWS 区域的延迟,会直接影响 Agent 的操作节奏和开发者体验。

账号与模型访问

海外 AWS 账号的注册维护、Bedrock 模型的访问权限申请,对国内团队仍然构成开通门槛。

成本核算

Claude Opus 4.6 的输出 token 定价为 $25/百万。对于高频 Agent 编码场景,即使输入侧有 Prompt 缓存优化,输出侧的成本仍需纳入预算。

结论

从 AgentCore shell 执行,到 Prompt 缓存 GA,再到 Claude Code 的 Bedrock 集成,AWS 正在系统性地构建 Agentic Coding 所需的云端基础设施。

这种基础设施的补齐,比模型本身的迭代更值得企业架构团队关注。因为对于企业来说,模型能力是可替换的(今天用 Claude 4.6,明天可能换 GPT-5.4),但基础设施的选型会长期影响系统架构和运维成本。

参考链接:

← 返回博客列表