Gemini 3.1 Pro 定价拆解：用它开发，到底花多少钱

Gemini 3.1 Pro 目前是 Preview 阶段，正式定价已经公布：输入 $2/百万 token，输出 $12/百万 token，缓存读取 $0.20/百万 token。和同级别的模型比，这个价格是偏低的——Claude Opus 4.6 输入 $15/百万 token，输出 $75/百万 token，直接差了 6 倍多。

不过价格低这件事在这里稍微复杂一点。Gemini 3.1 Pro 的推理 token 也是要算钱的，而且你可能没意识到推理 token 在 HIGH 模式下有多"贵"。

基础定价

类型	价格
输入 token	$2.00 / 百万
输出 token	$12.00 / 百万
缓存读取	$0.20 / 百万

这个定价在 Google AI Studio、Gemini API 和 Vertex AI 上是一致的。

推理 token 的隐性成本

这是容易踩坑的地方。Gemini 3.1 Pro 的思考过程（thinking tokens）也是按输出 token 计费的，不是免费的。HIGH 模式下单次请求的推理 token 最多可以到 32768 个，按 $12/百万 token 算：

32768 推理 token = 约 $0.000393/次请求
如果每天跑 10000 次请求，光推理 token 就是约 $3.93/天

单看一次不多，但如果你在跑高并发的生产流量，这个数字会积累得很快。MEDIUM 模式推理 token 上限约 8000 个，同样计算：10000 次请求推理 token 约 $0.96/天。差了约 4 倍。

Context Caching 的实际价值

Context Caching（上下文缓存）是 Gemini API 的一个功能：把一段固定的上下文（比如系统 prompt、长文档、代码库）缓存起来，后续请求直接读缓存，不用重复付输入费。

缓存读取只需要 $0.20/百万 token，是正常输入的 1/10。

适合用缓存的场景：有一个很长的固定 system prompt（比如公司规范文档、产品说明书），每次请求都要带着它。用 Context Caching 之后，这部分只在第一次付正常输入价格，后续只付 $0.20/百万 token。

不适合用缓存的场景：每次请求上下文都不一样，或者会话轮次之间的内容变化很大，缓存命中率会很低，意义不大。

和 Claude Opus 4.6 的实际成本对比

假设一个典型的工程师助手场景：每次请求输入 2000 token，输出 500 token，使用 MEDIUM 思考等级（内部推理 token 约 5000 个），每天 1000 次请求。

Gemini 3.1 Pro：

输入：2000 × 1000 = 200万 token = $4.00
推理：5000 × 1000 = 500万 token = $60.00（按输出价格计）
输出：500 × 1000 = 50万 token = $6.00
合计约 $70/天

等等，这算完才发现推理 token 是大头。如果改 LOW 模式（推理 500 token）：

推理：500 × 1000 = 50万 token = $6.00
合计约 $16/天

Claude Opus 4.6（不带推理模式）：

输入：$15 × 2 = $30.00
输出：$75 × 0.5 = $37.50
合计约 $67.50/天

结论是：Gemini 3.1 Pro 用 LOW 或 MEDIUM 确实便宜很多，但如果默认开 HIGH，成本会因为推理 token 上去一大截。这个要在实际使用前想清楚。

免费额度

Google AI Studio 有免费配额，目前 Gemini 3.1 Pro 免费档的限制大约是：

每分钟 5-15 次请求（RPM）
每天 20-100 次请求（RPD）

这个只够测试用，上了生产要切付费 API。

Preview 阶段不支持 Batch Prediction，如果你有大批量离线处理的需求，要等 GA 之后看看有没有批量折扣。

参考资料

Gemini API 定价与配额完整指南，AI Free API：https://www.aifreeapi.com/en/posts/gemini-api-pricing-and-quotas
Gemini 3.1 Pro Preview 定价与规格，CloudPrice：https://cloudprice.net/models/vertex_ai%2Fgemini-3.1-pro-preview
Gemini API 计费文档，Google AI for Developers：https://ai.google.dev/gemini-api/docs/billing
Gemini 3.1 Pro on Vertex AI，Google Cloud 官方文档：https://docs.cloud.google.com/vertex-ai/generative-ai/docs/models/gemini/3-1-pro