Gemini 3.1 Pro 的三档思考等级，你不一定需要开 HIGH

Gemini 3.1 Pro 这次更新里有一个变化相对低调，但对开发者来说很实用：在原来 LOW 和 HIGH 两档之间加了 MEDIUM。这个改动说小不小，因为之前很多人要么完全关掉推理链用最快速度，要么开最高档等半天，MEDIUM 正好填了一个空白。

三档具体是什么意思

thinking_level 参数控制模型在给出答案之前"思考"多少。技术上说，是控制模型生成内部推理链（thinking tokens）的数量上限。

LOW：推理 token 大约 200-500 个，基本相当于直接回答，不怎么停下来想。分类、翻译、简单问答用 LOW 就够了。速度最快，成本最低。

MEDIUM：推理 token 大约 2000-8000 个。模型会做一段链式思考，但不会无限延伸。这是 3.1 Pro 新加的档位，Vertex AI 文档把它定位为"在成本、性能和速度之间取得平衡"。日常代码审查、内容合成、有一定复杂度的推理任务用这档比较合适。

HIGH：推理 token 最高 32768 个，会触发 Deep Think Mini，模型会花更多时间做深度推理。基准测试里 ARC-AGI-2 77.1% 就是 HIGH 模式下跑出来的。适合科学计算、复杂数学、需要多步骤推理的硬题。速度最慢。

API 里怎么配置

在 Google Gemini API 或 Vertex AI 里，通过 ThinkingConfig 对象传入参数：

from google.generativeai import GenerativeModel
import google.generativeai as genai

model = genai.GenerativeModel("gemini-3.1-pro-preview")
response = model.generate_content(
    "解释量子纠缠的基本原理",
    generation_config={
        "thinking_config": {
            "thinking_level": "MEDIUM"
        }
    }
)

thinking_level 接受字符串值 "LOW"、"MEDIUM"、"HIGH"。

MEDIUM 省多少钱

有文章给出了一个估算：在生产环境下把默认的 HIGH 改成 MEDIUM，月度 API 账单大约能降 60-75%。这个数字取决于你的具体任务类型，但方向是对的——推理 token 也是按 token 计费的，HIGH 模式下内部推理链可能比最终输出长得多。

一个实际的例子：假设你用 Gemini 3.1 Pro 做一个代码审查 bot，每次请求输入 2000 token，HIGH 模式下内部推理链可能产生额外 10000-30000 个 token，这些都是要付钱的。MEDIUM 模式推理链只有 2000-8000 token，直接少了好几倍。如果任务不是特别复杂，输出质量差别不大，但成本差异很明显。

什么情况非得用 HIGH

坦白说，日常工作里真的需要 HIGH 模式的场景比较少。我整理了一下哪些情况值得开 HIGH：

需要严格数学证明或竞赛级别编程题时，HIGH 模式下 LiveCodeBench Pro 的 Elo 是 2887，比 GPT-5.2 的 2393 高不少，差距比较明显。

多步骤推理链很长的任务，比如从一堆相互矛盾的信息里推断出结论，这类任务推理 token 用够了才有用。

ARC-AGI 类型的逻辑图案推理，实测 HIGH 模式有效。

一般的内容写作、代码生成、问答，MEDIUM 就够了，LOW 有时候也行。

一个小问题

Gemini 3.1 Pro 在 Vertex AI 文档里注明"默认开启动态思考"，也就是说即使你不手动设置 thinking_level，模型也会自行决定用多少推理。默认档位是什么我没找到官方的明确说法，有开发者在测试后认为默认接近 MEDIUM。不过这个没有官方确认，生产环境里建议显式传参，别依赖默认行为。

参考资料

Gemini 3.1 Pro 官方文档，Vertex AI，Google Cloud：https://docs.cloud.google.com/vertex-ai/generative-ai/docs/models/gemini/3-1-pro
Gemini 3.1 Pro Thinking Level 配置指南，LaoZhang AI Blog：https://blog.laozhang.ai/en/posts/gemini-3-1-pro-thinking-level
Gemini 3.1 Pro Thinking Level 控制教程，Apiyi：https://help.apiyi.com/en/gemini-3-1-pro-preview-thinking-level-control-guide-en.html
Gemini 3.1 Pro 定价与规格，llm-stats.com：https://llm-stats.com/models/gemini-3.1-pro-preview