Gemini 3.1 Pro 的三档思考等级,你不一定需要开 HIGH
Gemini 3.1 Pro 这次更新里有一个变化相对低调,但对开发者来说很实用:在原来 LOW 和 HIGH 两档之间加了 MEDIUM。这个改动说小不小,因为之前很多人要么完全关掉推理链用最快速度,要么开最高档等半天,MEDIUM 正好填了一个空白。
三档具体是什么意思
thinking_level 参数控制模型在给出答案之前"思考"多少。技术上说,是控制模型生成内部推理链(thinking tokens)的数量上限。
LOW:推理 token 大约 200-500 个,基本相当于直接回答,不怎么停下来想。分类、翻译、简单问答用 LOW 就够了。速度最快,成本最低。
MEDIUM:推理 token 大约 2000-8000 个。模型会做一段链式思考,但不会无限延伸。这是 3.1 Pro 新加的档位,Vertex AI 文档把它定位为"在成本、性能和速度之间取得平衡"。日常代码审查、内容合成、有一定复杂度的推理任务用这档比较合适。
HIGH:推理 token 最高 32768 个,会触发 Deep Think Mini,模型会花更多时间做深度推理。基准测试里 ARC-AGI-2 77.1% 就是 HIGH 模式下跑出来的。适合科学计算、复杂数学、需要多步骤推理的硬题。速度最慢。
API 里怎么配置
在 Google Gemini API 或 Vertex AI 里,通过 ThinkingConfig 对象传入参数:
from google.generativeai import GenerativeModel
import google.generativeai as genai
model = genai.GenerativeModel("gemini-3.1-pro-preview")
response = model.generate_content(
"解释量子纠缠的基本原理",
generation_config={
"thinking_config": {
"thinking_level": "MEDIUM"
}
}
)
thinking_level 接受字符串值 "LOW"、"MEDIUM"、"HIGH"。
MEDIUM 省多少钱
有文章给出了一个估算:在生产环境下把默认的 HIGH 改成 MEDIUM,月度 API 账单大约能降 60-75%。这个数字取决于你的具体任务类型,但方向是对的——推理 token 也是按 token 计费的,HIGH 模式下内部推理链可能比最终输出长得多。
一个实际的例子:假设你用 Gemini 3.1 Pro 做一个代码审查 bot,每次请求输入 2000 token,HIGH 模式下内部推理链可能产生额外 10000-30000 个 token,这些都是要付钱的。MEDIUM 模式推理链只有 2000-8000 token,直接少了好几倍。如果任务不是特别复杂,输出质量差别不大,但成本差异很明显。
什么情况非得用 HIGH
坦白说,日常工作里真的需要 HIGH 模式的场景比较少。我整理了一下哪些情况值得开 HIGH:
需要严格数学证明或竞赛级别编程题时,HIGH 模式下 LiveCodeBench Pro 的 Elo 是 2887,比 GPT-5.2 的 2393 高不少,差距比较明显。
多步骤推理链很长的任务,比如从一堆相互矛盾的信息里推断出结论,这类任务推理 token 用够了才有用。
ARC-AGI 类型的逻辑图案推理,实测 HIGH 模式有效。
一般的内容写作、代码生成、问答,MEDIUM 就够了,LOW 有时候也行。
一个小问题
Gemini 3.1 Pro 在 Vertex AI 文档里注明"默认开启动态思考",也就是说即使你不手动设置 thinking_level,模型也会自行决定用多少推理。默认档位是什么我没找到官方的明确说法,有开发者在测试后认为默认接近 MEDIUM。不过这个没有官方确认,生产环境里建议显式传参,别依赖默认行为。
参考资料
- Gemini 3.1 Pro 官方文档,Vertex AI,Google Cloud:https://docs.cloud.google.com/vertex-ai/generative-ai/docs/models/gemini/3-1-pro
- Gemini 3.1 Pro Thinking Level 配置指南,LaoZhang AI Blog:https://blog.laozhang.ai/en/posts/gemini-3-1-pro-thinking-level
- Gemini 3.1 Pro Thinking Level 控制教程,Apiyi:https://help.apiyi.com/en/gemini-3-1-pro-preview-thinking-level-control-guide-en.html
- Gemini 3.1 Pro 定价与规格,llm-stats.com:https://llm-stats.com/models/gemini-3.1-pro-preview