谷歌凌晨放出四款 Gemma 4，整个 AI 圈一下子吵起来了

凌晨那一下，很多做 AI 的人基本都被炸醒了。

谷歌这次放出来的，不只是一个新模型，而是四款 Gemma 4 一起上。大模型、小模型、端侧、本地部署、长上下文、函数调用，几乎把开发者最敏感的点一次说全了。

所以消息一出来，整个 AI 圈很快就热了起来。
真正让人上头的，也不只是“跑分又涨了”，而是很多人突然意识到一件事：谷歌这次像是真的要把开源模型这条线狠狠干下去了。

别被 31B 带偏了，真正炸场的不止这个

如果只看表面，最容易被转发的当然是那几个数字。

比如官方给出的说法是，31B Dense 已经能冲到开放模型前列，26B MoE 只激活 3.8B 参数，主打更快的推理速度；小模型 E2B、E4B 又能直接往手机和边缘设备上走。这个组合很容易刺激讨论，因为它不是单点突破，更像是一次全线压上。

但我看下来，真正把情绪拉起来的，其实不是单一指标，而是几件事一起叠上来了。

第一件事，是参数效率。
这几年大家已经被“更大参数”教育得有点麻木了，所以当谷歌把重点放在“更少参数也能打”上时，讨论立刻就变了味。很多人不是单纯惊叹跑分，而是在重新算账：如果 31B 真的能把效果做进这个区间，那本地部署、私有化交付和离线工作流的成本，可能都得重估。

第二件事，是 Apache 2.0。
这点比很多人想的还重要。之前不少团队看开源模型，第一反应不是“效果怎么样”，而是“法务能不能过”。这次谷歌把许可证问题讲得非常直接，等于把很多企业落地前最现实的一道门槛提前拆掉了。对开发者来说，这种改变比多涨几个 benchmark 分数更有体感。

第三件事，是谷歌终于不再只讲“模型”，而开始讲“怎么用起来”。
官方博客和开发者博客都在反复强调 agent、工具调用、JSON 输出、端侧运行、离线代码生成。这不是研究团队内部自嗨的发版方式，更像是在对开发者说：你拿去做应用，现在就行。

这事为什么一出来就炸了

从公开讨论的方向看，这轮热议并不复杂，基本都围着 31B、Apache 2.0 和 on-device agent 这几个词在转。

前两个很好理解，一个对应“性能/成本比”，一个对应“能不能放心商用”。第三个点更有意思。

过去大家谈开源模型，常常默认它们属于服务器、工作站，或者至少属于一台像样的 GPU 机器。Gemma 4 这次明显想改这个认知。谷歌不只是说模型能跑，还把手机、Raspberry Pi、Jetson Orin Nano 这些设备写进了发布叙事里。这个动作很聪明，因为它把讨论从“谁的模型更强”，拉到了“谁更接近真实产品形态”。

说得更直白一点，Gemma 4 这次引发的热度，并不是因为谷歌第一次做开源，而是因为它这次把“开源模型”从一个研究话题，往“开发工具”和“产品底座”上实打实推了一步。

真正懂的人，已经在看后手了

这次我觉得最值得看的，不只是官方仓库本身，而是谷歌围着 Gemma 4 摆出来的整条开发链路。

一边是官方仓库继续作为入口，承接模型和文档关注；另一边，相关项目已经在把“本地 Agent 技能”往可试用、可分享、可讨论的方向推进，连专门的交流区都已经铺出来了。这说明谷歌想要的不是“模型发布完就结束”，而是希望社区围着它继续长内容、长插件、长工作流。

这点很关键。

开源模型真正的护城河，通常不是权重文件本身，而是谁能更快把工具链、样例和社区二次开发一起带起来。

而 Gemma 4 这次上线时，官方已经把从模型获取、推理到端侧运行的入口一起摆出来了。你可以把它理解成一件事：谷歌不想只赢论文和榜单，它想赢“你明天就把它接进项目”的那一步。

表面上在发模型，实际上在抢入口

我更在意的，其实不是 Gemma 4 单次发版有多猛，而是它背后的路径已经越来越清楚了。

谷歌现在显然在走两条线：

上面是 Gemini，继续做闭源旗舰和 API 生意
下面是 Gemma，负责把开发者生态、本地部署和开源入口抓住

这两条线不是互相打架，反而很互补。

闭源模型负责把天花板抬高，开源模型负责把地板铺开。
一个赚收入，一个抢入口。
如果这套打法跑通，谷歌后面在开发工具、移动端 AI、企业私有化场景里的话语权，都会比现在更强。

所以这次热议的本质，并不只是“谷歌又发了个很强的开源模型”。
更像是很多人突然意识到，谷歌开始用更完整的方式做开源了，而且动作比过去坚决。

先别急着封神，后面还有硬仗

当然，热闹归热闹，后面还是要看落地。

我觉得后面就看两件事。

一件是，31B 和 26B MoE 的口碑，能不能从榜单延续到真实开发任务里。
跑分能把注意力吸过来，但代码、Agent、复杂工作流里的稳定性，才决定它会不会长期留下来。

另一件是，端侧和社区这两条线能不能一起跑起来。
如果 E2B、E4B 最后能在移动端和边缘设备上形成一批可复用应用，同时相关适配仓库、推理框架、演示项目、量化版本和微调脚本又迅速铺开，那 Gemma 4 的意义就不只是“一个强模型”，而是“一个能进产品里的开源模型家族”。

把话说回来

Gemma 4 这次让人有感觉，不是因为谷歌终于会做标题了，而是因为它把一件过去说得不够完整的事，突然说完整了：

模型要强，当然重要。
但真正能让开发者起身去试的，还是许可证够不够松、工具链够不够全、设备门槛够不够低、接进工作流时麻不麻烦。

从这个角度看，Gemma 4 更像是谷歌对开源 AI 市场的一次重新下注。
而这轮热议和随后的开发动作，说白了都在证明一件事：大家这次讨论的，已经不只是模型本身，而是谁更接近下一轮开源生态的入口。

参考链接

官方发布: https://blog.google/innovation-and-ai/technology/developers-tools/gemma-4/
Google Developers Blog: https://developers.googleblog.com/bring-state-of-the-art-agentic-skills-to-the-edge-with-gemma-4/
GitHub 官方仓库 google-deepmind/gemma: https://github.com/google-deepmind/gemma
GitHub Discussions Agent Skills: https://github.com/google-ai-edge/gallery/discussions/categories/skills
写作风格参考文章: https://mp.weixin.qq.com/s/H8Nnk6HEKlwDREmxdjsXSg