谷歌凌晨放出四款 Gemma 4,整个 AI 圈一下子吵起来了

谷歌凌晨放出四款 Gemma 4,整个 AI 圈一下子吵起来了

凌晨那一下,很多做 AI 的人基本都被炸醒了。

谷歌这次放出来的,不只是一个新模型,而是四款 Gemma 4 一起上。大模型、小模型、端侧、本地部署、长上下文、函数调用,几乎把开发者最敏感的点一次说全了。

所以消息一出来,整个 AI 圈很快就热了起来。
真正让人上头的,也不只是“跑分又涨了”,而是很多人突然意识到一件事:谷歌这次像是真的要把开源模型这条线狠狠干下去了。

别被 31B 带偏了,真正炸场的不止这个

如果只看表面,最容易被转发的当然是那几个数字。

比如官方给出的说法是,31B Dense 已经能冲到开放模型前列,26B MoE 只激活 3.8B 参数,主打更快的推理速度;小模型 E2BE4B 又能直接往手机和边缘设备上走。这个组合很容易刺激讨论,因为它不是单点突破,更像是一次全线压上。

但我看下来,真正把情绪拉起来的,其实不是单一指标,而是几件事一起叠上来了。

第一件事,是参数效率。
这几年大家已经被“更大参数”教育得有点麻木了,所以当谷歌把重点放在“更少参数也能打”上时,讨论立刻就变了味。很多人不是单纯惊叹跑分,而是在重新算账:如果 31B 真的能把效果做进这个区间,那本地部署、私有化交付和离线工作流的成本,可能都得重估。

第二件事,是 Apache 2.0
这点比很多人想的还重要。之前不少团队看开源模型,第一反应不是“效果怎么样”,而是“法务能不能过”。这次谷歌把许可证问题讲得非常直接,等于把很多企业落地前最现实的一道门槛提前拆掉了。对开发者来说,这种改变比多涨几个 benchmark 分数更有体感。

第三件事,是谷歌终于不再只讲“模型”,而开始讲“怎么用起来”。
官方博客和开发者博客都在反复强调 agent、工具调用、JSON 输出、端侧运行、离线代码生成。这不是研究团队内部自嗨的发版方式,更像是在对开发者说:你拿去做应用,现在就行。

这事为什么一出来就炸了

从公开讨论的方向看,这轮热议并不复杂,基本都围着 31BApache 2.0on-device agent 这几个词在转。

前两个很好理解,一个对应“性能/成本比”,一个对应“能不能放心商用”。第三个点更有意思。

过去大家谈开源模型,常常默认它们属于服务器、工作站,或者至少属于一台像样的 GPU 机器。Gemma 4 这次明显想改这个认知。谷歌不只是说模型能跑,还把手机、Raspberry PiJetson Orin Nano 这些设备写进了发布叙事里。这个动作很聪明,因为它把讨论从“谁的模型更强”,拉到了“谁更接近真实产品形态”。

说得更直白一点,Gemma 4 这次引发的热度,并不是因为谷歌第一次做开源,而是因为它这次把“开源模型”从一个研究话题,往“开发工具”和“产品底座”上实打实推了一步。

真正懂的人,已经在看后手了

这次我觉得最值得看的,不只是官方仓库本身,而是谷歌围着 Gemma 4 摆出来的整条开发链路。

一边是官方仓库继续作为入口,承接模型和文档关注;另一边,相关项目已经在把“本地 Agent 技能”往可试用、可分享、可讨论的方向推进,连专门的交流区都已经铺出来了。这说明谷歌想要的不是“模型发布完就结束”,而是希望社区围着它继续长内容、长插件、长工作流。

这点很关键。

开源模型真正的护城河,通常不是权重文件本身,而是谁能更快把工具链、样例和社区二次开发一起带起来。

Gemma 4 这次上线时,官方已经把从模型获取、推理到端侧运行的入口一起摆出来了。你可以把它理解成一件事:谷歌不想只赢论文和榜单,它想赢“你明天就把它接进项目”的那一步。

表面上在发模型,实际上在抢入口

我更在意的,其实不是 Gemma 4 单次发版有多猛,而是它背后的路径已经越来越清楚了。

谷歌现在显然在走两条线:

  • 上面是 Gemini,继续做闭源旗舰和 API 生意
  • 下面是 Gemma,负责把开发者生态、本地部署和开源入口抓住

这两条线不是互相打架,反而很互补。

闭源模型负责把天花板抬高,开源模型负责把地板铺开。
一个赚收入,一个抢入口。
如果这套打法跑通,谷歌后面在开发工具、移动端 AI、企业私有化场景里的话语权,都会比现在更强。

所以这次热议的本质,并不只是“谷歌又发了个很强的开源模型”。
更像是很多人突然意识到,谷歌开始用更完整的方式做开源了,而且动作比过去坚决。

先别急着封神,后面还有硬仗

当然,热闹归热闹,后面还是要看落地。

我觉得后面就看两件事。

一件是,31B26B MoE 的口碑,能不能从榜单延续到真实开发任务里。
跑分能把注意力吸过来,但代码、Agent、复杂工作流里的稳定性,才决定它会不会长期留下来。

另一件是,端侧和社区这两条线能不能一起跑起来。
如果 E2BE4B 最后能在移动端和边缘设备上形成一批可复用应用,同时相关适配仓库、推理框架、演示项目、量化版本和微调脚本又迅速铺开,那 Gemma 4 的意义就不只是“一个强模型”,而是“一个能进产品里的开源模型家族”。

把话说回来

Gemma 4 这次让人有感觉,不是因为谷歌终于会做标题了,而是因为它把一件过去说得不够完整的事,突然说完整了:

模型要强,当然重要。
但真正能让开发者起身去试的,还是许可证够不够松、工具链够不够全、设备门槛够不够低、接进工作流时麻不麻烦。

从这个角度看,Gemma 4 更像是谷歌对开源 AI 市场的一次重新下注。
而这轮热议和随后的开发动作,说白了都在证明一件事:大家这次讨论的,已经不只是模型本身,而是谁更接近下一轮开源生态的入口。

参考链接

← 返回博客列表