游侠网云服务,免实名免备案服务器 游侠云域名,免实名免备案域名

统一声明:

1.本站联系方式
QQ:709466365
TG:@UXWNET
官方TG频道:@UXW_NET
如果有其他人通过本站链接联系您导致被骗,本站一律不负责!

2.需要付费搭建请联系站长QQ:709466365 TG:@UXWNET
3.免实名域名注册购买- 游侠云域名
4.免实名国外服务器购买- 游侠网云服务

2026年4月3日,谷歌正式发布 Gemma 4,称”这是其迄今为止最智能的开放模型系列”。该系列面向复杂推理与智能体工作流设计,采用商业许可的 Apache 2.0 许可证开源。

Gemma 4 发布

Gemma 4 提供四种规格:Effective 2B(E2B)、Effective 4B(E4B)、26B 混合专家模型(MoE)和 31B 稠密模型(Dense)。

端侧部署:手机离线跑 Agent

在端侧,E2B 和 E4B 模型针对移动和物联网设备优化,推理时分别激活约 20 亿和 40 亿参数,以降低内存和电量消耗。据介绍,这两个模型已与谷歌 Pixel 团队、高通和联发科等硬件厂商合作,可在手机、Raspberry Pi、NVIDIA Jetson Nano 等设备上离线运行,延迟接近零。

Gemma 4 模型规格

26B MoE 模型有一个巧妙之处:在推理任务中,它只会激活 38 亿参数,因此既能保持较高运行速度,又不会牺牲大模型所具备的深厚知识储备。26B 和 31B 模型提供面向 IDE、编程助手和 Agent 工作流的高级推理能力。

关键提升

Gemma 4 建立在与 Gemini 3 相同的架构基础之上,关键提升包括:

  • 推理能力更强:所有模型都面向复杂推理任务进行了优化,并提供可配置的”思考”模式
  • 多模态能力扩展:所有模型都支持文本和图像输入;E2B 和 E4B 还原生支持视频与音频输入
  • 上下文窗口更大:端侧模型 128K,较大模型(26B/31B)最高 256K
  • 编码与智能体能力增强:内置函数调用支持,能够更好地驱动自主 Agent
  • 原生支持系统提示词:内置 system role 支持,对话结构更清晰
Gemma 4 性能对比

性能越级发挥

谷歌 DeepMind 研究人员 Clement Farabet 和 Olivier Lacombe 表示,在 Gemma 4 上,他们设法进一步压榨出了更多”单位参数智能”,让这些模型能够显著实现”越级发挥”。

根据 Arena AI 文本排行榜,31B 模型排名全球开放模型第 3 位,26B MoE 模型排名第 6 位。谷歌表示,Gemma 4 在部分基准测试中表现优于参数大 20 倍的模型。

有网友评价道:”最让人眼前一亮的部分在于:一共四种尺寸,全部都为 Agent 场景做好了准备,而且全都可以在本地运行。

Gemma 4 架构

开源+本地,谷歌扩大优势

此次 Gemma 4 采用 Apache 2.0 许可证,允许商业使用、自由修改和部署。谷歌称,这一选择旨在给予开发者对数据、基础设施和模型的完全控制权。

Constellation Research 分析师 Holger Mueller 表示,即便是较大规模的 Gemma 4,也小到足以在单张图形处理器上运行,因此它们非常适合边缘场景。

“谷歌正在扩大自己在 AI 领域的领先优势,不只是依靠 Gemini,也包括通过 Gemma 4 家族这样的开放模型。”

Gemma 4 部署

部署路径

开发者可以通过多种途径获取和使用 Gemma 4:

  • 平台:Hugging Face、Kaggle、Ollama、谷歌云
  • 推理框架:LiteRT-LM、vLLM、llama.cpp、MLX、Ollama、NVIDIA NIM、SGLang
  • 硬件支持:NVIDIA、AMD GPU、谷歌 Cloud TPU

不过,也有网友自己测算,Qwen3.5-27B 要略优于 Gemma 4 31B。开源大模型的竞争,正在进入白热化阶段。


来源:InfoQ