
开发者可以用它们来驱动自主Agent,与第三方工具交互,并执行多步骤任务规划。
4月3日,谷歌正式发布Gemma4,称“这是其迄今为止最智能的开放模型系列”。该系列面向复杂推理与智能体工作流设计,采用商业许可的Apache2.0许可证开源。包括四种规格的Gemma4通用模型:高效20亿参数版(E2B)、高效40亿参数版(E4B)、260亿混合专家模型(MoE)与310亿稠密模型(31B)。
在端侧,E2B和E4B模型针对移动和物联网设备优化,推理时分别激活约20亿和40亿参数,以降低内存和电量消耗。据介绍,这两个模型已与谷歌Pixel团队、高通和联发科等硬件厂商合作,可在手机、RaspberryPi、NVIDIAJetsonNano等设备上离线运行,延迟接近零。
与此同时,研究人员表示,26BMoE模型有一个巧妙之处:在推理任务中,它只会激活38亿参数,因此既能保持较高运行速度,又不会牺牲大模型所具备的深厚知识储备。
26B和31B模型提供面向IDE、编程助手和Agent工作流的高级推理能力。模型针对消费级GPU进行了优化,让学生、研究人员和开发者能够把自己的工作站变成以本地优先为核心的AI服务器。

谷歌DeepMind研究人员ClementFarabet和OlivierLacombe表示,在Gemma4上,他们设法进一步压榨出了更多“单位参数智能”,让这些模型能够显著实现“越级发挥”。例如,31BDense版本目前在行业标准榜单的开源模型中排名第三。
Farabet和Lacombe解释称,每个Gemma4模型都更适合用于运行AIAgent。此前几代Gemma模型往往需要开发者额外调整设计,才能与其他软件工具交互;而Gemma4已原生支持函数调用和结构化JSON输出、原生系统指令以及超过140种语言。这意味着,开发者可以用它们来驱动自主Agent,与第三方工具交互,并执行多步骤任务规划。
信钰证券配资提示:文章来自网络,不代表本站观点。