51龙凤茶楼论坛最新动态今天_全国龙凤信息论坛_夜来香论坛官网_2025小姐威客信息

联系电话

13517270458

新闻中心

News Center

端侧设备迎来了新架构的 AI 模型:谷歌开源2G内存就能跑的Gemma 3n

6月27日消息,端侧设备迎来了新架构的 AI 模型。本周五凌晨,谷歌正式发布、开源了全新端侧多模态大模型 Gemma 3n。谷歌表示,Gemma 3n 代表了设备端 AI 的重大进步,它为手机、平板、笔记本电脑等端侧设备带来了强大的多模式功能,其性能去年还只能在云端先进模型上才能体验。

Gemma 3n 的特性包含如下几个方面:

  • 多模态设计:Gemma 3n 原生支持图像、音频、视频和文本输入和文本输出。
  • 专为设备端优化:Gemma 3n 型号以效率为设计重点,提供两种基于有效参数尺寸:E2B 和 E4B。虽然它们的原始参数数量分别为 5B 和 8B,但架构创新使其运行内存占用与传统的 2B 和 4B 型号相当,仅需 2GB (E2B) 和 3GB (E4B) 内存即可运行。
  • 架构突破:Gemma 3n 的核心是全新组件,例如用于计算灵活性的 MatFormer 架构、用于提高内存效率的每层嵌入 (PLE) 以及针对设备用例优化的新型音频和基于 MobileNet-v5 的视觉编码器。
  • 质量提升:Gemma 3n 在多语言(支持 140 种文本语言和 35 种语言的多模态理解)、数学、编码和推理方面均实现了质量提升。E4B 版本的 LMArena 得分超过 1300,使其成为首个达到此基准的 100 亿参数以下模型。
     

谷歌表示,要想实现设备性能的飞跃需要彻底重新思考模型。Gemma 3n 独特的移动优先架构是其基础,而这一切都始于 MatFormer。

Gemma 3n 的核心是 MatFormer(Matryoshka Transformer) 架构,这是一种专为弹性推理而构建的新型嵌套 Transformer。你可以将其想象成俄罗斯套娃:一个较大的模型包含其自身更小、功能齐全的版本。这种方法将俄罗斯套娃表征学习的概念从单纯的嵌入扩展到所有 Transformer 组件。

在线客服
联系电话

13517270458

微信

扫一扫 联系我