快餐妹24小时联系方式查询,上门卖身24小时服务热线电话,闲鱼约本地鸡暗号怎么玩

联系电话

13517270458

新闻中心

News Center

端侧设备迎来了新架构的 AI 模型:谷歌开源2G内存就能跑的Gemma 3n

6月27日消息,端侧设备迎来了新架构的 AI 模型。本周五凌晨,谷歌正式发布、开源了全新端侧多模态大模型 Gemma 3n。谷歌表示,Gemma 3n 代表了设备端 AI 的重大进步,它为手机、平板、笔记本电脑等端侧设备带来了强大的多模式功能,其性能去年还只能在云端先进模型上才能体验。

Gemma 3n 的特性包含如下几个方面:

  • 多模态设计:Gemma 3n 原生支持图像、音频、视频和文本输入和文本输出。
  • 专为设备端优化:Gemma 3n 型号以效率为设计重点,提供两种基于有效参数尺寸:E2B 和 E4B。虽然它们的原始参数数量分别为 5B 和 8B,但架构创新使其运行内存占用与传统的 2B 和 4B 型号相当,仅需 2GB (E2B) 和 3GB (E4B) 内存即可运行。
  • 架构突破:Gemma 3n 的核心是全新组件,例如用于计算灵活性的 MatFormer 架构、用于提高内存效率的每层嵌入 (PLE) 以及针对设备用例优化的新型音频和基于 MobileNet-v5 的视觉编码器。
  • 质量提升:Gemma 3n 在多语言(支持 140 种文本语言和 35 种语言的多模态理解)、数学、编码和推理方面均实现了质量提升。E4B 版本的 LMArena 得分超过 1300,使其成为首个达到此基准的 100 亿参数以下模型。
     

谷歌表示,要想实现设备性能的飞跃需要彻底重新思考模型。Gemma 3n 独特的移动优先架构是其基础,而这一切都始于 MatFormer。

Gemma 3n 的核心是 MatFormer(Matryoshka Transformer) 架构,这是一种专为弹性推理而构建的新型嵌套 Transformer。你可以将其想象成俄罗斯套娃:一个较大的模型包含其自身更小、功能齐全的版本。这种方法将俄罗斯套娃表征学习的概念从单纯的嵌入扩展到所有 Transformer 组件。

在线客服
联系电话

13517270458

微信

扫一扫 联系我

主站蜘蛛池模板: 大渡口区| 青川县| 甘孜县| 雷山县| 孟津县| 河东区| 贵溪市| 和平县| 雅安市| 邵东县| 尉氏县| 夏邑县| 涪陵区| 若羌县| 吉安县| 崇州市| 双辽市| 申扎县| 永平县| 阜康市| 正阳县| 乌兰浩特市| 泽库县| 林周县| 兰西县| 元阳县| 谢通门县| 栖霞市| 哈密市| 蓬莱市| 甘南县| 鲁甸县| 岑巩县| 蓬莱市| 富川| 澄城县| 微山县| 吉林市| 陈巴尔虎旗| 宾川县| 高陵县|