小米14 Pro vivo X100 一加12 iPhone 15 iQOO 12

谷歌推出开源大模型Gemma，超越Llama2等竞品

时间：2024年02月22日栏目：互联网来源：原创编辑：长生

日前，谷歌方面宣布推出新的开源AI大语言模型Gemma系列，并称其是 "最先进的" 轻量级开放模型系列，可以协助开发者和研究人员负责任地免费构建AI。目前Gemma已在全球范围内开放使用，用户可在Kaggle、Hugging Face等平台进行下载和试用。

据了解，Gemma之名来源于意大利语“宝石”，是由谷歌DeepMind及其他团队合作开发，采用了与谷歌于2023年12月发布的多模态通用大模型Gemini相同的技术，并与后者共享技术和基础架构。对此谷歌方面表示，这也是Gemma性能强大的重要原因所在。

谷歌推出开源大模型Gemma，超越Llama-2等竞品

目前已公布的Gemma系列包括两种版本，分别是Gemma 2B（20亿参数）和Gemma 7B（70亿参数），且均提供预训练版本和可通过指令优化的变体，其中Gemma 2B甚至可直接在笔记本电脑上运行。据了解，Gemma 2B和Gemma 7B分别针对来自网络文档、数学和代码的2T及6T规模英文标注数据进行训练，前者针对计划运用高性能AI芯片和数据中心开发AI软件的客户，后者则更适合想要构建更具经济效益应用的客户。但需要注意的是，不同于Gemini，Gemma不支持多模态、而是专注于文本领域，并且没有针对多语言任务进行训练。

性能方面，据谷歌公布的相关成绩显示，Gemma在MMLU、MBPP等18个基准测评中的平均成绩，击败目前的主流开源模型Llama2和Mistral，特别是在数学和代码能力上表现突出，还登顶了Hugging Face开源大模型排行榜。

值得一提的是，谷歌方面强调，Gemma使用了自研AI加速芯片TPUv5e进行训练，其中Gemma 7B使用了4096个TPUv5e，Gemma 2B使用了512个TPUv5e。而且日前谷歌方面还透露已与英伟达达成合作，将使用后者的TensorRT-LLM对Gemma进行优化。

据悉，除Gemma之外，谷歌方面还推出了鼓励协作的工具，以及负责任地使用这些模型的指南。具体而言，谷歌推出了Responsible Generative AI Toolkit等一系列工具，为开发者使用Gemma创建更安全的AI应用提供指导。此外还提供Keras 3.0、原生PyTorch、JAX和Hugging Face Transformers多个框架工具，并支持基于Google Cloud的优化，以及在笔记本电脑、台式机、物联网、移动设备和云端等多个跨设备中兼容，从而让Gemma实现推理和微调。

对此，谷歌开发者关系主管珍妮·班克斯（Jeanine Banks）表示，Gemma的发布是对谷歌旗舰模型Gemini的补充。她指出，谷歌在征求开发者反馈后发现，许多开发者不仅使用API，还使用开源模型，而且开发者希望使用自己的数据构建开源模型应用，或是在自己的硬件或基础设施上进行测试。此外她还进一步指出，“我们认为Gemma的开源真正支持的是这种跨平台模式”。

【本文图片来自网络】