谷歌推出开源大模型Gemma,超越Llama2等竞品

日前,谷歌方面宣布推出新的开源AI大语言模型Gemma系列,并称其是 "最先进的" 轻量级开放模型系列,可以协助开发者和研究人员负责任地免费构建AI。目前Gemma已在全球范围内开放使用,用户可在Kaggle、Hugging Face等平台进行下载和试用。


据了解,Gemma之名来源于意大利语“宝石”,是由谷歌DeepMind及其他团队合作开发,采用了与谷歌于2023年12月发布的多模态通用大模型Gemini相同的技术,并与后者共享技术和基础架构。对此谷歌方面表示,这也是Gemma性能强大的重要原因所在。

谷歌推出开源大模型Gemma,超越Llama-2等竞品

目前已公布的Gemma系列包括两种版本,分别是Gemma 2B(20亿参数)和Gemma 7B(70亿参数),且均提供预训练版本和可通过指令优化的变体,其中Gemma 2B甚至可直接在笔记本电脑上运行。据了解,Gemma 2B和Gemma 7B分别针对来自网络文档、数学和代码的2T及6T规模英文标注数据进行训练,前者针对计划运用高性能AI芯片和数据中心开发AI软件的客户,后者则更适合想要构建更具经济效益应用的客户。但需要注意的是,不同于Gemini,Gemma不支持多模态、而是专注于文本领域,并且没有针对多语言任务进行训练。


性能方面,据谷歌公布的相关成绩显示,Gemma在MMLU、MBPP等18个基准测评中的平均成绩,击败目前的主流开源模型Llama2和Mistral,特别是在数学和代码能力上表现突出,还登顶了Hugging Face开源大模型排行榜。


值得一提的是,谷歌方面强调,Gemma使用了自研AI加速芯片TPUv5e进行训练,其中Gemma 7B使用了4096个TPUv5e,Gemma 2B使用了512个TPUv5e。而且日前谷歌方面还透露已与英伟达达成合作,将使用后者的TensorRT-LLM对Gemma进行优化。


据悉,除Gemma之外,谷歌方面还推出了鼓励协作的工具,以及负责任地使用这些模型的指南。具体而言,谷歌推出了Responsible Generative AI Toolkit等一系列工具,为开发者使用Gemma创建更安全的AI应用提供指导。此外还提供Keras 3.0、原生PyTorch、JAX和Hugging Face Transformers多个框架工具,并支持基于Google Cloud的优化,以及在笔记本电脑、台式机、物联网、移动设备和云端等多个跨设备中兼容,从而让Gemma实现推理和微调。


对此,谷歌开发者关系主管珍妮·班克斯(Jeanine Banks)表示,Gemma的发布是对谷歌旗舰模型Gemini的补充。她指出,谷歌在征求开发者反馈后发现,许多开发者不仅使用API,还使用开源模型,而且开发者希望使用自己的数据构建开源模型应用,或是在自己的硬件或基础设施上进行测试。此外她还进一步指出,“我们认为Gemma的开源真正支持的是这种跨平台模式”。


【本文图片来自网络】

踩(0)

最新文章

相关文章

大家都在看