小米14 Pro vivo X100 一加12 iPhone 15 iQOO 12

阿里云开源千亿大模型，性能超越Llama3-70B

时间：2024年04月28日栏目：互联网来源：原创编辑：长生

日前，阿里云通义千问方面宣布开源大模型Qwen1.5-110B，其中包括Qwen1.5-110B-Base和Qwen1.5-110B-Chat两个版本。据悉，这也是目前Qwen1.5系列中首个拥有超过1000亿参数、规模最大的模型，以及目前国内参数规模最大的开源模型。

据了解，Qwen1.5-110B与其他Qwen1.5模型相似，采用了相同的Transformer解码器架构，并包含分组查询注意力（GQA），在模型推理时更加高效。此外，该模型支持32K tokens的上下文长度，并同样支持多种语言，包括英、中、法、西等。按照1100亿参数估计，Qwen1.5-110B模型半精度的推理显存需要220GB。

据通义千问方面透露，该模型在基础能力评估中已与最近发布的SOTA模型Meta-Llama3-70B以及Mixtral-8x22B相媲美，并在Chat评估中表现出色，包括MT-Bench和AlpacaEval 2.0。具体而言，在综合理解测评MMLU、数学推理测评GSM8K和MATH等测评中，Qwen1.5-110B的得分略高于Meta-Llama3-70B、Mixtral-8x22B，在编程测试HumanEval中，Qwen1.5-110B的得分远高于Meta-Llama3-70B、Mixtral-8x22B。

阿里云开源千亿参数大模型，性能超越Llama3-70B