小米14 Pro vivo X100 一加12 iPhone 15 iQOO 12

阿里云发布通义千问2.5，多项能力已赶超GPT-4

时间：2024年05月09日栏目：互联网来源：原创编辑：长生

在今天举行的阿里云AI智领者峰会北京站活动中，阿里云方面正式发布了新一代大模型通义千问2.5，并号称其多项能力已赶超GPT-4。同时，原通义千问App也正式宣布更名为通义App，将通义大模型全套能力集于一身，致力于成为“通情达义”的AI助手。

据阿里云方面透露，相比通义千问2.1版本，通义千问2.5的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%。在中文语境下，通义千问2.5在文本理解、文本生成、知识问答及生活建议、闲聊及对话和安全风险等多项能力上赶超GPT-4。而在权威基准OpenCompass中，通义千问2.5的得分也已追平GPT-4 Turbo。据悉，这也是该基准首次录得国产大模型取得如此出色的成绩。

阿里云通义千问2.5发布，号称“多项能力赶超GPT-4”

据了解，在专注于基础模型的技术研发的同时，阿里云也是大模型开源的积极推动者和实践者。截至目前，阿里云方面已沿着“全模态、全尺寸”开源路线，陆续推出八款参数规模横跨5亿到1100亿的开源模型。此外，阿里云方面还开源了视觉理解模型Qwen-VL、音频理解模型Qwen-Audio、代码模型CodeQwen1.5-7B、混合专家模型Qwen1.5-MoE等。

据阿里云方面透露，其最新款开源模型Qwen1.5-110B在MMLU、TheoremQA、GPQA等基准测评中的表现超越了Meta的Llama-3-70B模型，并成功登顶开源大模型排行榜Open LLM Leaderboard。

对此阿里云CTO周靖人表示，开发者的反馈和开源社区的生态支持，是通义大模型技术进步的重要助力，未来通义大模型还会持续开源。

据阿里云方面公布的相关数据显示，截至目前通义大模型通过阿里云服务企业数量已超9万，通过钉钉服务企业数量已超过220万，已在PC、手机、汽车、航空、天文、矿业、教育、医疗、餐饮、游戏、文旅等领域落地，通义开源模型累计下载量则已突破700万。

据了解，在今天举行的相关活动中，小米旗下的人工智能助手“小爱同学”也宣布与通义大模型达成合作，强化其在图片生成、图片理解等方面的多模态AI生成能力，并在小米汽车、小米手机等多类设备落地。同时，微博、众安保险、完美世界游戏等企业也宣布接入通义大模型，将大模型应用于社交媒体、保险、游戏等领域。

【本文图片来自网络】