阿里云发布通义千问2.5,多项能力已赶超GPT-4

在今天举行的阿里云AI智领者峰会北京站活动中,阿里云方面正式发布了新一代大模型通义千问2.5,并号称其多项能力已赶超GPT-4。同时,原通义千问App也正式宣布更名为通义App,将通义大模型全套能力集于一身,致力于成为“通情达义”的AI助手。


据阿里云方面透露,相比通义千问2.1版本,通义千问2.5的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%。在中文语境下,通义千问2.5在文本理解、文本生成、知识问答及生活建议、闲聊及对话和安全风险等多项能力上赶超GPT-4。而在权威基准OpenCompass中,通义千问2.5的得分也已追平GPT-4 Turbo。据悉,这也是该基准首次录得国产大模型取得如此出色的成绩。

阿里云通义千问2.5发布,号称“多项能力赶超GPT-4”

据了解,在专注于基础模型的技术研发的同时,阿里云也是大模型开源的积极推动者和实践者。截至目前,阿里云方面已沿着“全模态、全尺寸”开源路线,陆续推出八款参数规模横跨5亿到1100亿的开源模型。此外,阿里云方面还开源了视觉理解模型Qwen-VL、音频理解模型Qwen-Audio、代码模型CodeQwen1.5-7B、混合专家模型Qwen1.5-MoE等。


据阿里云方面透露,其最新款开源模型Qwen1.5-110B在MMLU、TheoremQA、GPQA等基准测评中的表现超越了Meta的Llama-3-70B模型,并成功登顶开源大模型排行榜Open LLM Leaderboard。


对此阿里云CTO周靖人表示,开发者的反馈和开源社区的生态支持,是通义大模型技术进步的重要助力,未来通义大模型还会持续开源。


据阿里云方面公布的相关数据显示,截至目前通义大模型通过阿里云服务企业数量已超9万,通过钉钉服务企业数量已超过220万,已在PC、手机、汽车、航空、天文、矿业、教育、医疗、餐饮、游戏、文旅等领域落地,通义开源模型累计下载量则已突破700万。


据了解,在今天举行的相关活动中,小米旗下的人工智能助手“小爱同学”也宣布与通义大模型达成合作,强化其在图片生成、图片理解等方面的多模态AI生成能力,并在小米汽车、小米手机等多类设备落地。同时,微博、众安保险、完美世界游戏等企业也宣布接入通义大模型,将大模型应用于社交媒体、保险、游戏等领域。


【本文图片来自网络】

踩(0)

最新文章

相关文章

大家都在看