首批通过国家大模型标准测试名单公布,共有四家

在近日举办的全国信息技术标准化技术委员会人工智能分委会全体会议期间,首个官方的“大模型标准符合性评测”结果公布,其中包含阿里巴巴的通义千问、腾讯的混元大模型、360的360智脑,以及百度的文心大模型。

llm-1.jpg

据悉,这一评测是由工信部中国电子技术标准化研究院发起,并征集了学术界、产业界等数十家头部单位意见,围绕多领域多维度模型评测框架与指标体系,从大模型的通用性、智能性、安全性等维度展,涵盖了语言、语音、视觉等多模态,具备30余项具体评测维度,旨在建立大模型标准符合性名录、引领人工智能产业健康有序发展。


在阿里方面公布的相关信息中显示,通义千问是目前这一测试中通过的唯一开源模型,并且通义千问72B自12月1日开源以来,已在10个权威基准评测中取得了开源模型最优成绩,先后登顶HuggingFace排行榜、上海人工智能实验室Open Compass榜单。目前,通义千问App已能够在苹果和安卓各应用商店中下载,能够提供文本对话、语音对话、文学分析、外语及文言文翻译、PPT大纲助手、小红书文案等几十项实用功能。

llm-2.jpg

腾讯方面则透露,混元大模型符合《人工智能大规模与训练模型第2部分:测评指标与方法》语言大模型的相关技术要求。据公开信息显示,混元大模型是由腾讯全链路自研的通用大语言模型,拥有超千亿参数规模,预训练语料超2万亿tokens。


此前在10月,混元大模型已正式对外开放“文生图”功能,同时为匹配应用场景的需求,腾讯方面还推出了千亿、百亿以及十亿等不同规模的大模型。目前,腾讯旗下已有超过300项业务和应用场景接入腾讯混元大模型内测,其中包括腾讯会议、腾讯文档、企业微信、腾讯广告和微信搜一搜等。

llm-3.jpg

值得一提的是,阿里云与腾讯云也以技术牵头方、提案牵头方的身份,启动了《人工智能模型即服务(MaaS)功能要求》的讨论与编制,推动MaaS领域标准化。


此前在今年7月,360集团就已被工信部电子标准院授予“国家人工智能标准化总体组大模型专题组”组长单位。据公开资料显示,360智脑是全国首个原生安全的大模型,官方声称其拥有自研千亿参数规模。该大模型预训练超万亿tokens,具备生成创作、多轮对话、逻辑推理等十大核心能力、数百项细分功能,能够覆盖大模型应用的所有场景。而基于360智脑的企业级垂直大模型,则已陆续在金融、医疗、教育等近20个行业陆续落地,并且其已于9月全面接入360全家桶、正式面向公众开放。

llm-4.jpg

而在百度方面,文心大模型是则全球首个发布的生成式AI产品,目前已迭代至4.0版本。在不久前举办的2023年世界互联网大会乌镇峰会前沿数字技术创新与安全论坛和人工智能赋能产业发展论坛上,百度CTO王海峰就曾透露,文心大模型4.0在理解、生成、逻辑、记忆四大能力上均有显著提升,“综合水平与GPT-4相比毫不逊色”,逻辑的提升幅度达到理解的近3倍,记忆的提升幅度也达到了理解的2倍多。


目前,百度已与合作伙伴共建了包括能源、金融、航天、制造、传媒、城市、社科以及影视等10余个行业大模型,正在加速大模型的产业化落地。


【本文图片来自网络】

踩(0)

最新文章

相关文章

大家都在看