首个代码大模型国际标准立项通过,由信通院牵头

在近日召开的国际电信联盟电信标准分局第十六研究组(ITU-T SG16)全体会议上,《基于人工智能的代码生成技术要求和评估方法》国际标准项目(ITU-T F.TE-CG “Technical requirements and evaluation methods of AI based code generation in multimedia applications”,以下将简称为《方法》)成功获得立项通过。


据了解,该《方法》是国际上首个代码大模型的标准项目,是由中国信通院牵头,联合华为云等产学研机构共同提出。其实基于《智能化软件工程技术和应用要求 第一部分:代码大模型》标准提出,围绕代码大模型相关的通用能力、专用场景能力和应用成熟度,从输入多样性、任务多样性、语言完备度、结果可接收性、结果准确度等维度,对代码大模型提出全栈技术和管理要求。

首个代码大模型国际标准立项通过,由中国信通院牵头

对此华为云方面表示,此次国际标准项目的成功立项,有助于推动全球范围对代码大模型的整体技术框架形成认同和共识,提升代码大模型的能力,促进代码大模型的规范化应用,同时此次立项通过也标志着我国科技企业在智能化软件工程领域的技术探索受到国际认可。


值得一提的是,除上述项目外,在此次会议上由中国信通院牵头的其他5个新立项申请也顺利通过,分别是《基础模型的评估标准:基准测试》、《基础模型的评估标准:基准测试》、《基于大模型的智能体能力要求与评估方法》、《人工智能云平台技术规范:资源管理》、《多媒体应用中大模型数据供给能力要求与评估方法》。


其中,《基础模型的评估标准:基准测试》提供了基础模型评估中基准评测的参考架构、技术要求和评估方法,包括模型能力、测试数据集、测试方法以及测试工具四个部分;《大模型检索增强生成技术要求与评估方法》围绕RAG全生命周期过程中的技术能力和应用能力,从知识库构建能力、检索能力、生成能力、优化能力、应用成熟度、应用稳定性等维度进行展开。


《基于大模型的智能体能力要求与评估方法》针对智能体产品和应用提出能力要求及评估方法,包括感知认知、规划、记忆、行动四个方面;《工智能云平台技术规范:资源管理》主要包含人工智能云平台资源管理模块的功能架构,以及资源管理、作业管理、调度管理、运维管理等的功能要求;《多媒体应用中大模型数据供给能力要求与评估方法》面向大模型的数据服务,提出参考框架、能力要求和评估方法。


【本文图片来自网络】

踩(0)

最新文章

相关文章

大家都在看