7月28日晚间,智谱方面正式发布新一代旗舰模型GLM-4.5系列,并在HuggingFace与ModelScope平台同步开源,模型权重遵循MIT License。
据了解,GLM-4.5系列采用混合专家(MoE)架构,包括总参数量3550亿、激活参数320亿的GLM-4.5,以及总参数1060亿、激活参数120亿的GLM-4.5-Air。
据智谱方面介绍,GLM-4.5是专为智能体应用打造的基础模型,并首次在单个模型中实现将推理、编码和智能体能力原生融合,以满足智能体应用的复杂需求。其能够胜任全栈开发任务,编写复杂应用、游戏、交互网页,这得益于模型原生具备的在前端编写网站、在后端进行数据库管理,以及通过工具调用接口支持任意的智能体应用等能力。
此外,GLM-4.5在包含推理、代码、智能体的综合能力达到开源 SOTA,在真实代码智能体的人工对比评测中实测国内最佳。值得一提的是,虽然GLM-4.5参数量为DeepSeek-R1的1/2、Kimi-K2的1/3,但得益于更高参数效率,其在多项标准基准测试中表现得更为出色。例如在衡量模型代码能力的SWE-bench Verified榜单上,GLM-4.5位于性能/参数比帕累托前沿,表明在相同规模下GLM-4.5实现了最佳性能。
在性能优化之外,GLM-4.5系列还在成本和效率上实现突破,其API调用价格为输入0.8 元/百万tokens,输出2元/百万tokens。同时其高速版本实测生成速度最高可至100 tokens/秒,支持低延迟、高并发的实际部署需求,兼顾成本效益与交互体验。
目前GLM-4.5 API已上线开放平台BigModel.cn,并支持一键兼容Claude Code框架,同时用户也可通过智谱清言和z.ai免费体验满血版GLM-4.5。
【本文图片来自网络】