阶跃星辰发布新模型,并发起模芯生态创新联盟

日前阶跃星辰方面发布新一代基础大模型Step 3,并宣布将于7月31日面向全球企业和开发者开源该大模型。


据了解,Step 3基于最适合实际应用的大模型需要满足强智能、低成本、可开源和多模态4个特征这一理念研发,专为追求性能与成本极致均衡的企业和开发者设计。

阶跃星辰发布新模型,发起成立模芯生态创新联盟

其中在性能方面,Step 3是阶跃星辰首个全尺寸、原生多模态推理模型,兼顾模型效果与推理成本。据悉,其采用MoE架构,总参数量321B,激活参数量38B,拥有强大的视觉感知和复杂推理能力,可准确完成跨领域的复杂知识理解、数学与视觉信息的交叉分析,以及日常生活中的各类视觉分析问题。


在MMMU、MathVision、SimpleVQA、AIME 2025、LiveCodeBench (2024.08-2025.05) 等测试榜单中,Step 3取得了开源多模态推理模型的SOTA成绩。


而在成本侧,阶跃星辰方面方面指出,考虑到目前主流开源模型解码优化方案主要适配国际高端芯片,在中端及国产芯片上的解码效率仍有提升空间,Step 3在架构设计阶段便充分考量系统与硬件的特性,实现广泛硬件平台上的高效推理。


据悉,凭借系统和架构创新,Step 3实现了行业领先的推理解码效率。阶跃星辰方面透露,根据原理分析,Step 3在国产芯片上的推理效率最高可达DeepSeek-R1的300%,且对所有芯片友好。在基于NVIDIA Hopper架构的芯片进行分布式推理时,实测Step 3相较于DeepSeek-R1的吞吐量提升超70%。并且这些成绩都是在不牺牲激活参数量、不降低注意力容量的条件下实现的。


值得一提的是,日前阶跃星辰方面还联合昇腾、沐曦、壁仞科技、燧原科技、天数智芯、无问芯穹、寒武纪、摩尔线程、硅基流动等多家国内芯片、平台厂商发起成立“模芯生态创新联盟”,致力于打通芯片、模型和平台全链路技术。据悉,通过底层联合创新提升大模型适配性和算力效率,该联盟将为企业和开发者提供高效易用的大模型解决方案,加速应用落地。


目前,华为昇腾芯片已首先实现Step 3的搭载和运行,沐曦、天数智芯和燧原等也已初步实现运行Step 3,其它联盟厂商的适配工作也已开展。


此外,日前阶跃星辰方面还与上海国有资本投资有限公司达成深度战略合作,双方将围绕加强资本链接、生态业务合作等方面进行全面的深度合作。


【本文图片来自网络】

踩(0)

最新文章

相关文章

大家都在看