在阿里通义今晨发布Qwen3-VL系列新成员Qwen3-VL-4B和Qwen3-VL-8B之际,英特尔于今日同步宣布,已经在酷睿 Ultra 平台上完成对这些最新模型的适配。此次Day 0支持延续了十天前对Qwen3新模型快速适配的卓越速度,再次印证了英特尔在加速AI技术创新、积极构建模型合作生态方面的深度投入与行动力。
此次发布的Qwen3-VL系列新模型,在延续其卓越的文本理解和生成、深度视觉感知与推理、更长的上下文长度、增强的空间与视频动态理解及强大代理交互能力的同时,凭借其轻量化的模型参数设计,在英特尔酷睿Ultra平台上可以实现高效部署,为复杂的图片和视频理解及智能体应用带来更出色的性能与体验。
为确保用户能够获得更流畅的AI体验,英特尔在酷睿Ultra平台上,对Qwen3-VL-4B 模型进行了创新的CPU、GPU和NPU混合部署,充分释放了XPU架构的强大潜力。通过精巧地分解并优化复杂的视觉语言模型负载链路,并将更多负载精准调度至专用的NPU上,此次英特尔的Day 0支持实现了:
显著的能效优化:大幅降低CPU占用率,更好地支持用户并发应用。
卓越的性能表现:在混合部署场景中,模型运行吞吐量达到22.7tps。
流畅的用户体验:充分利用酷睿Ultra的跨平台能力,提供无缝的AI交互。
以下的演示视频充分地展示了该成果:Qwen3-VL-4B模型在图片理解与分析任务中,在高效利用NPU算力的同时,显著降低了CPU的资源占用。