通义千问Qwen3模型升级,性能超越Kimi-K2

日前,阿里云通义千问方面宣布更新Qwen3模型,推出Qwen3-235B-A22B-FP8非思考模式(Non-thinking)的新版本,并将其命名为Qwen3-235B-A22B-Instruct-2507-FP8。目前,Qwen3新模型已在魔搭社区和HuggingFace上开源更新。


据阿里云通义千问方面介绍,Qwen3新模型通用能力显著提升,包括指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等方面。其中在GQPA(知识)、AIME25(数学)、LiveCodeBench(编程)、Arena-Hard(人类偏好对齐)、BFCL(Agent能力)等多项测评中,Qwen3新模型的表现出色,超过了Kimi-K2、DeepSeek-V3等旗舰开源模型,以及Claude-Opus4-Non-thinking等领先闭源模型。

通义千问Qwen3模型升级,性能超Kimi-K2

此外,Qwen3新模型还在多语言的长尾知识覆盖方面取得显著进步;在主观及开放性任务中显著增强了对用户偏好的契合能力,能够提供更有用的回复,生成更高质量的文本;长文本提升至256K,上下文理解能力进一步增强。


值得一提的是,不久前阿里云通义千问旗下AI聊天产品Qwen Chat也迎来升级。在此次更新后,Qwen Chat的可访问性和即时性进一步增强,交互方式也更加直观。目前用户访问通义官网首页,即可直接与Qwen Chat开聊。


同时Qwen Chat已支持多功能集成,包括“深入研究”、“图像生成”、“网页开发”、“深度思考”、“搜索”等。在“图片生成”模式下,用户可以通过文字描述生成高质量图片;而“网页开发”功能可以辅助前端工程师快速构建代码。此外,Qwen Chat桌面端也已上线,并支持一键唤起MCP。


【本文图片来自网络】

踩(0)

最新文章

相关文章

大家都在看