日前,月之暗面方面开源全新思考模型Kimi K2 Thinking,并表示这是“Kimi迄今能力最强的开源思考模型”。
据了解,Kimi K2 Thinking基于月之暗面的模型即Agent理念训练,号称原生掌握“边思考,边使用工具”的能力,可在无人类干预的情况下自主实现300轮工具调用和持续稳定的多轮思考能力。对此月之暗面方面表示,“这是我们在Test-Time Scaling(测试时扩展)领域的最新进展,通过同时扩展思考Token和工具调用的轮次,实现更强的Agent和推理性能”。
.jpg)
据悉,Kimi K2 Thinking在 Agentic搜索、Agentic编程、写作和综合推理能力等方面取得全面提升。在人类最后的考试(Humanity's Last Exam)、自主网络浏览能力(BrowseComp)、复杂信息收集推理(SEAL-0)等多项基准测试中,该模型表现均达到 SOTA 水平。
值得一提的是,针对思考模型会产生极长的解码长度,所以常规量化手段往往会导致模型性能大幅下降这一挑战,月之暗面方面在后训练(post-training)阶段采用了量化感知训练(QAT),并对MoE组件应用了INT4纯权重(weight-only)量化。据悉,这就使得 Kimi K2 Thinking能够在复杂推理和Agentic任务中支持原生的INT4推理,并将生成速度提升约2倍,而且INT4 对推理硬件的兼容性更强,对国产计算芯片也更加友好。
据了解,目前Kimi K2 Thinking已上线Kimi官网和最新版Kimi App的常规对话模式,Kimi Agent模式的底层模型后续也将升级为Kimi K2 Thinking,带来完整的多轮思考和工具调用能力。
同时Kimi K2 Thinking API也已上架Kimi开放平台,支持256K上下文,价格与Kimi K2-0905相同,每百万Token输入4元、输出16元,命中缓存的输入为1元。此外,用户还可通过Hugging Face、ModelScope等平台下载该模型,自行部署。
【本文图片来自网络】
