日前有消息称,DeepSeek创始人梁文锋近期在内部沟通中透露,该公司新一代旗舰大模型DeepSeek V4将于4月下旬正式发布。
相关消息源透露,DeepSeek V4将实现重大技术突破,包括万亿参数规模、百万级上下文窗口,并在推理阶段首次全面适配华为昇腾等国产AI芯片,成为国内首个在全链路算力上彻底摆脱英伟达依赖的万亿级大模型,实现推理速度较DeepSeek V3提升35倍、能耗降低40%。
据称,DeepSeek V4预计将以Apache 2.0协议开源,支持企业自主部署,并已被阿里、腾讯、字节等科技巨头提前预订算力资源,计划集成至其云服务与AI产品中。
对此传言,DeepSeek方面尚未进行回应。

需要注意的是此前曾有消息称,“今年1月左右,DeepSeek V4的一个小参数版本已给到了一些开源框架社区开始做适配”。而且3月底DeepSeek经历了一次服务中断,恢复后开发者实测模型逻辑严谨性、代码生成能力均显著提升,认为疑似DeepSeek V4灰度测试。
此外,日前DeepSeek迎来更新,对话页面出现快速模式和专家模式两种选项,并且这一更新已覆盖网页端和移动端。据了解,这是DeepSeek首次在产品端引入模式分层设计,并且快速模式与专家模式均支持深度思考和智能搜索。其中,快速模式适配日常对话、即时响应,专家模式则更擅长处理复杂问题。
【本文图片来自网络】
