小米15 Ultra vivo X200 Ultra OPPO Find X8 Ultra 一加13T

有消息称，腾讯或将在年内发布首个全模态模型

时间：2025年05月26日栏目：互联网来源：原创编辑：长生

继不久前在2025腾讯云AI产业应用峰会上，腾讯方面宣布全面升级混元大模型矩阵产品，其中包括发布基于混元打造的首个端到端语音通话模型Hunyuan-Voice后。日前有消息源透露，Hunyuan-Voice最快将于今年6月上线腾讯元宝App，或意在与字节跳动旗下豆包的AI视频通话功能展开竞争。

此外值得一提的是，相关消息源还表示，对于大模型研发，腾讯方面目前已规划多模态和全模态路线，预计最快将在今年推出全球首个全模态模型（代号为混元-O），并锚定“世界模型”。

据相关消息源援引隶属于腾讯TEG（技术工程）事业群的混元科研人员透露的消息称，面向AGI，混元将以语言模型为核心，探索多种模态融合，并将向深度、广度两方面持续推进探索。具体而言，一方面混元将从大语言模型向多模态模型发展，理解和模拟物理世界；同时混元还将瞄准更智能的推理、规划、智能体，以及探索知识边界，自我启发、自我迭代、自我发现，最终与具身智能等技术结合，向环境中自主行动和学习的世界模型方向进行探索。

截至目前，腾讯方面尚未对此进行回应。

据了解，在2025腾讯云AI产业应用峰会上，腾讯方面除了发布Hunyuan-Voice外，还推出全新视觉深度推理模型T1-Vision，以及快思考模型混元TurboS、深度思考模型混元T1的迭代升级版本。

据悉，T1-Vision支持多图输入，具备原生长思维链。在具体的产品呈现效果上，T1-Vision能够实现“边看图边思考”，整体效果相比此前提升5.3%，整体理解速度提升50%。而混元TurboS在权威大语言模型评测平台Chatbot Arena上的排名已攀升至全球前八，在国内仅次于DeepSeek。

对此腾讯云副总裁王迪表示，混元正加速向智能化的深度与广度迈进，为AI普惠与产业升级提供坚实支撑，并且混元将坚定拥抱开源，持续推进多尺寸、多场景的全系模型开源。据了解，目前混元已实现图像、视频、3D、文本等在内的全模态开源，其中混元3D模型Hugging Face下载量超过160万。未来混元计划推出多尺寸混合推理模型，从0.5B到32B的dense模型，以及激活13B的MoE模型，适配企业与端侧不同需求。

【本文图片来自网络】