继不久前在2025腾讯云AI产业应用峰会上,腾讯方面宣布全面升级混元大模型矩阵产品,其中包括发布基于混元打造的首个端到端语音通话模型Hunyuan-Voice后。日前有消息源透露,Hunyuan-Voice最快将于今年6月上线腾讯元宝App,或意在与字节跳动旗下豆包的AI视频通话功能展开竞争。
此外值得一提的是,相关消息源还表示,对于大模型研发,腾讯方面目前已规划多模态和全模态路线,预计最快将在今年推出全球首个全模态模型(代号为混元-O),并锚定“世界模型”。
据相关消息源援引隶属于腾讯TEG(技术工程)事业群的混元科研人员透露的消息称,面向AGI,混元将以语言模型为核心,探索多种模态融合,并将向深度、广度两方面持续推进探索。具体而言,一方面混元将从大语言模型向多模态模型发展,理解和模拟物理世界;同时混元还将瞄准更智能的推理、规划、智能体,以及探索知识边界,自我启发、自我迭代、自我发现,最终与具身智能等技术结合,向环境中自主行动和学习的世界模型方向进行探索。
截至目前,腾讯方面尚未对此进行回应。
据了解,在2025腾讯云AI产业应用峰会上,腾讯方面除了发布Hunyuan-Voice外,还推出全新视觉深度推理模型T1-Vision,以及快思考模型混元TurboS、深度思考模型混元T1的迭代升级版本。
据悉,T1-Vision支持多图输入,具备原生长思维链。在具体的产品呈现效果上,T1-Vision能够实现“边看图边思考”,整体效果相比此前提升5.3%,整体理解速度提升50%。而混元TurboS在权威大语言模型评测平台Chatbot Arena上的排名已攀升至全球前八,在国内仅次于DeepSeek。
对此腾讯云副总裁王迪表示,混元正加速向智能化的深度与广度迈进,为AI普惠与产业升级提供坚实支撑,并且混元将坚定拥抱开源,持续推进多尺寸、多场景的全系模型开源。据了解,目前混元已实现图像、视频、3D、文本等在内的全模态开源,其中混元3D模型Hugging Face下载量超过160万。未来混元计划推出多尺寸混合推理模型,从0.5B到32B的dense模型,以及激活13B的MoE模型,适配企业与端侧不同需求。
【本文图片来自网络】