混元大模型将上线视频生成能力,已开放试用申请

日前有官方相关人士透露,腾讯混元大模型将于12月3日正式上线视频生成能力,目前用户可在腾讯元宝App内提交试用申请,企业用户可通过腾讯云提供服务接入、并且API也已同步开放内测申请。此外其还表示,腾讯将开源这一参数量达130亿的视频生成大模型。

腾讯混元大模型将上线视频生成能力,API开放内测申请腾讯混元大模型将上线视频生成能力,API开放内测申请

据了解,混元大模型是由腾讯全链路自研的通用大语言模型,拥有超千亿的参数规模、超2万亿tokens的预训练语料,并具备强大的中文创作能力、复杂语境下的逻辑推理能力,以及可靠的任务执行能力。


此前在今年4月,腾讯方面就将旗下协作SaaS(软件即服务)产品全面接入混元大模型、进行智能化升级,其中包括企业微信、腾讯会议、腾讯文档、腾讯乐享、腾讯电子签、腾讯问卷、腾讯云AI代码助手等。


以腾讯会议为例,得益于腾讯混元大模型的加持,其能够将冗杂的会议纪要、课程笔记、待办等事项交给AI小助手与智能录制,并实现个性化提醒、提炼关键信息、实时字幕翻译等,从而让参会者在会中有效提升专注度,提高沟通效率。


随后在7月,腾讯方面还开源混元文生图大模型(混元DiT)小显存版本和混元文生图打标模型混元Captioner。其中,混元DiT小显存版本最低仅需6G显存即可运行,对使用个人电脑本地部署的开发者更友好。并且经过与Hugging Face合作,这一版本与LoRA、ControlNet等插件均可适配至Diffusers库,开发者无需下载原始代码,仅用简单的三行代码即可调用,大幅简化了使用成本。


9月,腾讯方面还正式发布了从训练数据、模型架构、训练策略、训练框架和软硬件体系等方面实现全链路自研的新一代AI大模型混元Turbo。据悉,该模型采用了MoE(混合专家模型)架构,具备较强的中文创作能力、逻辑推理能力、数学计算和多轮对话能力,并且在“文生图”、“文生视频”、“文生3D”,以及“图+视频生文”等能力方面较为突出。


不久前,腾讯元宝也迎来了2.0版本的更新,并升级了混元turbo,在交互体验、AI搜索,以及多模态理解能力上均迎来了进一步的提升。其中在AI解析能力上,新增了支持任意长宽比、最高7K分辨率图片的理解分析,并采用中文原生DiT文生图架构,在语义理解、画面质感与真实性方面迎来全面提升。


【本文图片来自网络】

踩(0)

最新文章

相关文章

大家都在看