天工3.0基座大模型与天工SkyMusic大模型开启公测

正值天工大模型发布一周年之际,4月17日昆仑万维方面宣布,天工3.0基座大模型与天工SkyMusic音乐大模型正式开启公测。


据了解,与天工2.0相比,天工3.0拥有4000亿参数,超越了3140亿参数的Grok-1,是全球参数最大、性能最强的开源MoE大模型,在语义理解、逻辑推理、通用性、泛化性、不确定性知识、学习能力等领域拥有突破性的性能提升,数学/推理/代码/文创能力均提升超过30%。而在MMBench等多项权威多模态测评结果中,天工3.0超越GPT-4V,达到全球领先水平。


值得一提的是,天工3.0新增了多轮搜索与综合工具调用、图表绘制、研究模式、增强模式、改图扩图等多项AI能力,可为用户带来全新AI体验。以多轮搜索与综合工具调用为例,天工3.0针对模型独立规划、调用、组合外部工具及整合信息的能力进行了专项训练,使其能够独立生成并调用代码,完成包括产业研究、产品横评、信息分析、图片生成、图表绘制等多种复杂用户需求。同时天工3.0能够通过强大的语义理解能力将用户任务拆解成细分环节,实时判断是否需要联网或调用工具,进行单轮或多轮的联网搜索、工具调用,完成包括多轮搜索、热点信息分析、图片生成等复杂用户需求。

天工3.0基座大模型与天工SkyMusic大模型开启公测

而天工SkyMusic是国内首个公开可用的AI音乐生成模型,更是国内自研大模型相关技术第一次在AIGC领域领跑全球。据了解,与当下AI音乐行业普遍选择符号音乐生成技术路线不同,天工SkyMusic采用自研大模型音乐音频生成技术路线,直接通过大模型技术实现乐器、人声、旋律、音量、音符的一体化端到端音乐生成,对此昆仑万维方面表示,“(这一路径)技术难度极大,全球只有包括昆仑万维在内的极少数顶尖玩家参与”。


据悉,在与海外顶尖的AI音乐大模型Suno V3的横向测评中,天工SkyMusic在人声&BGM音质、人声自然度、发音可懂度等领域显著领先对手,并以6.65分的综合得分超越Suno V3,成为全球AI音乐SOTA模型。值得一提的是,天工SkyMusic还拥有独创的参考音乐生成与方言歌曲生成能力。


其中,参考音乐生成能力是指用户可上传自有参考音乐,或选择天工SkyMusic资料库中现有的参考音乐,从而生成风格、唱腔类似的歌曲,进一步降低音乐大模型的使用门槛,让不熟悉乐理知识的用户也能轻松玩转。而在方言歌曲生成方面,天工SkyMusic目前已支持粤语、成都话、北京话等多种方言。


【本文图片来自网络】

踩(0)

最新文章

相关文章

大家都在看