网易有道上线“易魔声”TTS引擎,拥有情感合成功能

日前,网易有道方面宣布上线“易魔声”开源语音合成(TTS)引擎。据悉,“易魔声”是一款有道自研TTS引擎,目前支持中英文双语,包含2000多种不同的音色,拥有情感合成功能,支持用户使用其合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。

youdao-2.jpg

通过“易魔声”,用户可通过在文本中加入情感的描述提示,即可实现自由合成符合自己需求的带有情感的语音,比传统的TTS更加自然逼真。目前,所有用户可免费在开源社区GitHub下载使用,通过其提供的web界面及批量生成结果的脚本接口,实现音色的情感合成与应用。


网易有道CEO周枫对此表示,“目前该项目还处于初期阶段,现在将这个项目开源,也是希望能帮助到有需求的开发者与内容创作者,并不断扩大高质量TTS的应用范围,让产品及应用更好地落地。也期待大家试用后给我们提供更多反馈与建议”。

youdao-3.jpg

据悉,网易有道方面在TTS领域已投入多年,通过以场景为导向,推动技术落地,带来了一系列应用和产品。此前其曾推出教育领域首个明星语音功能,通过将明星的声音内置在网易有道词典中,陪伴用户学习英语,同时还提供声音定制和声音复刻功能,仅需5分钟即可完成个性化声音定制。而在近期推出的Hi Echo虚拟人口语私教,则是借助有道“子曰”教育大模型、语音和虚拟人技术,帮助用户练习英语口语。


早在2008年网易有道方面便开始布局AI领域,致力于基于Transformer模型进行创新和应用,并陆续在神经网络翻译、计算机视觉、高性能计算、智能语音AI技术等方面取得了进展。今年5月,网易有道成为首批“北京市通用人工智能产业创新伙伴计划”成员, 旨在助力人工智能大模型研发和应用。随后在7月,其在2023世界人工智能大会上参与制定了首个《教育通用人工智能大模型系列标准》。

youdao-4.jpg

7月底,网易有道还推出了国内首个教育领域垂直大模型“子曰”,并定位为“场景为先”的教育垂类模型。基于这一大模型,网易有道为不同学习场景设计了定制化的模型,以实现模型与场景的高度契合。随后网易有道还推出了搭载“子曰”教育大模型的六大应用成果并实现落地,包括拟人口语教练Hi Echo、LLM翻译、AI作文指导、语法精讲、AIBox、文档问答等。本月初,“子曰”教育大模型已通过相关备案,可对公众开放。


【本文图片来自网络】

踩(0)

最新文章

相关文章

大家都在看