字节跳动火山翻译更新,增加38个稀有语种

日前,字节跳动旗下火山翻译宣布上新了多种语言,其中包括世界语、塔希提语、鞑靼语等在内的38个稀有语种。目前,火山翻译已具备文本翻译、语音翻译、图像翻译、语种识别四种能力,并为来自全球的过亿用户提供优质的翻译体验,并且其还在不断扩展所支持的语言,包括汉语、英语、阿拉伯语、俄语、法语、西班牙语六个通用语种在内,其已具备94个语种、8742个语向的翻译能力,整体bleu(机器翻译质量自动评估指标)达33.45。

12111.jpg

根据火山翻译方面介绍,通常情况下,训练76个语向的双语言模型需要150-200 天,而在相同硬件条件下,使用mRASP模型集中服务可以大大节省计算资源,训练一个多语言模型只需要30天。通过采用自研的mRASP多语言模型,火山翻译仅使用一个模型就完成了新上线的38个语种与英文的双向互译,突破了传统双语言翻译模型对每个语向单独训练、单独上线服务的方式,大幅降低机器学习的训练和服务成本。

12110.jpg

目前,火山翻译拥有火山同传、机器翻译与视频翻译三大产品,支持飞书、今日头条、西瓜视频等业务的翻译需求,并通过字节跳动旗下的企业级技术服务平台火山引擎对外提供翻译服务。其中,火山同传采用自研端到端语音识别系统,在保证高译出率和复用率的情况下能够适应各种口音和复杂场景,即使身处展厅现场这类相对嘈杂的环境也能过滤噪音,准确识别发言并翻译。


基于平台能力,火山翻译已经推出了一系列形态多样的产品与服务,包括通用机器翻译服务、火山同传、视频翻译等。同时,火山翻译还支持API、SDK、私有部署等多种接入方式和垂直领域的快速模型定制,能够满足不同群体和不同行业的翻译需求。对此,火山翻译方面称,“随着越来越多自研产品的诞生与投用,火山翻译将会在更多领域进行技术深耕,为更多用户提供更优质的翻译服务,让翻译更简单。”


【本文图片来自网络】

踩(0)

最新文章

相关文章

大家都在看