谷歌翻译宣布新增110种语言支持,其中包括粤语

日前谷歌方面宣布,旗下语言翻译工具谷歌翻译已新增110种语言的支持,包括阿法尔语、粤语、马恩岛语、恩科语、旁遮普语(沙穆基语)、塔马齐特语(阿马齐格语)和托克皮辛语等。


据了解,谷歌翻译此次能够实现对这110种语言的支持是得益于PaLM 2模型加持,同时这也是谷歌翻译方面此前在2022年宣布通过AI支持1000种语言计划的一部分。截至目前,其所支持的语种数量已超过240种。

谷歌翻译新增110种语言支持,包括粤语等

据悉,谷歌翻译此次新增110种语言的总使用者数量超过6.14亿、约占世界总人口的8%,其中一些是拥有超1亿使用者的世界主要语言、一些则是由小型原住民社区使用的语言,还有一些语言几乎没有母语使用者、正在展开复兴工作。此外值得一提的是,这110种语言中有大约四分之一来自非洲,这也是迄今为止谷歌翻译方面对非洲语言最大规模的一次扩展。


对此谷歌翻译方面表示,“这是我们有史以来最大的一次扩展”,以及“谷歌翻译打破了语言障碍,帮助人们沟通并更好地了解周围的世界。我们一直在应用最新技术,以便更多人可以使用此工具”。此外官方还强调,在增加对某种语言的支持时,会考虑地域差异、方言和不同的拼写标准等多种因素。


谷歌翻译高级软件工程师Issac Caswell则指出,“语言具有巨大的多样性:地区变体、方言、不同的拼写标准。事实上,许多语言没有一种标准形式,因此不可能挑选出一种‘正确’的变体。我们的方法是优先考虑每种语言最常用的变体。例如,罗姆语是一种在整个欧洲都有许多方言分支的语言。我们的模型生成的文本最接近南瓦拉克斯罗姆语,这是一种在线常用的变体。但它也混合了其他语言的元素,如北瓦拉克斯罗姆语和巴尔干罗姆语”。


【本文图片来自网络】

踩(0)

最新文章

相关文章

大家都在看