【家庭聚餐菜谱 很精良】全球微速讯:Meta的AI翻译器可以解释无文字的语言 扎克伯格以闽南话举例


(相关资料图)

世界上大约7000种已知的全球器语言中,有将近一半的微速无文语言,也就是翻译其中的十分之四是口耳相传,没有包含书面内容。解释家庭聚餐菜谱 很精良这些无文字的字的扎克语言给现代机器学习翻译系统带来了一个奇异的问题,因为它们通常需要在翻译到新语言之前将口头语言转换为书面文字,伯格并将文字还原为语音,闽南但Meta公司已经通过其最新的话举开源语言AI进展解决了这个问题。

作为Meta公司通用语音翻译器(UST)项目的全球器一部分,该项目正致力于开发实时语音到语音的微速无文翻译,以便元宇宙居民能够更容易地进行互动(读作:互相进行性骚扰)。翻译留学申请流程详解 很出众作为这个项目的解释一部分,Meta的字的扎克研究人员研究了福建闽南话,这是伯格一种散居在亚洲各地的无文字语言,也是闽南台湾地区的主流语言之一。

机器学习翻译系统通常需要大量可标记的留学申请流程详解 很耀眼语言例子,包括书面和口语来进行训练--这正是像闽南话这样的无文字语言所不具备的。为了解决这个问题,"Meta使用语音到单元的翻译(S2UT),将输入的语音直接转换为Meta以前开创的声学单元序列,"首席执行官马克-扎克伯格在周三的一篇博文中解释说。"然后,我们从这些单元生成波形。此外,UnitY被采用为双通解码机制,第一通解码器生成相关语言(普通话)的文本,第二通解码器创建单元。"

"我们利用普通话作为中间语言来建立伪标签,我们首先将英语(或上面说的闽南话)语音翻译成普通话文本,然后我们再翻译成闽南话(或英语)并将其加入训练数据。"目前,该系统允许讲福建话的人与讲英语的人交谈,尽管很生硬,且该模型一次只能翻译一个完整的句子。但扎克伯格相信,这项技术最终可以应用于更多语言,并将改进到提供实时翻译的程度。

扎克伯格宣布,除了Meta已经从这个项目中开源的模型和训练数据外,该公司还将发布一个基于闽南话话语料库的首个语音翻译基准系统,以及"语音矩阵,一个用Meta的创新数据挖掘技术LASER挖掘的语音翻译大料库"。这个系统将使研究人员能够创建他们自己的语音到语音翻译(S2ST)系统。