Meta开发了一种新的方式,让人们通过语言联系

广告

Meta已经完成了一项非凡的壮举,朝着另一个突破迈进。据该公司报道,一种新的语音到语音(S2ST)翻译系统已经开发出来,能够翻译口语。由于研究处于初级发展阶段,所以只考虑了一种语言,即中国部分地区使用的口头语言闽南语。现在,闽南语,也是台湾的国语之一,将通过这个新开发的语音到语音翻译器进行细致的翻译。

这项研究被认为是一项突破,因为迄今为止,在口头语言翻译方面的工作很少,甚至没有,而中国郊区有数百万人使用的闽南语的翻译,无疑是一项突破。再加上这一点,世界上大约一半的语言是口语,大约有7000种语言。虽然人工智能的使用一直专注于书面语言的翻译,但这一里程碑将为该领域的未来发展打开新的大门。

除此之外,Meta在一篇博客文章中写道“我们使用语音到单元翻译(S2UT)将输入语音直接翻译成一系列声学单元,这是Meta之前开创的路径。然后,我们从单元中生成波形。此外,UnitY采用了两步解码机制,其中第一步解码器生成相关语言(普通话)的文本,第二步解码器创建单元。”因此,这个新的语音到语音翻译系统已经由Meta的通用语音翻译(UST)项目监督,并为研究人员未来在这一领域的工作奠定了基础。

为此,公司面临着一些挑战,为了确保系统的效率,公司必须解决这些挑战。这包括“数据短缺”,因为这是最近推出的第一个系统,没有足够的数据可以输入翻译人员进行口头翻译。其次,有些词在人们说的时候看起来不一样,而且它们的书写顺序也不一样。

然而,该公司表示:“要为世界各地的每个人提供真正通用的翻译工具,还需要做更多的工作。但我们认为,这里所描述的努力是向前迈出的重要一步。我们不仅开放了我们的闽南语翻译模型,还开放了评估数据集和研究论文,这样其他人就可以复制和建立我们的工作。”

广告

留言回复

您的电子邮件地址将不会被公布。必填项被标记*