Meta 发布全新 AI 模型 SeamlessM4T,可转录和翻译近百种语言
IT之家 8 月 22 日消息,Facebook 的母公司 Meta Platforms 今日发布了一种能够翻译和转录数十种语言的人工智能模型 ——SeamlessM4T,可以让说不同语言的人更有效地进行交流,为开发人类通用语言翻译器提供了助力。
Meta 声称,SeamlessM4T 将与新的翻译数据集 SeamlessAlign 一同开源,它代表了人工智能驱动的“语音到语音”和“语音到文本”领域的“重大突破”。
Meta 表示,该模型可以在近 100 种语言之间进行文本到语音的翻译,并支持 35 种语言的完全语音到语音翻译,而此前要想实现类似的操作只能在单独的 AI 模型中分别进行翻译。SeamlessM4T 支持:
(资料图)
1、近 100 种语言的语音识别。
2、近 100 种输入和输出语言的语音到文本翻译。
3、支持近 100 种输入语言和 36 种输出语言的语音到语音翻译。
4、支持近 100 种语言的文本到文本翻译。
5、支持近 100 种输入语言和 35 种输出语言的文本到语音翻译。
目前,Meta 将以研究许可证的形式向公众免费提供该模型(仅限非商业用途),以便研究人员和开发人员在此基础上开展工作。
据介绍,Meta 还将发布 SeamlessAlign 元数据,这是迄今为止最大的开放多模式翻译数据集,挖掘的语音和文本对齐总计达 270000 小时。
马克・扎克伯格表示,他坚信这些工具将促进来自全球各地的用户在元宇宙中的互动,这也是他对该公司未来的赌注所在。
他还表示,开放 AI 生态系统对 Meta 有利,因为该公司通过有效地将创建面向消费者的工具的任务众包来获得更多收益,而不是通过访问模型来收费。
据称,Meta 后续还将把这些翻译和转录方面的 AI 进展整合到 Facebook、Instagram、WhatsApp、Messenger 和 Threads 中。
关于 SeamlessM4T 模型,Meta 研究人员在一份研究论文中表示,他们从“爬取的网页数据的公开可用存储库中”收集了 400 万小时的“原始音频”,但IT之家没有找到具体是哪个存储库的说明,官方只提到文本数据来自去年创建的数据集,而该数据集来自于维基百科及相关网站提取的内容。
关键词:
您可能也感兴趣:
为您推荐
云铝股份:向中国铝业青海分公司转让10万吨电解铝产能指标
李善长:8.22黄金白银是诱空还是反转?黄金操作建议走势分析
信号隔离器用途及工作原理分析 信号隔离器是什么
排行
最近更新
- Meta 发布全新 AI 模型 SeamlessM4T,可转录和翻译近百种语言
- 什么是商品价值规律(商品价值规律)
- 江西九江柴桑区:“村BA”乡级篮球赛点燃乡村激情
- 中国船舶租赁(03877)发布中期业绩,股东应占溢利10.86亿港元...
- 2023湖南留学生创业大赛开赛,5大变化更具“湘味”
- 有1说1,开自助棋牌室真不是躺赢!
- 济南这个村支书,用网络“团购”将农产品送出大山
- 刘冠廷求婚「筹备半年」! 同居难下手笑吐:钻戒藏好几个月
- 人工智能时代网络文学的高质量发展
- 户外玩家新选择!Vans 新联名曝光!
- 中国男篮:最终12人官宣,仅剩三大后卫,朱俊龙压哨留队
- 第六届中国(克拉玛依)国际石油装备展将于9月8日开幕
- 上海机场、白云机场均触及跌停
- 上海临港:深化QFLP、QDLP试点 在跨境离岸金融等领域率先开...
- 曾经的好声音总冠军,参加节目第一轮却被淘汰,为何会沦落如此?
- 助力暑期夜经济发展 多城限时免费乘地铁
- 新钢股份:我司目前没有氢气运输管道相关产品
- 飞猪前总裁李少华创业,杀入旅游大模型
- 方程豹来了,比亚迪对燃油车的二次革命?
- 美国向乌克兰提供f-16 俄方称将把F-16战机视为西方核威胁 ...
- 云南省丽江市2023-08-22 22:08发布地质灾害黄色预警
- 云南省昭通市2023-08-22 22:26发布地质灾害黄色预警
- 亚运会中国队礼服好有韵味!蓝西装配青花瓷尽显国风美,太惊艳了
- 豪鹏科技:鹏华基金管理有限公司、摩根士丹利基金管理(中国)...
- ST中利:公司已经披露了与产业投资人、牵头财务投资人签署的...
- 奇瑞瑞虎9:除了超越同价位的奢华外,游刃有余的驾乘体验更赞!
- CHUBU初步携手品牌形象大使陈龙,共赴影像新征程
- 青岛崂山风景区有人“坠山”?官方回应
- 清研环境(301288):8月22日技术指标出现看涨信号-“红三兵”
- 从“废渣渣”到“香饽饽” 煤炭重镇山西朔州加码固废再利用