普通人也能成为音频剪辑师，Meta上线AI 模型 Voicebox

发布时间：2023-06-17 12:43:29 所属栏目：外闻来源：

导读：继发布了图像绑定后， Meta今日再度推出全新的生成式人工智能模型语音盒子。该模型帮助创作者执行音频编辑、采样和风格化等语音生成任务，即便是普通用户也能轻松上手。

Meta 在介绍 Voicebox 模型时表示，视障人

继发布了图像绑定后， Meta今日再度推出全新的生成式人工智能模型语音盒子。该模型帮助创作者执行音频编辑、采样和风格化等语音生成任务，即便是普通用户也能轻松上手。

Meta 在介绍 Voicebox 模型时表示，视障人士可以听到好友的回复信息、普通用户可以用自己的语调、语气来说外语。

AI 模型本身可以生成高质量的音频剪辑，消除汽车喇叭等不必要的背景噪音，同时保留音频的内容和风格，同时使用多种语言，以六种语言生成语音。该人工智能模型的未来发展包括在一些元宇宙主题游戏中为视觉导航的助理或非语音识别的玩家角色智能手机提供自然的声音。

Meta 还比较了 Voicebox 和 Vall-E、YourTTS 等其它音频 AI 模型，表明 Voicebox 更先进，在比较单词错误率和样式相似性时优于两种模型。此外，研究人员还发现，语音识别系统可以更好地理解用户的情绪，并且在不同场景下都能准确识别出用户的想法。

（编辑：聊城站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

哪个州的美国人工作最	马斯克全球仍需要石油
NASA今将演练重返月球	F1赛车手里卡多将在赛