技术突破 2026-01-23

全新语音克隆技术发布，支持多语言切换

分享至：

用户可上传5分钟音频即可生成专属语音模型，支持15种语言实时切换，让数字人更具个性化特征。

My STUDIO今日发布了全新的语音克隆技术，这一技术突破使得用户只需上传5分钟的音频样本，即可生成高度还原的个人语音模型，为数字人赋予独特的声音特征。

该技术采用先进的深度学习算法，能够准确捕捉说话者的音色、语调、节奏等语音特征，并生成自然流畅的语音输出。生成的语音模型可以与任意数字人形象配合使用，实现个性化的数字人视频创作。

值得一提的是，新的语音克隆技术还支持15种语言的实时切换，包括中文(普通话、粤语)、英语、日语、韩语、法语、西班牙语、德语等，满足全球化内容创作的需求。用户可以轻松创建多语言版本的视频内容，大大提升内容的覆盖范围。

"语音是数字人个性化的重要组成部分，我们的目标是让每个数字人都拥有独特的声音特征，" My STUDIO语音技术负责人王工程师表示，"这项技术不仅适用于个人创作者，对于企业用户来说，也可以为品牌数字人定制专属语音，提升品牌识别度。"

目前，语音克隆技术已对所有付费用户开放，免费版用户可以体验基础的语音合成功能。为保障用户隐私，My STUDIO严格遵守数据保护法规，所有上传的音频样本仅用于生成用户的个人语音模型，不会用于其他目的。

相关新闻