用户可上传5分钟音频即可生成专属语音模型,支持15种语言实时切换,让数字人更具个性化特征。
My STUDIO今日发布了全新的语音克隆技术,这一技术突破使得用户只需上传5分钟的音频样本,即可生成高度还原的个人语音模型,为数字人赋予独特的声音特征。
该技术采用先进的深度学习算法,能够准确捕捉说话者的音色、语调、节奏等语音特征,并生成自然流畅的语音输出。生成的语音模型可以与任意数字人形象配合使用,实现个性化的数字人视频创作。
值得一提的是,新的语音克隆技术还支持15种语言的实时切换,包括中文(普通话、粤语)、英语、日语、韩语、法语、西班牙语、德语等,满足全球化内容创作的需求。用户可以轻松创建多语言版本的视频内容,大大提升内容的覆盖范围。
"语音是数字人个性化的重要组成部分,我们的目标是让每个数字人都拥有独特的声音特征," My STUDIO语音技术负责人王工程师表示,"这项技术不仅适用于个人创作者,对于企业用户来说,也可以为品牌数字人定制专属语音,提升品牌识别度。"
目前,语音克隆技术已对所有付费用户开放,免费版用户可以体验基础的语音合成功能。为保障用户隐私,My STUDIO严格遵守数据保护法规,所有上传的音频样本仅用于生成用户的个人语音模型,不会用于其他目的。
订阅新闻资讯
订阅我们的新闻资讯,及时获取产品更新、活动信息和行业洞察
我们尊重您的隐私,不会向第三方分享您的信息