阿里通义百聆推出语音模型新版本

12月15日,阿里通义宣布开源Fun-CosyVoice3-0.5B,该版本提供了zero-shot音色克隆能力,只需要你提供一段3秒以上的参考音频,即可复刻其音色并合成新语音,并且支持本地部署和二次开发。此外,通义推出轻量化版本Fun-ASR-Nano模型,总参数量压缩到0.8B,推理成本更低,现已开源,支持本地部署与定制化微调。

未经正式授权严禁转载本文,侵权必究。

阿里巴巴

5.5k
  • “影视飓风”入驻阿里国际站,用AI开拓海外市场
  • 科技早报 | 阿里云CTO周靖人成阿里合伙人;豆包手机二手价被炒到3.6万元

评论

暂无评论哦,快来评价一下吧!