腾讯混元发布并开源语音数字人模型

界面快报 · 来源：界面新闻

5月28日，腾讯混元发布并开源的语音数字人模型HunyuanVideo-Avatar，由腾讯混元视频大模型（HunyuanVideo）及腾讯音乐天琴实验室MuseV技术联合研发，支持头肩、半身与全身景别，以及多风格、多物种与双人场景，面向视频创作者提供高一致性、高动态性的视频生成能力。用户可上传人物图像与音频，HunyuanVideo-Avatar模型会自动理解图片与音频，比如人物所在环境、音频所蕴含的情感等，让图中人物自然地说话或唱歌，生成包含自然表情、唇形同步及全身动作的视频。

未经正式授权严禁转载本文，侵权必究。

暂无评论哦，快来评价一下吧！

极氪8X信息遭提前泄露，公司称既定发布节奏被打乱
事关隐藏式汽车门把手，强制性国家标准将于明年1月起实施
违规干预和插手政府采购，重庆市政协原副主席段成刚受贿数额特别巨大被公诉
北京百老汇电影中心的迁移：一个电影乌托邦的漫长退场
4名“老虎”被处理：倪强纵容配偶不实际工作获取薪酬，林景臻私藏阅看寄递有严重政治问题书籍
因涉及基金销售违规，百万粉丝财经大V“爱理财的小羊” 多平台账号遭封禁
俄乌达成314人换俘协议，但领土、停火问题仍无进展
农业农村部强调稳健发展新型农村集体经济：不对集体收入提硬性目标
全国实现生育津贴直接发放个人，灵活就业等人员将纳入生育保险
汽车早报｜何小鹏官宣大六座SUV小鹏GX 东风奕派回应网传eπ007事故

历史搜索全部删除

热门搜索

腾讯混元发布并开源语音数字人模型

评论