8月12日,腾讯混元发布多模态理解模型混元Large-Vision。它采用MoE架构,激活参数52B,同时支持任意分辨率图像、视频、3D空间输入,重点提升了多语言场景理解能力。
腾讯混元发布多模态理解模型混元Large-Vision
来源:界面新闻
腾讯
4.5k
- 腾讯云:智能体开发平台应用中“图片理解”插件将于11月6日正式收费
- 腾讯视频成立AI影视表达工作室,“AI应用ETF”——线上消费ETF基金(159793)创近1月规模新高
来源:界面新闻
8月12日,腾讯混元发布多模态理解模型混元Large-Vision。它采用MoE架构,激活参数52B,同时支持任意分辨率图像、视频、3D空间输入,重点提升了多语言场景理解能力。
评论