8月12日,腾讯混元发布多模态理解模型混元Large-Vision。它采用MoE架构,激活参数52B,同时支持任意分辨率图像、视频、3D空间输入,重点提升了多语言场景理解能力。
腾讯混元发布多模态理解模型混元Large-Vision
来源:界面新闻
腾讯
5.5k
- 千问、元宝红包口令在微信内已可复制
- 腾讯入局桌面Agent市场,产品WorkBuddy启动内测
来源:界面新闻
8月12日,腾讯混元发布多模态理解模型混元Large-Vision。它采用MoE架构,激活参数52B,同时支持任意分辨率图像、视频、3D空间输入,重点提升了多语言场景理解能力。
评论