腾讯混元宣布开源首个多模态统一CoT奖励模型

5月13日,腾讯混元发布消息称,近日与上海AI Lab、复旦大学、上海创智学院联合提出全新研究工作UnifiedReward-Think,构建出首个具备长链式推理能力的统一多模态奖励模型,首次让奖励模型在各视觉任务上真正“学会思考”,实现对复杂视觉生成与理解任务的准确评估、跨任务泛化与推理可解释性的大幅提升。目前,该项目已全面开源,包括模型、数据集、训练脚本与评测工具。

未经正式授权严禁转载本文,侵权必究。

腾讯

6k
  • 受腾讯业绩提振,腾讯大股东Prosus股价上涨3.8%
  • 微信成立电商产品部,曾鸣任负责人向张小龙汇报

评论

暂无评论哦,快来评价一下吧!