4月17日,字节跳动豆包大模型团队(Seed)发布并开源UI-TARS-1.5。据介绍,这是一款基于视觉-语言模型构建的开源多模态智能体,能够在虚拟世界中高效执行各类任务。目前,UI-TARS-1.5已在7个典型的GUI图形用户界面评测基准中取得SOTA表现,并首次展现了其在游戏中的长时推理能力和在开放空间中的交互能力。
字节Seed智能体模型UI-TARS-1.5开源
来源:界面新闻
字节跳动
3.8k
- 豆包发布手机助手技术预览版
- 科技早报 | 字节跳动或重启沐瞳科技出售计划;多家科技公司驰援香港大埔火灾
评论