小米开源首代机器人VLA大模型

2月12日,小米宣布开源首代机器人VLA大模型Xiaomi-Robotics-0。据介绍,这是一个拥有47亿参数、兼具视觉语言理解与高性能实时执行能力的开源VLA模型。小米机器人团队引入Action Proposal机制,强迫VLM模型在理解图像的同时预测多种动作分布。针对推理延迟引发的真机“动作断层”问题,小米机器人团队采用异步推理模式——让模型推理与机器人运行脱离同步约束、异步执行。

未经正式授权严禁转载本文,侵权必究。

评论

暂无评论哦,快来评价一下吧!