字节跳动豆包大模型团队正式开源首个多语言类SWE数据集

界面快报 · 来源：界面新闻

4月10日，字节跳动豆包大模型团队正式开源首个多语言类 SWE 数据集——Multi-SWE-bench，可用于评估和提升大模型“自动修 Bug”能力。在 SWE-bench 基础上，Multi-SWE-bench 首次覆盖 Python 之外的 7 种主流编程语言，是真正面向“全栈工程”的评测基准。其数据均来自 GitHub issue，历时近一年构建，以尽可能准确测评和提高大模型高阶编程智能水平。

未经正式授权严禁转载本文，侵权必究。

暂无评论哦，快来评价一下吧！

AI之争又打成了奶茶大战
外交部发言人就巴基斯坦首都伊斯兰堡发生严重爆炸事件答记者问
泽连斯基：美方提议在迈阿密举行俄乌会谈，乌方已同意
中央一号文件解读｜严防“大棚房”问题反弹回潮，常态化整治高压不减
汽车早报｜一汽-大众召回超20万辆国产奥迪Q2L汽车特斯拉中国AI训练中心已投入使用
伊朗外长：本轮美伊磋商是“良好开端”，双方同意继续谈判
美伊核谈判最新进展：双方就“保持对话”达成共识，具体条款仍有博弈
伊美阿曼谈判“暂时”结束
支持重大项目建设、推动民间投资，国常会重磅部署扩投资
直通部委｜预制菜国家标准今日征求意见全国实现生育津贴直接发放个人

历史搜索全部删除

热门搜索

字节跳动豆包大模型团队正式开源首个多语言类SWE数据集

评论