记者获悉,微博正式发布首个自研开源大模型Vibe Thinker,这个仅拥有15亿参数的“轻量级选手”,在国际顶级数学竞赛基准测试上击败了参数量是其数百倍的,高达6710亿的DeepSeek R1模型。据悉,VibeThinker单次“后训练”的成本仅7800美元,对比DeepSeek-R1和MiniMax-M1等成本直接降低了几十倍。(澎湃新闻)
热门排行May 22
- 中华人民共和国和俄罗斯联邦关于进一步加强全面战略协作、深化睦邻友好合作的联合声明
- 段永平最新持仓:清仓阿里、新进特斯拉,加仓英伟达、拼多多等
- 伊朗最高领袖下令:接近武器级的铀必须留在国内
- 直通部委|规范涉企行政执法专项行动挽损307亿 今年全国计划招聘特岗教师8954名
- 宏观政策重心或将从“观察期”转向更具针对性的“响应期”|宏观晚6点
- 助力扩内需!商务部透露提振服务消费着力点
- Airbnb为何拒绝做下一个传统OTA?
- 中南大学原校长张尧学被“双开”:助长学术领域不正之风和腐败问题
- 欧委会正制定新贸易工具应对中国“产能过剩”,商务部:坚决反制
- 商务部:中美双方应为双向农产品贸易创造有利条件,推动恢复并不断拓展农产品贸易合作
评论