面壁智能发布基于稀疏-线性混合架构SALA训练9B模型

界面快报 · 来源：界面新闻

2月12日，面壁智能正式发布稀疏-线性注意力混合架构SALA，以及基于该架构的文本模型MiniCPM-SALA，模型仅有9B参数。据介绍，MiniCPM-SALA不使用投机采样等加速算法，在云端推理芯片上，当序列长度为256K词元时推理速度高达Qwen3-8B的3.5倍，并支持在云端芯片和消费级端侧GPU上进行高达一百万词元上下文长度的推理。

未经正式授权严禁转载本文，侵权必究。

暂无评论哦，快来评价一下吧！

反对美国政府对伊朗动武，千人“包围”洛杉矶政府机构大楼
以色列海法炼油厂遭袭起火
东方甄选线下首店4月开业，自营产品约占三分之一
吃到短剧红利的中文在线冲刺港交所，AI能否解决亏损问题？
毛戈平出现重要变化
制造业PMI时隔两月重返荣枯线以上，供需两端均明显改善
AI“闯入”短剧之后
就算霍尔木兹继续关闭也愿结束战争，白宫希望4月6日前与伊朗达成协议
特朗普称即使霍尔木兹海峡仍关闭也愿结束战争
汽车早报｜沃尔沃将负责领克欧洲业务营运事宜东风资管拟增持岚图汽车H股

历史搜索全部删除

热门搜索

面壁智能发布基于稀疏-线性混合架构SALA训练9B模型

评论