智谱发布新一代开源模型,极速版最高达到200tokens/秒

今日,智谱发布新一代开源模型GLM-4-32B-0414系列,包含基座、推理、沉思模型权重,并遵循MIT License。目前系列所有模型可以通过“z.ai”访问体验。据介绍,推理模型GLM-Z1-Air/AirX-0414模型推理速度可以做到最高200 Tokens/秒(MaaS平台bigmodel.cn上实测)。(科创板日报)

本文为转载内容,授权事宜请联系原著作权人。

评论

暂无评论哦,快来评价一下吧!