Yandex开源大型语言模型训练工具YaFSDP

6月11日消息,跨国科技公司Yandex最近推出了用于训练大型语言模型的开源方法YaFSDP。YaFSDP可用于增强GPU通信并减少LLM训练中的内存使用量,与FSDP相比,其训练速度提升最高可达26%。YaFSDP方法目前已可以在Github上免费访问。

未经正式授权严禁转载本文,侵权必究。

评论

暂无评论哦,快来评价一下吧!