昇腾超节点系列产品全面支持DeepSeek V4

424日,DeepSeek V4-ProDeepSeek V4-Flash正式发布并开源,模型上下文处理长度由原有的128K显著扩展至1M,首次增加了KV Cache滑窗和压缩算法,大幅减少Attention计算和访存开销,并通过模型架构创新更好地支持了AgentCoding场景。昇腾同步支持DeepSeek系列模型,本次通过双方芯模技术紧密协同,实现昇腾超节点全系列产品支持DeepSeek V4系列模型。

未经正式授权严禁转载本文,侵权必究。

评论

暂无评论哦,快来评价一下吧!