360智脑推出Light-IF系列模型

8月12日,360智脑团队宣布提出新的Light‑IF框架,以预览‑自检式推理和信息熵控制为核心,提升模型在复杂指令上的遵循度。Light‑IF框架包括五个关键环节:难度感知指令生成、Zero-RL强化学习、推理模式提取与过滤、熵保持监督冷启动、熵自适应正则强化学习。Light-IF-32B/14B/8B/4B/1.7B全系模型将陆续在Hugging Face开放。

未经正式授权严禁转载本文,侵权必究。

奇虎360

3.3k
  • 三六零:上半年归母净利润亏损2.82亿元
  • 继“火烈鸟”后,乌克兰再公开新型远程“海王星”导弹

评论

暂无评论哦,快来评价一下吧!