OpenAI将开源SimpleQA新基准,以衡量大模型真实性

当地时间10月30日,美国开放人工智能研究中心(OpenAI)宣布,为了衡量语言模型的真实性,将开源一个名为SimpleQA的新基准。该基准可衡量语言模型回答简短的事实寻求(fact-seeking)问题的能力。

未经正式授权严禁转载本文,侵权必究。

OpenAI

  • AI早报 | 零一万物联创戴宗宏离职创业;宇树科技回应机器狗Go1存在后门漏洞
  • OpenAI聘请Instacart首席执行官担任应用主管,向山姆·奥特曼汇报

评论

暂无评论哦,快来评价一下吧!