正在阅读:

全面回击谷歌!OpenAI正式推出专业知识工作大模型GPT-5.2

扫一扫下载界面新闻APP

全面回击谷歌!OpenAI正式推出专业知识工作大模型GPT-5.2

OpenAI表示,GPT-5.2是迄今为止在“专业知识工作方面”表现最好的模型。

图片来源:视觉中国

当地时间12月11日,OpenAI正式发布其最新模型GPT-5.2,这是在谷歌Gemini 3强势挑战下的一次全面回击。新模型GPT-5.2聚焦专业工作场景优化,在编程、科学任务、长文档处理等核心能力上实现显著提升。OpenAI表示,GPT-5.2是迄今为止在“专业知识工作方面”表现最好的模型,速度更快、信息检索更精准,在写作与翻译方面也有显著改善。

GPT‑5.2对比GPT‑5.1

GPT‑5.2包含Instant、Thinking、Pro三个版本,即日起将面向ChatGPT付费用户陆续推出。GPT‑5.2定价为1.75美元/百万输入tokens和14美元/百万输出tokens。

GPT-5.2的核心优势体现在专业化任务的精准优化上。根据OpenAI官方数据,新模型在多项基准测试中刷新纪录。在评估44个职业知识型任务的GDPval测试中,该模型成为首个总体表现达到或超过人类专家水平的AI模型,70.9%的任务表现与行业专家持平或胜出,且完成速度是人类专家的11倍以上,综合成本不足专家的1%。

GPT-5.2的GDPval测试结果

在长文本处理与视觉理解两大关键能力上。OpenAI MRCRv2基准测试显示,GPT-5.2在25.6万token的超长上下文范围内,针对多文档信息整合任务的准确率接近100%,尤其在需要区分多个相似信息点的测试中表现优异,特别适合深度文档分析与多源信息整合。

视觉处理方面,GPT-5.2 Thinking被官方称为 “当前最强视觉模型”,图表推理与软件界面理解的错误率较前代降低约50%,能够精准解读数据仪表盘、技术图纸、可视化报告等专业视觉内容,适配金融运营、工程设计、客户服务等以视觉信息为核心的工作场景。

GPT-5.2和GPT-5.1视觉处理对比

相较于GPT-5.1,新模型的 “幻觉率” 显著降低,在专业知识密集型场景中可信度大幅提升。即使将推理强度设置为最低档,GPT-5.2的综合表现仍显著优于GPT-5.1和GPT-4.1。

OpenAI此次推出GPT-5.2,以专业知识工作为切入点,希望吸引更多企业客户并提升营收,以支撑其未来数十年超过1万亿美元的基础设施投资计划。

今年8月,OpenAI推出备受期待的GPT-5,因图表乌龙、专业知识短板及功能优化不及预期遭质疑,11月紧急迭代的GPT-5.1虽有小幅改进,仍未扭转局面。随后谷歌在11月推出了Gemini 3大模型,凭借多模态、长文本处理等优势强势突围。

面对来自谷歌的竞争,OpenAI CEO山姆・奥特曼回应称 “Gemini 3影响低于预期”,并透露公司当前的 “红色警戒模式” 将于明年1月前结束,届时将集中资源优化核心能力,以强势姿态回归市场。

未经正式授权严禁转载本文,侵权必究。

OpenAI

  • OpenAI发布GPT最新升级版本GPT-5.2
  • 迪士尼将对OpenAI进行10亿美元股权投资

评论

暂无评论哦,快来评价一下吧!

下载界面新闻

微信公众号

微博

全面回击谷歌!OpenAI正式推出专业知识工作大模型GPT-5.2

OpenAI表示,GPT-5.2是迄今为止在“专业知识工作方面”表现最好的模型。

图片来源:视觉中国

当地时间12月11日,OpenAI正式发布其最新模型GPT-5.2,这是在谷歌Gemini 3强势挑战下的一次全面回击。新模型GPT-5.2聚焦专业工作场景优化,在编程、科学任务、长文档处理等核心能力上实现显著提升。OpenAI表示,GPT-5.2是迄今为止在“专业知识工作方面”表现最好的模型,速度更快、信息检索更精准,在写作与翻译方面也有显著改善。

GPT‑5.2对比GPT‑5.1

GPT‑5.2包含Instant、Thinking、Pro三个版本,即日起将面向ChatGPT付费用户陆续推出。GPT‑5.2定价为1.75美元/百万输入tokens和14美元/百万输出tokens。

GPT-5.2的核心优势体现在专业化任务的精准优化上。根据OpenAI官方数据,新模型在多项基准测试中刷新纪录。在评估44个职业知识型任务的GDPval测试中,该模型成为首个总体表现达到或超过人类专家水平的AI模型,70.9%的任务表现与行业专家持平或胜出,且完成速度是人类专家的11倍以上,综合成本不足专家的1%。

GPT-5.2的GDPval测试结果

在长文本处理与视觉理解两大关键能力上。OpenAI MRCRv2基准测试显示,GPT-5.2在25.6万token的超长上下文范围内,针对多文档信息整合任务的准确率接近100%,尤其在需要区分多个相似信息点的测试中表现优异,特别适合深度文档分析与多源信息整合。

视觉处理方面,GPT-5.2 Thinking被官方称为 “当前最强视觉模型”,图表推理与软件界面理解的错误率较前代降低约50%,能够精准解读数据仪表盘、技术图纸、可视化报告等专业视觉内容,适配金融运营、工程设计、客户服务等以视觉信息为核心的工作场景。

GPT-5.2和GPT-5.1视觉处理对比

相较于GPT-5.1,新模型的 “幻觉率” 显著降低,在专业知识密集型场景中可信度大幅提升。即使将推理强度设置为最低档,GPT-5.2的综合表现仍显著优于GPT-5.1和GPT-4.1。

OpenAI此次推出GPT-5.2,以专业知识工作为切入点,希望吸引更多企业客户并提升营收,以支撑其未来数十年超过1万亿美元的基础设施投资计划。

今年8月,OpenAI推出备受期待的GPT-5,因图表乌龙、专业知识短板及功能优化不及预期遭质疑,11月紧急迭代的GPT-5.1虽有小幅改进,仍未扭转局面。随后谷歌在11月推出了Gemini 3大模型,凭借多模态、长文本处理等优势强势突围。

面对来自谷歌的竞争,OpenAI CEO山姆・奥特曼回应称 “Gemini 3影响低于预期”,并透露公司当前的 “红色警戒模式” 将于明年1月前结束,届时将集中资源优化核心能力,以强势姿态回归市场。

未经正式授权严禁转载本文,侵权必究。