科大讯飞星火认知大模型迭代至3.0版本，预计2024年上半年实现对标GPT4|界面新闻

界面新闻记者 | 于浩

10月24日，科大讯飞正式对外发布了星火认知大模型V3.0。据科大讯飞董事长刘庆峰介绍，相较于2.0版本，星火大模型V3.0在文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力等方面均有提升，分别提升了7%、6%、7%、8%、3%、9%、7%。

在5月6日，科大讯飞首次提出“1+N认知大模型”攻关项目时，曾表示在10月24将完成通用模型对标ChatGPT，中文超越、英文相当。

据OpenAI在官网发布的英文任务测试集测试数据显示，星火认知大模型V3.0在48项任务中与ChatGPT结果相当；而在《通用认知智能大模型评测体系》构建测试集测试中，星火认知大模型V3.0在中文能力测评中在文本生成、语言理解等方面完成了对ChatGPT的能力超越。

刘庆峰坦言，与GPT4相比，目前星火在复杂知识推理、超长文本处理、跨模态的统一理解等方面还有不小的差距。他在现场表示，预计在2024年上半年将会发布星火认知大模型V4.0，届时将会对标GPT4。

在现场演示环节，科大讯飞研究院院长刘聪演示了有声绘本创作助手功能，他以“小兔子去太空”为主题使用星火认知大模型V3.0现场绘制了相关绘本内容。在这一应用案例中，大模型既要保证上下文连续性，还需保证图像内容中主角的一致性，刘聪借此展示了大模型的多模态及多轮对话能力。

在V2.0发布时，刘庆峰就曾强调多轮对话能力是星火认知大模型后续迭代的重点。此次发布会上，刘庆峰进一步表示，在多轮对话能力提升的基础上，星火认知大模型V3.0可以基于数据库进行主动对话，并且进一步进行启发探究式对话。

基于这一能力，科大讯飞推出了AI人设功能，可通过特定知识学习、对话记忆学习等构建起大模型人格。值得一提的是，AI人设功能支持用户自行生成大模型人格，刘聪于发布会前搭建起自身人设，在现场将与女儿的对谈内容输入星火大模型，后者则输出了一封以刘聪口吻写给女儿的信。

据介绍，在以该项能力为基础的讯飞友伴上线后48小时内，有3000个人设产出。“主动交互能力与AI人设是未来迭代的方向。”刘庆峰于发布会上强调。

其次于发布会上被强调的是代码能力。中国有约800万软件从业人员，2022年软件业务收入10.8万亿元，占GDP比重8.93%，2028年预测将达到20万亿元。一方面是软件行业的广阔市场，另一方面是吸引生态开发者的需要，这两方面都使得代码能力成为大模型产品能力迭代的重要方向。

据OpenAI构建的代码生成能力公开测试集HumanEval、认知智能全国重点实验室构建的代码使用场景测试集iFLYCode-Eval测试结果显示，星火V3.0在代码能力上的表现略优于ChatGPT，但仍不及GPT4。

与刘庆峰曾多次强调的“开发者不需要任何编程能力就可以把创意编程产品”的口号相对应，科大讯飞此次发布了智能编程产品iFlyCode V2.0。据科大讯飞内部使用数据，本次升级的iFlyCodeV2.0可在设计阶段提效50%，编码阶段、测试阶段分别可提效37%、44%，自8月15日发布以来该产品已在京东云、软通动力等107家机构实现对接应用。

除对外公布基座大模型的能力提升外，此次科大讯飞还面向金融、汽车、运营商、工业、住建、物业、法律、科研文献、传媒、政务、文旅、水利等12个领域发布了垂直行业大模型。

刘庆峰于后续群访中提及，C端应用更多的作用在于向用户普及大模型技术，如教育、医疗、工业、科研等领域才是目前真正产生商业化的刚需领域。

据Gartner数据显示，目前全球有5%的企业在使用生成式AI，但到2026年这一比例将来到80%。“这需要一个过程，”刘庆峰解释称，讯飞会先从行业通用能力做起，并且与行业龙头企业一同做好纵深，再把应用向全行业推广。

无论是强调代码能力提升、搭建C端应用，还是推出垂直行业大模型，科大讯飞都展现出了围绕星火认知大模型构建生态的野心。

从刘庆峰所披露的数据来看，星火大模型对于讯飞开发者生态的扩展还是起到了一定积极作用。刘庆峰介绍，与讯飞星火大模型直接相关的活跃用户数已达1200万；讯飞星火生态开发者团队总数为552.8万，5月6日以来新增143.4万，同比增幅331%，其中有17.8万新增大模型开发者。

软件之外，科大讯飞也在逐步聚焦硬件生态。7月，科大讯飞曾回应投资者提问称，讯飞机器人超脑平台AIBOT已经正式接入星火认知大模型。在此次分享中，刘庆峰表示，星火大模型使得人形机器人对复杂任务的拆解、开放场景的物体寻找能力明显提升，“下一步我们将以人形机器人为牵引，来推动‘视觉-语言-动作’多模态具身大模型。”刘庆峰说。

与华为昇腾的合作也有新进展。会上科大讯飞联合华为发布了基于昇腾生态的“飞星一号” 平台。自主可控的算力搭建直接影响到星火认知大模型的迭代进度。在三季度业绩交流会上，科大讯飞董秘曾表示，算力资源曾一度限制星火大模型的参数量级，但随着华为昇腾等国产算力平台能力提升，这一问题已得到解决。刘庆峰也于群访中提及，未来星火认知大模型V4.0将会全部在华为算力平台上进行训练。

在上午发布星火认知大模型V3.0及相关应用后，科大讯飞股价却于午后一度触及跌停，从日前发布的第三季度财报表现来看，受对于通用人工智能认知大模型的投入影响，科大讯飞三季度营收毛利均微增，但净利润同比下降明显。

针对外界关注的通用大模型生态财务回报的话题，刘庆峰回应称，星火认知大模型仍会免费对外开放，目前的重点仍是把各个场景做深，他预计明年大模型生态所带来的商业收益会有明确的财务表现，新增毛利表现会很明显，但是明年与大模型相关的投入也会有所增加。这也意味着科大讯飞在净利润端的表现是否会有回升仍有待观察。

界面新闻记者 | 于浩

在5月6日，科大讯飞首次提出“1+N认知大模型”攻关项目时，曾表示在10月24将完成通用模型对标ChatGPT，中文超越、英文相当。

据介绍，在以该项能力为基础的讯飞友伴上线后48小时内，有3000个人设产出。“主动交互能力与AI人设是未来迭代的方向。”刘庆峰于发布会上强调。

刘庆峰于后续群访中提及，C端应用更多的作用在于向用户普及大模型技术，如教育、医疗、工业、科研等领域才是目前真正产生商业化的刚需领域。

无论是强调代码能力提升、搭建C端应用，还是推出垂直行业大模型，科大讯飞都展现出了围绕星火认知大模型构建生态的野心。

历史搜索全部删除

热门搜索

科大讯飞星火认知大模型迭代至3.0版本，预计2024年上半年实现对标GPT4

评论

科大讯飞星火认知大模型迭代至3.0版本，预计2024年上半年实现对标GPT4