正在阅读:

科大讯飞星火认知大模型迭代至3.0版本,预计2024年上半年实现对标GPT4

扫一扫下载界面新闻APP

科大讯飞星火认知大模型迭代至3.0版本,预计2024年上半年实现对标GPT4

刘庆峰预计明年大模型生态所带来的商业收益会有明确的财务表现,新增毛利表现会很明显,但是明年与大模型相关的投入也会有所增加。

图片来源:科大讯飞

界面新闻记者 | 于浩

10月24日,科大讯飞正式对外发布了星火认知大模型V3.0。据科大讯飞董事长刘庆峰介绍,相较于2.0版本,星火大模型V3.0在文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力等方面均有提升,分别提升了7%、6%、7%、8%、3%、9%、7%。

在5月6日,科大讯飞首次提出“1+N认知大模型”攻关项目时,曾表示在10月24将完成通用模型对标ChatGPT,中文超越、英文相当。

据OpenAI在官网发布的英文任务测试集测试数据显示,星火认知大模型V3.0在48项任务中与ChatGPT结果相当;而在《通用认知智能大模型评测体系》构建测试集测试中,星火认知大模型V3.0在中文能力测评中在文本生成、语言理解等方面完成了对ChatGPT的能力超越。

刘庆峰坦言,与GPT4相比,目前星火在复杂知识推理、超长文本处理、跨模态的统一理解等方面还有不小的差距。他在现场表示,预计在2024年上半年将会发布星火认知大模型V4.0,届时将会对标GPT4。

在现场演示环节,科大讯飞研究院院长刘聪演示了有声绘本创作助手功能,他以“小兔子去太空”为主题使用星火认知大模型V3.0现场绘制了相关绘本内容。在这一应用案例中,大模型既要保证上下文连续性,还需保证图像内容中主角的一致性,刘聪借此展示了大模型的多模态及多轮对话能力。

在V2.0发布时,刘庆峰就曾强调多轮对话能力是星火认知大模型后续迭代的重点。此次发布会上,刘庆峰进一步表示,在多轮对话能力提升的基础上,星火认知大模型V3.0可以基于数据库进行主动对话,并且进一步进行启发探究式对话。

基于这一能力,科大讯飞推出了AI人设功能,可通过特定知识学习、对话记忆学习等构建起大模型人格。值得一提的是,AI人设功能支持用户自行生成大模型人格,刘聪于发布会前搭建起自身人设,在现场将与女儿的对谈内容输入星火大模型,后者则输出了一封以刘聪口吻写给女儿的信。

据介绍,在以该项能力为基础的讯飞友伴上线后48小时内,有3000个人设产出。“主动交互能力与AI人设是未来迭代的方向。”刘庆峰于发布会上强调。

其次于发布会上被强调的是代码能力。中国有约800万软件从业人员,2022年软件业务收入10.8万亿元,占GDP比重8.93%,2028年预测将达到20万亿元。一方面是软件行业的广阔市场,另一方面是吸引生态开发者的需要,这两方面都使得代码能力成为大模型产品能力迭代的重要方向。

据OpenAI构建的代码生成能力公开测试集HumanEval、认知智能全国重点实验室构建的代码使用场景测试集iFLYCode-Eval测试结果显示,星火V3.0在代码能力上的表现略优于ChatGPT,但仍不及GPT4。

与刘庆峰曾多次强调的“开发者不需要任何编程能力就可以把创意编程产品”的口号相对应,科大讯飞此次发布了智能编程产品iFlyCode V2.0。据科大讯飞内部使用数据,本次升级的iFlyCodeV2.0可在设计阶段提效50%,编码阶段、测试阶段分别可提效37%、44%,自8月15日发布以来该产品已在京东云、软通动力等107家机构实现对接应用。

除对外公布基座大模型的能力提升外,此次科大讯飞还面向金融、汽车、运营商、工业、住建、物业、法律、科研文献、传媒、政务、文旅、水利等12个领域发布了垂直行业大模型。

刘庆峰于后续群访中提及,C端应用更多的作用在于向用户普及大模型技术,如教育、医疗、工业、科研等领域才是目前真正产生商业化的刚需领域。

据Gartner数据显示,目前全球有5%的企业在使用生成式AI,但到2026年这一比例将来到80%。“这需要一个过程,”刘庆峰解释称,讯飞会先从行业通用能力做起,并且与行业龙头企业一同做好纵深,再把应用向全行业推广。

无论是强调代码能力提升、搭建C端应用,还是推出垂直行业大模型,科大讯飞都展现出了围绕星火认知大模型构建生态的野心。

从刘庆峰所披露的数据来看,星火大模型对于讯飞开发者生态的扩展还是起到了一定积极作用。刘庆峰介绍,与讯飞星火大模型直接相关的活跃用户数已达1200万;讯飞星火生态开发者团队总数为552.8万,5月6日以来新增143.4万,同比增幅331%,其中有17.8万新增大模型开发者。

软件之外,科大讯飞也在逐步聚焦硬件生态。7月,科大讯飞曾回应投资者提问称,讯飞机器人超脑平台AIBOT已经正式接入星火认知大模型。在此次分享中,刘庆峰表示,星火大模型使得人形机器人对复杂任务的拆解、开放场景的物体寻找能力明显提升,“下一步我们将以人形机器人为牵引,来推动‘视觉-语言-动作’多模态具身大模型。”刘庆峰说。

与华为昇腾的合作也有新进展。会上科大讯飞联合华为发布了基于昇腾生态的“飞星一号” 平台。自主可控的算力搭建直接影响到星火认知大模型的迭代进度。在三季度业绩交流会上,科大讯飞董秘曾表示,算力资源曾一度限制星火大模型的参数量级,但随着华为昇腾等国产算力平台能力提升,这一问题已得到解决。刘庆峰也于群访中提及,未来星火认知大模型V4.0将会全部在华为算力平台上进行训练。

在上午发布星火认知大模型V3.0及相关应用后,科大讯飞股价却于午后一度触及跌停,从日前发布的第三季度财报表现来看,受对于通用人工智能认知大模型的投入影响,科大讯飞三季度营收毛利均微增,但净利润同比下降明显。

针对外界关注的通用大模型生态财务回报的话题,刘庆峰回应称,星火认知大模型仍会免费对外开放,目前的重点仍是把各个场景做深,他预计明年大模型生态所带来的商业收益会有明确的财务表现,新增毛利表现会很明显,但是明年与大模型相关的投入也会有所增加。这也意味着科大讯飞在净利润端的表现是否会有回升仍有待观察。

未经正式授权严禁转载本文,侵权必究。

评论

暂无评论哦,快来评价一下吧!

下载界面新闻

微信公众号

微博

科大讯飞星火认知大模型迭代至3.0版本,预计2024年上半年实现对标GPT4

刘庆峰预计明年大模型生态所带来的商业收益会有明确的财务表现,新增毛利表现会很明显,但是明年与大模型相关的投入也会有所增加。

图片来源:科大讯飞

界面新闻记者 | 于浩

10月24日,科大讯飞正式对外发布了星火认知大模型V3.0。据科大讯飞董事长刘庆峰介绍,相较于2.0版本,星火大模型V3.0在文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力等方面均有提升,分别提升了7%、6%、7%、8%、3%、9%、7%。

在5月6日,科大讯飞首次提出“1+N认知大模型”攻关项目时,曾表示在10月24将完成通用模型对标ChatGPT,中文超越、英文相当。

据OpenAI在官网发布的英文任务测试集测试数据显示,星火认知大模型V3.0在48项任务中与ChatGPT结果相当;而在《通用认知智能大模型评测体系》构建测试集测试中,星火认知大模型V3.0在中文能力测评中在文本生成、语言理解等方面完成了对ChatGPT的能力超越。

刘庆峰坦言,与GPT4相比,目前星火在复杂知识推理、超长文本处理、跨模态的统一理解等方面还有不小的差距。他在现场表示,预计在2024年上半年将会发布星火认知大模型V4.0,届时将会对标GPT4。

在现场演示环节,科大讯飞研究院院长刘聪演示了有声绘本创作助手功能,他以“小兔子去太空”为主题使用星火认知大模型V3.0现场绘制了相关绘本内容。在这一应用案例中,大模型既要保证上下文连续性,还需保证图像内容中主角的一致性,刘聪借此展示了大模型的多模态及多轮对话能力。

在V2.0发布时,刘庆峰就曾强调多轮对话能力是星火认知大模型后续迭代的重点。此次发布会上,刘庆峰进一步表示,在多轮对话能力提升的基础上,星火认知大模型V3.0可以基于数据库进行主动对话,并且进一步进行启发探究式对话。

基于这一能力,科大讯飞推出了AI人设功能,可通过特定知识学习、对话记忆学习等构建起大模型人格。值得一提的是,AI人设功能支持用户自行生成大模型人格,刘聪于发布会前搭建起自身人设,在现场将与女儿的对谈内容输入星火大模型,后者则输出了一封以刘聪口吻写给女儿的信。

据介绍,在以该项能力为基础的讯飞友伴上线后48小时内,有3000个人设产出。“主动交互能力与AI人设是未来迭代的方向。”刘庆峰于发布会上强调。

其次于发布会上被强调的是代码能力。中国有约800万软件从业人员,2022年软件业务收入10.8万亿元,占GDP比重8.93%,2028年预测将达到20万亿元。一方面是软件行业的广阔市场,另一方面是吸引生态开发者的需要,这两方面都使得代码能力成为大模型产品能力迭代的重要方向。

据OpenAI构建的代码生成能力公开测试集HumanEval、认知智能全国重点实验室构建的代码使用场景测试集iFLYCode-Eval测试结果显示,星火V3.0在代码能力上的表现略优于ChatGPT,但仍不及GPT4。

与刘庆峰曾多次强调的“开发者不需要任何编程能力就可以把创意编程产品”的口号相对应,科大讯飞此次发布了智能编程产品iFlyCode V2.0。据科大讯飞内部使用数据,本次升级的iFlyCodeV2.0可在设计阶段提效50%,编码阶段、测试阶段分别可提效37%、44%,自8月15日发布以来该产品已在京东云、软通动力等107家机构实现对接应用。

除对外公布基座大模型的能力提升外,此次科大讯飞还面向金融、汽车、运营商、工业、住建、物业、法律、科研文献、传媒、政务、文旅、水利等12个领域发布了垂直行业大模型。

刘庆峰于后续群访中提及,C端应用更多的作用在于向用户普及大模型技术,如教育、医疗、工业、科研等领域才是目前真正产生商业化的刚需领域。

据Gartner数据显示,目前全球有5%的企业在使用生成式AI,但到2026年这一比例将来到80%。“这需要一个过程,”刘庆峰解释称,讯飞会先从行业通用能力做起,并且与行业龙头企业一同做好纵深,再把应用向全行业推广。

无论是强调代码能力提升、搭建C端应用,还是推出垂直行业大模型,科大讯飞都展现出了围绕星火认知大模型构建生态的野心。

从刘庆峰所披露的数据来看,星火大模型对于讯飞开发者生态的扩展还是起到了一定积极作用。刘庆峰介绍,与讯飞星火大模型直接相关的活跃用户数已达1200万;讯飞星火生态开发者团队总数为552.8万,5月6日以来新增143.4万,同比增幅331%,其中有17.8万新增大模型开发者。

软件之外,科大讯飞也在逐步聚焦硬件生态。7月,科大讯飞曾回应投资者提问称,讯飞机器人超脑平台AIBOT已经正式接入星火认知大模型。在此次分享中,刘庆峰表示,星火大模型使得人形机器人对复杂任务的拆解、开放场景的物体寻找能力明显提升,“下一步我们将以人形机器人为牵引,来推动‘视觉-语言-动作’多模态具身大模型。”刘庆峰说。

与华为昇腾的合作也有新进展。会上科大讯飞联合华为发布了基于昇腾生态的“飞星一号” 平台。自主可控的算力搭建直接影响到星火认知大模型的迭代进度。在三季度业绩交流会上,科大讯飞董秘曾表示,算力资源曾一度限制星火大模型的参数量级,但随着华为昇腾等国产算力平台能力提升,这一问题已得到解决。刘庆峰也于群访中提及,未来星火认知大模型V4.0将会全部在华为算力平台上进行训练。

在上午发布星火认知大模型V3.0及相关应用后,科大讯飞股价却于午后一度触及跌停,从日前发布的第三季度财报表现来看,受对于通用人工智能认知大模型的投入影响,科大讯飞三季度营收毛利均微增,但净利润同比下降明显。

针对外界关注的通用大模型生态财务回报的话题,刘庆峰回应称,星火认知大模型仍会免费对外开放,目前的重点仍是把各个场景做深,他预计明年大模型生态所带来的商业收益会有明确的财务表现,新增毛利表现会很明显,但是明年与大模型相关的投入也会有所增加。这也意味着科大讯飞在净利润端的表现是否会有回升仍有待观察。

未经正式授权严禁转载本文,侵权必究。