闪电快讯｜百度吴甜：飞桨文心开发者数量已超2185万|界面新闻

5月20日，百度于北京举办AI Day活动，百度集团副总裁吴甜现场分享了最新版文心大模型4.5及深度思考模型X1背后的技术细节。

据她分享，文心大模型4.5是多模态基础大模型，文心4.5 Turbo源自文心4.5，效果更好、成本更低；基于文心4.5 Turbo，文心X1升级到X1 Turbo，在性能提升的同时，实现更先进的思维链，进一步增强问答、创作、逻辑推理、工具调用和多模态能力。

多模态能力方面，文心4.5和4.5 Turbo实现了文本、图像和视频的混合训练。针对不同模态数据在结构、规模、知识密度上的差异，通过多模态异构专家建模、自适应分辨率视觉编码、时空重排列的三维旋转位置编码、自适应模态感知损失计算等技术，提升跨模态学习效率和多模态融合效果，学习效率提高近2倍，多模态理解效果提升超过30%。

在深度思考方面，文心X1、X1 Turbo突破了仅基于思维链优化的范式，在思考路径中结合工具调用，构建了融合思考和行动的复合思维链，旨在使模型输出结果更优。

同时，结合多元统一的奖励机制，文心X1、X1 Turb实现了思考和行动链的端到端优化，大幅提升了跨领域的问题解决能力。

吴甜称，随着大模型的能力进一步拓展、效率进一步提升，可以探索更前瞻、更有想象力的创新应用。

以数字人为例，超拟真数字人需要具备出色的表现力、吸引人的内容、数字人与场景、物品的互动等，综合运用多模态AI技术。为此，百度研制了“剧本”驱动多模协同的超拟真数字人技术，实现了语言、声音、形象的协调一致。

据称目前该技术已经支持超过10万数字人主播，直播转化率达31%，降低80%直播开播成本。

在代码场景上，基于文心大模型的语言和代码能力，百度研制了代码智能体和智能代码助手“文心快码”。百度每天新增的代码中，文心快码生成的代码占比已超过40%。截至目前，文心快码向全社会开放，累计服务760万开发者。

此外，基于飞桨文心在框架模型、框架算力的联合优化，文心4.5 Turbo的训练吞吐已达到文心4.5的5.4倍，推理吞吐达到8倍。

公开数据显示，飞桨文心开发者数量已超过2185万，服务超过67万家企业，创建的模型达到110万。