2023年的进度条即将耗尽,AI大模型的技术浪潮却并未有消退迹象,甚至在很多细分领域正逐渐落地生根,并开始催生垂类大模型的应用高潮。其中,金融大模型就是一个典型案例。
由于具备丰富的数据与场景,红杉资本全球合伙人沈南鹏早在2017年就曾断言,金融是AI最好的应用场景。当时,包括阿里、腾讯、京东等科技巨头以及奇富科技、度小满等金融机构就已纷纷身各种金融模型的研究,而去年12月ChatGPT的横空出世则成为了金融大模型落地的催化剂。
今年4月份,奇富科技率先下场拥抱技术变革并组建了一级战略部门大模型部,随后,从度小满、马上消费金融等金融科技公司到工行、招行等传统金融机构,大家开始集中跟进。根据腾讯研究院的调研显示,截至7月份,国内参数在10亿以上的大模型达到116个,其中,金融大模型有18个。
狂飙大半年之后,金融大模型逐渐转入实战阶段。12月中旬,作为国内最早探索金融大模型的机构,奇富科技旗下毓数大数据平台在AI推动下迎来重磅升级,并以对齐DataBricks、Snowflake等国际龙头核心技术架构的方式,在计算引擎优化、智能诊断、业务连续性保障上实现行业领先。
对此,奇富科技首席算法科学家费浩峻告诉电厂,在AI真正出现智慧涌现之前,金融大模型都很难独立2C,所以现阶段金融大模型就是一个效率工具,必须依托具体的业务场景才能释放能效。某种程度上来说,现在金融机构就是要用大模型将过去大数据所做的事情再重新做一遍。
只有少数头部公司才能真正玩转金融大模型
从信息化、数据化,再到模型化,每一次技术跃迁都会给金融行业带来效率飞升。
“大模型我们一直在探索,新的技术突破将推动金融大模型进入一个新的发展阶段”,费浩峻指出,现阶段的大模型热背后,ChatGPT是一个重要诱因。今年ChatGPT升级之后,在国内、外的资本和技术市场上的影响都非常大,但纵观大模型在垂直领域的应用,金融业具备天然的优势。
他告诉电厂,大模型最核心的就是数据和算法。相较于其他行业,金融业的信息化进程比较早、信息化纵深也比较广,所以数据储备更为丰富。以奇富科技为例,这家前身为360数科的金融科技公司,除了拥有超2亿的私域用户,还接入了公域流量池,当前在全网的用户设备识别率高达90%。
更重要的是,金融业很早就开始探索大数据的技术应用,并衍生出了智能获客、智能运营、智能风控等全场景的大数据算法。比如,为了挖掘公域流量中的用户行为,奇富科技就依托于大数据打造了Glaucus增长引擎。截至目前,这个增长引擎已迭代到2.0版本,每天能进行400亿次的运算。
从这个意义上来说,金融大模型早已在酝酿之中,而ChatGPT不过是点了一把火。
不过,费浩峻认为,金融大模型也不是人人都能玩得起的游戏。一方面,初期的模型构建需要耗费巨大的资源投入。如果从0到1重新开始的话,仅算力成本可能就会压垮一大波。其中,作为大模型的核心算力部件,英伟达A100芯片的价格在一年内涨了近3倍,“最狠的时候每天都在涨。”
另一方面,金融大模型不是单纯算力、数据和参数规模的比拼,更考验对业务场景的理解。费浩峻举例称,比如百度、360这样的科技巨头,他们有很庞大的算力和数据集,做出来的大模型通用能力都不错,但放到垂直领域可能就不适用了,尤其是金融领域,场景比较复杂、容错率也比较低。
“金融科技公司将是金融大模型落地的第一战场”,他进一步指出,包括奇富科技在内,市面上的主流金融科技公司普遍都有小10年的服务经验,手握几百家合作机构、上亿的用户群,相较于科技巨头更贴近业务场景,数据精度和实战经验也都更胜一筹,而这些对垂直大模型的调优至关重要。
“很多大厂已经逐渐意识到,与金融科技公司合作才是上上之选”,费浩峻告诉电厂,在垂类大模型的训练过程中,“有时候把600T的数据压缩成300T效果可能更好”,因为中间有很多脏乱差的数据,必须在训练前经过多道清洗,如何清洗、整理和配比,这是产业玩家才具备的knowhow。
此外,由于具备大数据的训练基础和应用经验,金融科技公司做金融大模型的成本更低。比如,在模型端,很多玩家都具备训练千亿大模型的能力,但费浩峻表示,大家并不会这么干,因为大多数金融场景的参数量在13B左右,小的可能只要6B、7B,训练一个百亿级别的大模型完全够用了。
“一百多颗芯片就能满足对应的算力需求”,他还强调,过往金融科技公司都有很强的算力基础,每年也在稳定扩充及采购,现在要做的只是一道从N到N+1的加法题。此外,如果想要进一步控制成本的话,还能用市面上科技巨头们淘汰下来的A100、A800芯片,或者直接采取算力租赁的模式。
对于金融大模型的产业生态,费浩峻认为,由于需要海量的数据规模和资源投入,底层通用大模型需要科技巨头们来搭建,然后,头部金融机构再基于他们的通用大模型构建金融大模型,而余下的中小金融机构也无需再去重复造轮子,可以直接基于头部机构的金融大模型去做场景适配。
“业界也有几家大行在联合构建通用大模型,但考虑到业务规模与投入能力,这种做法将是少数”,他告诉电厂,更多的是与奇富科技一样,采用开源的通用大模型。据他透露,奇富内部有一个团队专门负责研究和筛选各种通用大模型,并进行增量预训练,其他团队再基于此去做微调和应用。
“现在通用大模型还在演进之中,我们不想这么早就把基座锁死,所以现阶段会比较累,需要把市面上各个大模型都研究一遍,并从中筛选出通用能力更强、效果更稳定的大模型”,费浩峻称,金融大模型是一个参数相对更小的大模型,所以底层大模型必须要在小参数上也能做得足够出色。
“参数决定了成本与效率”,据他介绍,奇富的金融大模型整体参数量在130亿左右,但并不是每个业务场景都需要这么大的模型参数。比如,同一个场景,会基于内部多个不同参数的模型进行微调和应用,并进行模型效果效能比较,然后从中筛选出最合适的方案,所以每个场景应用的模型参数并不一致。
按照费浩峻的说法,金融业对大数据的挖掘已经很深了,大模型的应用前提是有足够的效率增益。
嫁接业务场景 金融大模型将是一个理想的效率工具
“大模型还是一个未发育的孩子”,费浩峻指出,实际的效率增益取决于两方面,AIGC的技术进化与上层的场景应用。其中,最底层的技术进化要依赖科技巨头们去解决,产业玩家应该将主要精力放在应用层面,并结合实际场景去寻求效率突破,“如果没有场景,大模型可能什么都做不了。”
具体到金融行业,与大数据的应用一样,他认为大模型的落地应该从最外围的获客、运营开始做起。根据费浩峻介绍,这些也是金融行业人力最密集的场景,嫁接大模型可以显著提升运营效率。
比如,过去通话质检需要挨个抽取几百通电话来试听,现在奇富大模型不仅能每天自动巡检,检出率也提升了15%。除此之外,电销、广告、客服也是奇富大模型的应员工重点,其中,广告方面,奇富大约70%的图片素材均是由AIGC生成,并且系统还可自动标注和评级来优化投放效果。
大模型的场景应用和能力泛化不是一蹴而就的过程,需要一个场景一个场景去打磨、迭代和调优。费浩峻电销为例,早期的奇富大模型只能提升2、3个点的转化率,而多次调优之后,现在的转化率可以提升5个点以上,并且通过语义分析和线索挖掘,奇富大模型的线索识别准确率高达98%。
“针对不同的场景,优化方式也不一样”,费浩峻告诉电厂,对于金融大模型来说,最大的挑战在于机器幻觉和合规风险。所谓的机器幻觉,通俗来说就是“一本正经地胡说八道”。他表示,这或许在ChatGPT中还能忍受,但金融行业的容错率较低,所以现在对话场景下,不会让大模型直接2C。
比如在客服问答中,大模型可以通过上下文,迅速判断用户意图并生成上百种话术。其中,奇富曾做过AB组对照实验,发现大模型的优质话术成功率达到70%,远高于人工客服,并且内部也在不断优化大模型的话术生成能力,但这些也是只为了辅助客服,最终的沟通口径还是由人工把控。
此外,为了规避法律风险,所有的内容也会经过人工审核。比如,在广告营销过程中,大模型的应用可以拆解为三个步骤,首先是广告要素的圈定,奇富会在源头上进行合规把控,其次是素材生成后、合规校验与效果评估,这个阶段的合规率已经在90%以上,但最后还要再过一道人工审核。
这也意味着,现阶段的金融大模型并不是一个开箱即用的产品,很难直接向下游的中小机构输出。
“现在的大模型就是一个工具,你不要指望它成为一个端到端的解决方案,这也是为什么我们不担心AI对人的影响,因为它们现在也做不来这些事情”,费浩峻表示,而在公众普遍比较敏感的数据隐私方面,金融业也有比较成熟的解决方案,当前,金融大模型从训练到使用都有合规率围栏。
对于金融大模型的商业化,费浩峻也很乐观,“我们并不是卖给客户一个新产品,而是在原来的大数据服务上做了升级,融入大模型之后,原先的金融服务解决方案都有实际的效果提升。虽然成本也会有所提升,但内部做大模型的时候也有相应的考核,总体算下来投入产出比是远超预期的。”
不过,在金融业最核心的风险控制领域,大模型的应用探索才刚刚开始。费浩峻告诉电厂,“我们不从决策层面上做,先从特征层面上去做,因为这件事情我们觉得一旦有突破,整个大模型衍生的速度就会有很大的幅度提升,但从量变到质变的过程之中,头部公司要有技术追求与投入定力。”
“大模型在风险层的特征抽取上具备一定能力”,费浩峻指出,“我理解对于一些中小金融机构来说可能有些作用,比如,他们可以借助这套大模型快速做出一个7、8分的系统,但我们这样的头部机构都有一个自认为10分的系统,我们也希望借助大模型打败过去的自己,现在来说还很难。”
而在更难的决策层,他认为在AI出现智慧涌现之前,大模型都无法完全替代现有模式。现有的风险控制系统是一套组合拳,中间会有很多不同的能力分层,就像每个公司养了一群金融专家,有高级专家也有低级专家,金融大模型会逐渐从低级专家进化成高级专家,但仍会是众多专家中的一个。
这个进化过程也不会太快,费浩峻预计,理想状态下,最快大约也需要5年,实际可能还会更久。
从获客、运营、风控的三大核心业务场景中,由于很多环节未能打通,金融大模型在未来很长一段时间都很难独立2C,但大模型的发展潜力仍值得期待。根据麦肯锡全球董事合伙人、大中华区AI业务负责人沈愷预计,未来的整个金融生态中,金融大模型的收入贡献度最高将达到5%左右。
评论