# 热门搜索 #
搜索
朱太辉:金融大模型的“破”与“立”
8945点击    2024-06-05 09:59

推动金融大模型高质量发函,关键是要妥善处理好通用模型与专用模型、模型能力与语料输入、模型应用与金融监管三大关系。



近年来,具有庞大参数和复杂结构的大模型快速迭代,模型“涌现”能力凸显,在数据处理能力、问题解决能力、结果可解释性等方面取得重大突破。随着模型的处理速度大幅提升、成本大幅下降,大模型的应用范围开始向各行各业拓展。正因如此,有观点认为,随着大模型时代的到来,“每个行业都可以重新做一遍”。


金融业是数字化、智能化的先行者,也是大模型技术落地的绝佳领域。从对传统金融业务流程的革新,到深度渗透至各金融领域与场景功能(如营销、客服、投顾、风控、研报等),大模型在金融业的应用全景展现了以数据为主线、以场景为导向的数智新业态。但与此同时,金融业作为经营资金和风险的行业,对科技创新应用的稳健性和安全性要求更高。目前大模型技术尚不成熟,在金融行业的应用暗藏风险。推动金融大模型高质量发展,核心在于做好创新与审慎的平衡,关键是要妥善处理好“三大关系”。


一是平衡好通用模型与专用模型协同共生的关系,避免大中小金融之间出现“模型鸿沟”


从当前的发展趋势来看,由于不同类型金融机构、大中小金融机构在技术、人才、资源保障等方面存在较大的差异,大模型赋能金融机构数智化转型应当遵循“通用基础大模型+金融行业大模型+机构专用大模型”共生的模式,避免让大模型成为大中小金融机构数智化转型的“鸿沟”。


首先,需要金融管理部门或者金融行业协会加强统筹协调,整合调用行业内外部的技术能力,建立国家级/行业级大模型训练和推理平台,实现数据、算力的归集和统一调度,作为金融数智化转型的基础设施。在此基础上,有能力、有资源的大型金融机构,可以通过行业大模型训练推出自身的专用大模型(如JP Morgan推出了专用的IndexGPT);而科技资源、能力有限的中小金融机构可以通过金融云、API等方式,直接调用金融行业大模型,或是根据业务落地场景搭建具体的应用小模型。


二是平衡模型能力与语料输入协同共融的关系,避免生产力与生产资料的“圆桶效应”


对大模型应用而言,模型能力属于生产力,语料输入属于生产资料,二者缺一不可。


在模型能力方面,首先需要保证大模型能力的持续“涌现”,逐步解决“一本正经地胡说八道”的模型幻觉等问题;其次,需要提高模型参数的透明度和可解释性,解决好“模型黑箱”问题。此外,还需要关注基于反馈的强化学习模式下(不论是依靠人工反馈的强化学习RLHF还是依靠模型反馈的强化学习RLMF),大模型的使用偏误和模型风险问题。


在语料输入方面,首先需要解决好大模型训练中文语料不足的问题,分级分类推行金融相关的政务数据、管理数据的开放共享,为金融大模型训练持续“喂养”;其次,不断改进输入语料的质量问题,在输入端提高数据的全面性、客观性、及时性;此外,还需要协调做好数据调用与客户授权、隐私保护的平衡。


三是平衡好模型应用与金融监管协同共进的关系,避免监管滞后导致大模型“野蛮生产”


在监管有效性方面,随着金融大模型的应用推广,首先需要坚持“技术中性”(科技创新既可用于金融业务也可用于金融监管),创新与金融大模型发展相适应的监管方式;其次,及时制定针对数据调用、模型训练、模型管理、模型部署等方面的标准指引,让金融大模型创新应用“有章可循”;此外,及时跟进制定或修改金融监管法规,确保监管规制的合理性和完整性。


在监管一致性方面,金融大模型的推广应用存在大量的模型交互、数据交互和应用交互(插件),涉及大量的算法、算力服务输出,需要协同完善信息科技外包监管;其次,金融大模型应用的监管,需要加强与网信部门大模型备案管理的协同;此外,金融大模型应用中的 “数据不动模型动”“原始数据不出域、数据可用不可见”等,需要做好与金融“功能监管、穿透式监管以及征信监管的协调。


处理好以上三大关系,我国金融大模型创新应用有望在“破”“立”之间闯出新路子,成为金融高质量发展的“加速器”。


论文来源:朱太辉,金融大模型的“破”与“立”,《中国农村金融》2024年第10期。


本文来自微信公众号“太辉研究”,作者:朱太辉