朱太辉：金融大模型的“破”与“立”

11596点击 2024-06-05 09:59

推动金融大模型高质量发函，关键是要妥善处理好通用模型与专用模型、模型能力与语料输入、模型应用与金融监管三大关系。

朱太辉：金融大模型的“破”与“立”

近年来，具有庞大参数和复杂结构的大模型快速迭代，模型“涌现”能力凸显，在数据处理能力、问题解决能力、结果可解释性等方面取得重大突破。随着模型的处理速度大幅提升、成本大幅下降，大模型的应用范围开始向各行各业拓展。正因如此，有观点认为，随着大模型时代的到来，“每个行业都可以重新做一遍”。

金融业是数字化、智能化的先行者，也是大模型技术落地的绝佳领域。从对传统金融业务流程的革新，到深度渗透至各金融领域与场景功能（如营销、客服、投顾、风控、研报等），大模型在金融业的应用全景展现了以数据为主线、以场景为导向的数智新业态。但与此同时，金融业作为经营资金和风险的行业，对科技创新应用的稳健性和安全性要求更高。目前大模型技术尚不成熟，在金融行业的应用暗藏风险。推动金融大模型高质量发展，核心在于做好创新与审慎的平衡，关键是要妥善处理好“三大关系”。

一是平衡好通用模型与专用模型协同共生的关系，避免大中小金融之间出现“模型鸿沟”

从当前的发展趋势来看，由于不同类型金融机构、大中小金融机构在技术、人才、资源保障等方面存在较大的差异，大模型赋能金融机构数智化转型应当遵循“通用基础大模型+金融行业大模型+机构专用大模型”共生的模式，避免让大模型成为大中小金融机构数智化转型的“鸿沟”。

首先，需要金融管理部门或者金融行业协会加强统筹协调，整合调用行业内外部的技术能力，建立国家级/行业级大模型训练和推理平台，实现数据、算力的归集和统一调度，作为金融数智化转型的基础设施。在此基础上，有能力、有资源的大型金融机构，可以通过行业大模型训练推出自身的专用大模型（如JP Morgan推出了专用的IndexGPT）；而科技资源、能力有限的中小金融机构可以通过金融云、API等方式，直接调用金融行业大模型，或是根据业务落地场景搭建具体的应用小模型。

二是平衡模型能力与语料输入协同共融的关系，避免生产力与生产资料的“圆桶效应”

对大模型应用而言，模型能力属于生产力，语料输入属于生产资料，二者缺一不可。

在模型能力方面，首先需要保证大模型能力的持续“涌现”，逐步解决“一本正经地胡说八道”的模型幻觉等问题；其次，需要提高模型参数的透明度和可解释性，解决好“模型黑箱”问题。此外，还需要关注基于反馈的强化学习模式下（不论是依靠人工反馈的强化学习RLHF还是依靠模型反馈的强化学习RLMF），大模型的使用偏误和模型风险问题。

在语料输入方面，首先需要解决好大模型训练中文语料不足的问题，分级分类推行金融相关的政务数据、管理数据的开放共享，为金融大模型训练持续“喂养”；其次，不断改进输入语料的质量问题，在输入端提高数据的全面性、客观性、及时性；此外，还需要协调做好数据调用与客户授权、隐私保护的平衡。

三是平衡好模型应用与金融监管协同共进的关系，避免监管滞后导致大模型“野蛮生产”

在监管有效性方面，随着金融大模型的应用推广，首先需要坚持“技术中性”（科技创新既可用于金融业务也可用于金融监管），创新与金融大模型发展相适应的监管方式；其次，及时制定针对数据调用、模型训练、模型管理、模型部署等方面的标准指引，让金融大模型创新应用“有章可循”；此外，及时跟进制定或修改金融监管法规，确保监管规制的合理性和完整性。

在监管一致性方面，金融大模型的推广应用存在大量的模型交互、数据交互和应用交互（插件），涉及大量的算法、算力服务输出，需要协同完善信息科技外包监管；其次，金融大模型应用的监管，需要加强与网信部门大模型备案管理的协同；此外，金融大模型应用中的 “数据不动模型动”“原始数据不出域、数据可用不可见”等，需要做好与金融“功能监管、穿透式监管以及征信监管的协调。

处理好以上三大关系，我国金融大模型创新应用有望在“破”“立”之间闯出新路子，成为金融高质量发展的“加速器”。

论文来源：朱太辉，金融大模型的“破”与“立”，《中国农村金融》2024年第10期。

本文来自微信公众号“太辉研究”，作者：朱太辉

朱太辉：金融大模型的“破”与“立”

关键词: AI , 金融AI , 金融大模型 , 金融人工智能