ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
朱太辉:金融大模型的“破”与“立”
9063点击    2024-06-05 09:59

推动金融大模型高质量发函,关键是要妥善处理好通用模型与专用模型、模型能力与语料输入、模型应用与金融监管三大关系。



近年来,具有庞大参数和复杂结构的大模型快速迭代,模型“涌现”能力凸显,在数据处理能力、问题解决能力、结果可解释性等方面取得重大突破。随着模型的处理速度大幅提升、成本大幅下降,大模型的应用范围开始向各行各业拓展。正因如此,有观点认为,随着大模型时代的到来,“每个行业都可以重新做一遍”。


金融业是数字化、智能化的先行者,也是大模型技术落地的绝佳领域。从对传统金融业务流程的革新,到深度渗透至各金融领域与场景功能(如营销、客服、投顾、风控、研报等),大模型在金融业的应用全景展现了以数据为主线、以场景为导向的数智新业态。但与此同时,金融业作为经营资金和风险的行业,对科技创新应用的稳健性和安全性要求更高。目前大模型技术尚不成熟,在金融行业的应用暗藏风险。推动金融大模型高质量发展,核心在于做好创新与审慎的平衡,关键是要妥善处理好“三大关系”。


一是平衡好通用模型与专用模型协同共生的关系,避免大中小金融之间出现“模型鸿沟”


从当前的发展趋势来看,由于不同类型金融机构、大中小金融机构在技术、人才、资源保障等方面存在较大的差异,大模型赋能金融机构数智化转型应当遵循“通用基础大模型+金融行业大模型+机构专用大模型”共生的模式,避免让大模型成为大中小金融机构数智化转型的“鸿沟”。


首先,需要金融管理部门或者金融行业协会加强统筹协调,整合调用行业内外部的技术能力,建立国家级/行业级大模型训练和推理平台,实现数据、算力的归集和统一调度,作为金融数智化转型的基础设施。在此基础上,有能力、有资源的大型金融机构,可以通过行业大模型训练推出自身的专用大模型(如JP Morgan推出了专用的IndexGPT);而科技资源、能力有限的中小金融机构可以通过金融云、API等方式,直接调用金融行业大模型,或是根据业务落地场景搭建具体的应用小模型。


二是平衡模型能力与语料输入协同共融的关系,避免生产力与生产资料的“圆桶效应”


对大模型应用而言,模型能力属于生产力,语料输入属于生产资料,二者缺一不可。


在模型能力方面,首先需要保证大模型能力的持续“涌现”,逐步解决“一本正经地胡说八道”的模型幻觉等问题;其次,需要提高模型参数的透明度和可解释性,解决好“模型黑箱”问题。此外,还需要关注基于反馈的强化学习模式下(不论是依靠人工反馈的强化学习RLHF还是依靠模型反馈的强化学习RLMF),大模型的使用偏误和模型风险问题。


在语料输入方面,首先需要解决好大模型训练中文语料不足的问题,分级分类推行金融相关的政务数据、管理数据的开放共享,为金融大模型训练持续“喂养”;其次,不断改进输入语料的质量问题,在输入端提高数据的全面性、客观性、及时性;此外,还需要协调做好数据调用与客户授权、隐私保护的平衡。


三是平衡好模型应用与金融监管协同共进的关系,避免监管滞后导致大模型“野蛮生产”


在监管有效性方面,随着金融大模型的应用推广,首先需要坚持“技术中性”(科技创新既可用于金融业务也可用于金融监管),创新与金融大模型发展相适应的监管方式;其次,及时制定针对数据调用、模型训练、模型管理、模型部署等方面的标准指引,让金融大模型创新应用“有章可循”;此外,及时跟进制定或修改金融监管法规,确保监管规制的合理性和完整性。


在监管一致性方面,金融大模型的推广应用存在大量的模型交互、数据交互和应用交互(插件),涉及大量的算法、算力服务输出,需要协同完善信息科技外包监管;其次,金融大模型应用的监管,需要加强与网信部门大模型备案管理的协同;此外,金融大模型应用中的 “数据不动模型动”“原始数据不出域、数据可用不可见”等,需要做好与金融“功能监管、穿透式监管以及征信监管的协调。


处理好以上三大关系,我国金融大模型创新应用有望在“破”“立”之间闯出新路子,成为金融高质量发展的“加速器”。


论文来源:朱太辉,金融大模型的“破”与“立”,《中国农村金融》2024年第10期。


本文来自微信公众号“太辉研究”,作者:朱太辉