ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
金融研报数据魔改Yi-34B & DeepSeek 67B 谁更强? Deepmoney金融大模型魔改方案分享&在线实测
6651点击    2024-02-21 16:49

在微调大型模型的过程中,一个常用的策略是“知识蒸馏”,这意味着借助高性能模型,如GPT-4,来优化性能较低的开源模型。这种方法背后隐含的哲学理念与logos中心论相似,把GPT-4等模型视为更接近唯一的逻辑或真理的存在。


虽然这种方法在许多领域已经证明了其成功(例如Alpaca/Orca等研究),但其在特定的专业领域中效果有限,比如金融学。这是因为通过知识蒸馏得到的模型性能难以超越其原始模型。而像GPT-4这样的模型,其训练和性能与人类反馈紧密相关。在一些尖端领域,如金融学中的有效市场理论与行为金融学的辩论、古典主义与货币主义的争论等,并不存在所谓的“唯一逻辑”,这限制了模型在这些领域的应用。


为了更好地帮助研究人员和投资者作出理性判断,一个理想的金融领域大模型应能理解新闻或数据事件,并能够即时地从主观和量化两个角度对事件进行评估。


制作这样一个模型是Deepmoney项目研究的目标。


在金融投资领域,研报数据在分析和决策过程中起着关键作用。这些报告提供了深入的市场分析、行业趋势、公司财务状况及投资建议,对金融专业人士至关重要。在训练金融模型时,这些数据的深度和广度使其成为理想的训练材料,帮助模型更好地理解复杂的金融概念和市场动态。然而,这些研报中包含大量的数值型图表,这些图表在解释研报的观点和推断中起着核心作用。如果只保留文字内容而忽略这些图表,整个内容往往会显得残缺不全,逻辑混乱。因此,在传统的语言模型训练中,很难充分利用专业研报数据的价值。


机器之心最新一期线上分享邀请到了SOTA!模型社区LLM魔改小组成员,Deepmoney 项目主理人星野源,与大家分享使用金融研报数据魔改开源模型的一手经验,并在直播期间在线对 Yi-34B、DeepSeek-67B等热门开源基座进行魔改的Deepmoney模型版本进行典型案例对比实测及技术分析,进行技术探讨。



分享主题:金融研报数据魔改Yi-34B & DeepSeek 67B 谁更强?


环节1:金融研报数据大模型魔改:以Deepmoney项目为例


- 金融研报地特点和信息丰富性


- 大模型在处理复杂数据方面的潜力和挑战


- 多模态模型在识别和处理研报数据中的应用


- 解构主义视角下的数据分析:不关注中心化论点在数据分析中的优势


- 魔改实操:数据准备、训练过程


环节2:实测分析 + QA 研讨


- 典型场景不同版本魔改模型在线实测推理效果对比分析


- 局限性和可能的改进方向


- 解构主义和大模型在金融领域的未来应用前景


分享嘉宾:星野源,Deepmoney项目主理人;量化金融数据分析工程师


项目链接:

https://sota.jiqizhixin.com/project/deepmoney


文章来自于微信公众号 “机器之心”,作者 “SOTA模型”


AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner

2
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales