# 热门搜索 #
搜索
国家天文台开源StarWhisper天文大模型,探索科普和科学中的多模态与工具学习
6884点击    2023-10-17 09:50

中国科学院国家天文台银河系三维结构团组最近在wisemodel.cn社区开源的星语StarWhisper天文大模型,通过专家标注的天文物理语料微调、逻辑性长文本训练、直接偏好优化等显著提升了模型的推理逻辑性与完整性。在甲骨易AI研究院与LanguageX AI Lab联合发布的CG-Eval上达到总排名第二,仅低于GPT-4,数学推理和天文能力接近或超过GPT 3.5 Turbo。星语大模型系列(包括StarGLM)将陆续开源在wisemodel.cn社区平台,欢迎大家注册使用。


模型地址:

https://wisemodel.cn/models/LiYuYang/StarWhisper


模型展示:

https://github.com/Yu-Yang-Li/StarGLM




一、模型训练


StarWhisper通过少量天文物理知识微调激活预训练知识与学习特定任务形式,数据集包含专家标注数据、基于种子与开源数据整理得到GPT3.5/4数据、天文中的长文本/逻辑思维/文本总结数据。同时通过直接偏好优化,在缓解微调后回复较短问题的同时,配合特定任务微调增强的推理能力,进一步提升回复准确性。




二、训练成果


与先前StarGLM训练情况(数学计算得分接近基座模型两倍)相近,数学计算的评分相对基模型有明显提升,在参评模型中与GPT3.5并列第二,同时天文方面评分也超过了GPT3.5 Turbo,模型平均评分也达到了总排行第二。



完整榜单:

http://cgeval.besteasy.com/leaderboard.html


三、多模态探索


通过45W条专家标注、数据扩充得到的光变曲线文本对,我们基于VisualGLM探索了多模态模型处理科学数据的可行性。同时,通过链接由哈勃与韦伯图像微调的扩散模型,我们尝试了AIGC在科普/科学领域应用的可能性。




四、工具学习


通过整理得到的工具学习、代码数据,我们进一步增强了模型原有工具学习的能力,可通过调用Agent/Code Interpreter处理一系列任务。



五、未来规划


多模态方面,我们将继续联合各方力量,推动AIGC服务于天文科普教育、研究助手。


工具学习方面,以司天望远镜阵列(身)+驱动智能体的司天大脑(脑)为构想,在MiniSitian与司天样机上进行与天文环境交互的科学具身智能探索。




文章来自微信公众号 “ 始智AI wisemodel ”





AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

2
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner