国家天文台开源StarWhisper天文大模型，探索科普和科学中的多模态与工具学习

7523点击 2023-10-17 09:50

中国科学院国家天文台银河系三维结构团组最近在wisemodel.cn社区开源的星语StarWhisper天文大模型，通过专家标注的天文物理语料微调、逻辑性长文本训练、直接偏好优化等显著提升了模型的推理逻辑性与完整性。在甲骨易AI研究院与LanguageX AI Lab联合发布的CG-Eval上达到总排名第二，仅低于GPT-4，数学推理和天文能力接近或超过GPT 3.5 Turbo。星语大模型系列(包括StarGLM)将陆续开源在wisemodel.cn社区平台，欢迎大家注册使用。

模型地址：

https://wisemodel.cn/models/LiYuYang/StarWhisper

模型展示：

https://github.com/Yu-Yang-Li/StarGLM

国家天文台开源StarWhisper天文大模型，探索科普和科学中的多模态与工具学习

一、模型训练

StarWhisper通过少量天文物理知识微调激活预训练知识与学习特定任务形式，数据集包含专家标注数据、基于种子与开源数据整理得到GPT3.5/4数据、天文中的长文本/逻辑思维/文本总结数据。同时通过直接偏好优化，在缓解微调后回复较短问题的同时，配合特定任务微调增强的推理能力，进一步提升回复准确性。

国家天文台开源StarWhisper天文大模型，探索科普和科学中的多模态与工具学习

二、训练成果

与先前StarGLM训练情况(数学计算得分接近基座模型两倍)相近，数学计算的评分相对基模型有明显提升，在参评模型中与GPT3.5并列第二，同时天文方面评分也超过了GPT3.5 Turbo，模型平均评分也达到了总排行第二。

国家天文台开源StarWhisper天文大模型，探索科普和科学中的多模态与工具学习

完整榜单：

http://cgeval.besteasy.com/leaderboard.html

三、多模态探索

通过45W条专家标注、数据扩充得到的光变曲线文本对，我们基于VisualGLM探索了多模态模型处理科学数据的可行性。同时，通过链接由哈勃与韦伯图像微调的扩散模型，我们尝试了AIGC在科普/科学领域应用的可能性。

国家天文台开源StarWhisper天文大模型，探索科普和科学中的多模态与工具学习

四、工具学习

通过整理得到的工具学习、代码数据，我们进一步增强了模型原有工具学习的能力，可通过调用Agent/Code Interpreter处理一系列任务。

国家天文台开源StarWhisper天文大模型，探索科普和科学中的多模态与工具学习

五、未来规划

多模态方面，我们将继续联合各方力量，推动AIGC服务于天文科普教育、研究助手。

工具学习方面，以司天望远镜阵列(身)+驱动智能体的司天大脑(脑)为构想，在MiniSitian与司天样机上进行与天文环境交互的科学具身智能探索。

国家天文台开源StarWhisper天文大模型，探索科普和科学中的多模态与工具学习

文章来自微信公众号 “ 始智AI wisemodel ”

关键词: AI天文大模型 , StarWhisper , AI天文

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务，如比较价格、添加购物车、回复各种社交媒体等。
项目地址：https://github.com/browser-use/browser-use

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台，可以对大语言模型（LLM）和多模态图文模型（VLM）进行预训练和轻量级微调。XTuner 支持多种微调算法，如 QLoRA、LoRA 和全量参数微调。
项目地址：https://github.com/InternLM/xtuner