ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
ChemLLM化学大模型开源,wisemodel社区在线体验,助力化学研究
8093点击    2024-05-27 09:09

01


ChemLLM介绍


ChemLLM系列模型是由上海人工智能实验室开发的首个兼备推理、对话等通用能力和化学专业能力的开源大模型。相比于现有的其他大模型,ChemLLM对化学空间进行了有效建模,在产物预测、名称转化和化学性质预测等核心化学任务上表现优异。ChemLLM系列模型已经发布到了始智AI wisemodel.cn开源社区,并且无需任何代码,两步即可完成模型的在线体验。



上海 AI lab 化学大模型团队基于自建ChemData化学专业数据集,在本年初发布的浦科·化学基础上,更新发布了ChemLLM-1.5化学大模型,并在新构建的ChemBench测评数据集上进行了全面的测评。更新后,ChemLLM在核心化学任务上的效果与GPT-4相当,而在通用任务上与尺寸相近的语言模型难分伯仲,欢迎到wisemodel开源社区进行在线体验。


02


科学大语言模型的机遇与挑战


大型语言模型已在图像处理、文字识别、视频制作等多个领域展现出卓越的能力,并已成功应用于化学研究,为科学研究和生产提供支持。目前的研究主要依赖于大型语言模型调用专业化学工具来解决具体的化学问题。然而,直接将化学知识集成到语言模型中,仍然存在以下挑战:


1. 结构化数据的限制: 大多数化学信息和知识存储在结构化数据库中,直接使用这些数据训练LLM可能会损害模型处理自然语言的能力,使得模型的对话和逻辑推理能力发生退化;


2. 特殊的化学信息学表示: 化学信息学中,分子用特殊符号表示,如SMILES。这类数据往往不符合自然语言的规范,因此常规的语言模型难以正确理解和生成这种符号;


3. 化学数据和任务的多样性: 化学数据和任务种类繁多,设计一个灵活并能泛化到多种化学任务上的训练流程十分困难。


03


ChemLLM的技术核心


为解决上述困难,研究人员创造性地采用两阶段指令微调框架对模型进行训练。第一阶段中,研究人员使用开源的Multi-Corpus通用语料数据集进行指令微调,赋予InternLM2-base的基座模型以通用语言能力;第二阶段中,研究人员将构造的ChemData专业数据集与部分通用语料数据集混合对模型进行二次指令微调,在保有模型通用语言、推理能力不受损害的前提下,注入化学知识。



经过两个阶段的训练,模型的通用能力被激发并保留,同时ChemLLM有效地建模了化学空间,具有解决复杂的化学问题的潜力。


04


ChemLLM能力测评


研究人员运用构建的ChemBench测评数据集,在基于文本的分子生成、名称转换、性质预测、温度预测、分子描述、产率预测、溶剂预测、逆合成分析、产物预测共九大专业化学任务上测试了ChemLLM。同时选取了LLaMA2-7B、Mistral-7B、ChatGLM3-6B、Owen-7B、InterLM2-chat-7B,共五个规模相近的语言大模型,和超大通用语言模型GPT-3.5和GPT-4,与ChemLLM进行了比较。



在所有九个化学任务中,ChemLLM显著地超越了五个同规模大模型和通用超大模型GPT-3.5,在基于文本的分子生成、名称转换、性质预测、温度预测、产率预测、逆合成分析六个任务上能够媲美于GPT-4,证明了ChemLLM对化学空间的有效学习。


研究人员也采集并开源了中高考化学测试数据集,连同其他三个公开通用评测数据集上一起,对上述大模型进行了通用知识评测。这四个数据集的测试内容包括中英文多学科认知性知识测试、数学推理能力测试、基础化学能力等,全面考察模型的综合认知和逻辑推理。结果证明,ChemLLM的通用能力达到主流大语言模型水平。



05


在线体验


创建在线体验


用户登录之后,点击“模型详情”页面的“在线体验”按钮,用户也可以在“体验”空间页面点击“新建体验”按钮后选择相应的模型镜像进行部署和体验。



2


填写体验基本信息


在部署模型弹窗中填写体验中英文名称和设置相应属性以及选择好镜像和硬件部署,然后直接点击“下一步”按钮。(注:暂时平台上只有A5000-24G的GPU卡可用)



3


确认计费方式


选择相应的计费方式,支持按量计费、包周和包月的方式,直接点击“提交订单”即可完成模型部署。按量计费的方式用户可以选择自动停止的时间,也可以到“用户中心-我的资源-体验”手动停止。



4


创建完成,开始试用


下面点击创建好的服务,就可以进行在线体验了:





06


相关链接


AI4Chem组织地址:


https://wisemodel.cn/organization/AI4Chem


模型下载:


https://wisemodel.cn/models/AI4Chem/ChemLLM-7B-Chat


https://wisemodel.cn/models/AI4Chem/ChemLLM-7B-DPO


https://wisemodel.cn/models/AI4Chem/ChemLLM-7B


文章来源于“始智AI wisemodel


AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner