AI资讯新闻榜单内容搜索-始智AI

手把手教你预训练一个小型 LLM｜Steel-LLM 的实战经验

随着开源数据的日益丰富以及算力价格的持续下降，对于个人或小型机构而言，预训练一个小型的 LLM 已逐渐成为可能。开源中文预训练语言模型 Steel - LLM 就是一个典型案例，其模型参数量与数据量并非十分庞大，基本处于参数量为 B 级别、数据量为 T 级别的规模。

来自主题: AI技术研报

9152 点击 2024-11-22 09:44

视频生成Open-Sora-Plan 升级至v1.3.0，引入五大新特性

Open-Sora-Plan迎来又一次升级。新的Open-Sora-Plan v1.3.0版本引入了五个新特性：性能更强、成本更低的WFVAE；Prompt refiner；高质量数据清洗策略；全新稀疏注意力的DiT，以及动态分辨率、动态时长的支持。

来自主题: AI技术研报

13240 点击 2024-10-30 10:55

ChemLLM化学大模型开源，wisemodel社区在线体验，助力化学研究

ChemLLM系列模型是由上海人工智能实验室开发的首个兼备推理、对话等通用能力和化学专业能力的开源大模型。相比于现有的其他大模型，ChemLLM对化学空间进行了有效建模，在产物预测、名称转化和化学性质预测等核心化学任务上表现优异。ChemLLM系列模型已经发布到了始智AI wisemodel.cn开源社区，并且无需任何代码，两步即可完成模型的在线体验。

来自主题: AI资讯

12067 点击 2024-05-27 09:09