AI资讯新闻榜单内容搜索-训练框架

又一上海人形机器人加入开源！全套图纸+代码，来自傅利叶

上海人形机器人玩家傅利叶，首款开源产品来了！刚刚，发布小·人形机器人——Fourier N1。据了解，首批开源内容，可以直接实现本体以及走路和小跑功能，未来傅利叶还将持续更新推理代码和训练框架，确保上述功能都能复现。

来自主题: AI资讯

10698 点击 2025-04-12 12:06

比知识蒸馏好用，田渊栋等提出连续概念混合，再度革新Transformer预训练框架

自然语言 token 代表的意思通常是表层的（例如 the 或 a 这样的功能性词汇），需要模型进行大量训练才能获得高级推理和对概念的理解能力，

来自主题: AI技术研报

6918 点击 2025-02-16 13:12

宇树机器人成赛博科比！英伟达CMU新研究，投篮模仿篮球巨星，代码论文全开源

英伟达卡内基梅隆大学一起，给宇树机器人“一雪前耻”了（doge）。只通过一个训练框架，机器人就能成为“学人精”，完成各种高难度敏捷动作。

来自主题: AI资讯

9162 点击 2025-02-06 13:05

大模型训练开销还能更小！微软推出首个FP4训练框架，训练效果与BF16相当

首个FP4精度的大模型训练框架来了，来自微软研究院！

来自主题: AI技术研报

9282 点击 2025-01-30 15:11

美欧亚三洲开发者联手，全球首个组团训练的大模型来了，全流程开源

Prime Intellect 宣布通过去中心化方式训练完成了一个 10B 模型。30 号，他们开源了一切，包括基础模型、检查点、后训练模型、数据、PRIME 训练框架和技术报告。据了解，这应该是有史以来首个以去中心化形式训练得到的 10B 大模型。

来自主题: AI资讯

9252 点击 2024-12-02 12:35

低内存占用也能实现满血训练？！北理北大港中文MMLab推出Fira训练框架

内存占用小，训练表现也要好……大模型训练成功实现二者兼得。来自北理、北大和港中文MMLab的研究团队提出了一种满足低秩约束的大模型全秩训练框架——Fira，成功打破了传统低秩方法中内存占用与训练表现的“非此即彼”僵局。

来自主题: AI技术研报

5430 点击 2024-10-21 10:58

中科大成果斩获图学习“世界杯”单项冠军，霸榜蛋白质功能预测任务超1年 | TPAMI 2024

中科大成果，拿下图学习“世界杯”单项冠军！由中科大王杰教授团队（MIRA Lab）提出的首个具有最优性保证的大语言模型和图神经网络分离训练框架，在国际顶级图学习标准OGB（Open Graph Benchmark）挑战赛的蛋白质功能预测任务上斩获「第一名」，该纪录从2023年9月27日起保持至今。

来自主题: AI资讯

5251 点击 2024-09-30 14:34

CMU清华教LLM练成数学高手，LeanSTaR训练模型边思考边证明，登顶新SOTA

LLM数学水平不及小学生怎么办？CMU清华团队提出了Lean-STaR训练框架，在语言模型进行推理的每一步中都植入CoT，提升了模型的定理证明能力，成为miniF2F上的新SOTA。

来自主题: AI技术研报

8018 点击 2024-08-10 11:45

Unsloth x Qwen2，提速47.32%，节省39.13%显存，最少仅需8.43GB显存

在上一篇文章「Unsloth微调Llama3-8B，提速44.35%，节省42.58%显存，最少仅需7.75GB显存」中，我们介绍了Unsloth，这是一个大模型训练加速和显存高效的训练框架，我们已将其整合到Firefly训练框架中，并且对Llama3-8B的训练进行了测试，Unsloth可大幅提升训练速度和减少显存占用。

来自主题: AI技术研报

5900 点击 2024-05-08 12:21

国内多所高校共建开源社区LAMM，加入多模态语言模型大家庭的时候到了

LAMM (Language-Assisted Multi-Modal) 旨在建设面向开源学术社区的多模态指令微调及评测框架，其包括了高度优化的训练框架、全面的评测体系，支持多种视觉模态。

来自主题: AI资讯

6133 点击 2024-01-11 11:43