AI TNT— 让一部分先用AI实现商业化

AMD的GPU跑AI模型终于Yes了？PK英伟达H100不带怕的

都很贵。

来自主题: AI资讯

8508 点击 2024-09-04 23:19

单卡搞定Llama 3.1 405B，让大模型轻松瘦身！超强压缩工具包来了

单卡搞定Llama 3.1（405B），最新大模型压缩工具来了！

来自主题: AI技术研报

8986 点击 2024-08-02 14:26

【LLM开源模型】LLMs-Llama3.1-240723通关攻略笔记v1.0

不同类型的数据配比如何配置:先通过小规模实验确定最优配比，然后将其应用到大模型的训练中。 Token配比结论：通用知识50%；数学与逻辑25%；代码17%；多语言8%。

来自主题: AI技术研报

6523 点击 2024-08-02 11:53

想跑千亿大模型？算力厂商放大招！CPU通用服务器成为新选择

千亿参数规模的大模型推理，服务器仅用4颗CPU就能实现！

来自主题: AI资讯

5638 点击 2024-08-01 15:35

英伟达“AI盒子”升级发布软件和服务，黄仁勋打造物理世界的数字副本

英伟达NIM新升级，助力AI在多领域应用。

来自主题: AI资讯

8960 点击 2024-07-30 11:38

从裸机到700亿参数大模型，这里有份教程，还有现成可用的脚本

我们知道 LLM 是在大规模计算机集群上使用海量数据训练得到的，机器之心曾介绍过不少用于辅助和改进 LLM 训练流程的方法和技术。而今天，我们要分享的是一篇深入技术底层的文章，介绍如何将一堆连操作系统也没有的「裸机」变成用于训练 LLM 的计算机集群。

来自主题: AI技术研报

7847 点击 2024-07-24 16:57

太酷了！iPhone、iPad、MacBook老旧设备组成异构集群，能跑Llama 3

假如你有闲置的设备，或许可以试一试。

来自主题: AI资讯

9064 点击 2024-07-16 19:50

模块化重构LLaVA，替换组件只需添加1-2个文件，开源TinyLLaVA Factory来了

TinyLLaVA 项目由清华大学电子系多媒体信号与智能信息处理实验室 (MSIIP) 吴及教授团队和北京航空航天大学人工智能学院黄雷老师团队联袂打造。清华大学 MSIIP 实验室长期致力于智慧医疗、自然语言处理与知识发现、多模态等研究领域。北航团队长期致力于深度学习、多模态、计算机视觉等研究领域。

来自主题: AI技术研报

8284 点击 2024-05-27 16:24

只需单卡RTX 3090，低比特量化训练就能实现LLaMA-3 8B全参微调

本文由GreenBit.AI团队撰写，团队的核心成员来自德国哈索·普拉特纳计算机系统工程院开源技术小组。我们致力于推动开源社区的发展，倡导可持续的机器学习理念。我们的目标是通过提供更具成本效益的解决方案，使人工智能技术在环境和社会层面产生积极影响。

来自主题: AI技术研报

7412 点击 2024-05-25 18:15

250行代码从头搭建Llama 3，GitHub一天4.6k星！Karpathy大赞

Llama 3发布一个月后，一位开发者在GitHub上创建了名为「从头开始实现Llama 3」的项目，引起了开源社区的广泛关注。代码非常详细地展现了Llama所使用的Transformer架构，甚至让Andrej Karpathy亲自下场「背书」。

来自主题: AI技术研报

8931 点击 2024-05-21 15:20