AI资讯新闻榜单内容搜索-大模型训练

存储大厂“激战”HBM

HBM因AI大模型训练需求爆增，市场火热。

来自主题: AI资讯

6135 点击 2024-07-15 13:44

H100利用率飙升至75%！英伟达亲自下场FlashAttention三代升级，比标准注意力快16倍

大模型训练推理神作，又更新了！

来自主题: AI资讯

9837 点击 2024-07-12 15:39

Anthropic CEO：大模型训练成本暴涨，2027年将达1000亿美元！

Anthropic首席执行官表示，当前AI模型训练成本是10亿美元，未来三年，这个数字可能会上升到100亿美元甚至1000亿美元。要知道，GPT-4o这个曾经最大的模型也只用了1亿美元。千亿美刀，究竟花在了哪里？

来自主题: AI资讯

9383 点击 2024-07-09 01:10

星环科技孙元浩：语料已经是大模型最大的挑战

「原来以为语料已经匮乏了，大模型训练已经没有语料了，实际上不是的，数据还远远没有跑光」。

来自主题: AI资讯

9243 点击 2024-06-16 18:09

估值飙至138亿美元！27岁华裔天才少年再获融资，数据标注会是下一个风口？

Alexandr Wang创办的Scale AI是一个为AI模型提供训练数据的数据标注平台，近期完成新一轮10亿美元融资，估值飙升至138亿美元。该公司表示将利用新资金生产丰富的前沿数据，为通向AGI铺平道路。

来自主题: AI资讯

10798 点击 2024-05-26 12:05

Unsloth x Qwen2，提速47.32%，节省39.13%显存，最少仅需8.43GB显存

在上一篇文章「Unsloth微调Llama3-8B，提速44.35%，节省42.58%显存，最少仅需7.75GB显存」中，我们介绍了Unsloth，这是一个大模型训练加速和显存高效的训练框架，我们已将其整合到Firefly训练框架中，并且对Llama3-8B的训练进行了测试，Unsloth可大幅提升训练速度和减少显存占用。

来自主题: AI技术研报

4718 点击 2024-05-08 12:21