AI资讯新闻榜单内容搜索-训练

院士领衔推出大模型的第3种记忆：比参数存储和RAG都便宜，2.4B模型越级打13B

给大模型加上第三种记忆格式，把宝贵的参数从死记硬背知识中解放出来！

来自主题: AI技术研报

7907 点击 2024-07-09 00:24

居家办公享时薪40美元！27岁华裔CEO招聘博士训练AI数据标注

市值140亿美元的初创公司Scale AI正在招聘博士训练LLM，用人成本的升高让该公司的毛利率在2023年有所下降，但创始人Alexandr Wang预计今年营收将增加两倍，突破十亿美元。

来自主题: AI资讯

11836 点击 2024-07-07 16:58

破解ChatGPT惊人耗电！DeepMind新算法训练提效13倍，能耗暴降10倍

ChatGPT能耗惊人，该怎么解？谷歌DeepMind新算法JEST问世，让LLM训练的迭代次数降低13倍，计算量减少10倍，或将重塑AI未来。

来自主题: AI技术研报

9979 点击 2024-07-07 16:42

从智算到密算，大模型数据困境新解法

大模型产业发展，需要可信中立的数据深加工平台，如何填补空白？

来自主题: AI资讯

10444 点击 2024-07-07 16:10

Adam有了mini版：内存占用少一半，吞吐量提升50%

在训练大型语言模型（LLM）时，Adam(W) 基本上已经成为了人们默认使用的优化器。

来自主题: AI技术研报

9782 点击 2024-07-06 19:01

更美图像生成、直出分钟级视频，国产自研DiT架构的越级之旅

一转眼，2024 年已经过半。我们不难发现，AI 尤其是 AIGC 领域出现一个越来越明显的趋势：文生图赛道进入到了稳步推进、加速商业落地的阶段，但同时仅生成静态图像已经无法满足人们对生成式 AI 能力的期待，对动态视频的创作需求前所未有的高涨。

来自主题: AI资讯

11017 点击 2024-07-06 18:56

马斯克豪掷40亿训Grok-3！红杉高盛大泼冷水，AI收支鸿沟或已达5000亿美元

马斯克为Grok 3要豪掷近40亿美元狂买10万张H100，GPT-6的训练则可能要耗资百亿。然而红杉和高盛近日都给行业泼了冷水：每年要挣6000亿美元才能支付的巨额硬件支出，换来的却只是OpenAI 34亿美元的收入，绝大多数初创连1亿美元都达不到。而如果全世界的AI泡沫都被戳破，很可能就会导致新的经济危机。

来自主题: AI资讯

10763 点击 2024-07-06 18:46