AI资讯新闻榜单内容搜索-io

DeepSeek关键RL算法GRPO，有人从头跑通了，贡献完整代码

GRPO（Group Relative Policy Optimization）是 DeepSeek-R1 成功的基础技术之一，我们之前也多次报道过该技术，比如《DeepSeek 用的 GRPO 占用大量内存？有人给出了些破解方法》。

来自主题: AI技术研报

9702 点击 2025-03-02 15:14

微软原WizardLM团队：代码大模型WarriorCoder，性能新SOTA

近年来，大型语言模型（LLMs）在代码相关的任务上展现了惊人的表现，各种代码大模型层出不穷。这些成功的案例表明，在大规模代码数据上进行预训练可以显著提升模型的核心编程能力。

来自主题: AI技术研报

9895 点击 2025-03-02 14:13

深度｜谁正在AI视频上，超越OpenAI 和Google？

这家初创公司希望让大公司争夺大众市场,而自己专注于吸引行业专业人士,并与 Lionsgate 达成一笔里程碑式的交易。

来自主题: AI资讯

8515 点击 2025-03-02 13:32

无需训练让扩散模型提速2倍，上交大提出Token级缓存方案｜ICLR‘25

Diffusion Transformer模型模型通过token粒度的缓存方法，实现了图像和视频生成模型上无需训练的两倍以上的加速。

来自主题: AI技术研报

7426 点击 2025-02-28 15:06

被Github 上的Stable Diffusion 坑惨了？失业、欠帐、恐慌，工程师怒喷：AI软件毁了我

这位曾用代码构建童话世界的工程师，被困在了由 AI 工具引发的一场噩梦里。

来自主题: AI资讯

6874 点击 2025-02-28 10:27

“Transformer就像燃油车，attention-free才是新能源” | 对话RWKV创始人彭博

当DeepSeek引发业界震动时，元始智能创始人彭博正专注于一个更宏大的愿景。

来自主题: AI资讯

8616 点击 2025-02-27 11:02

郭靖，千万美金ARR的AI音乐破局者，ACE Studio如何让15位格莱美得主抛弃$500时薪歌手?

当传统音乐制作仍被繁复的乐理知识与高昂的录音成本筑起高墙，一群理想主义者正用AI重新书写规则。从乐队主唱到AI音乐创业者，郭靖（Joe）的十年探索，恰是音乐行业从“精英创作”向“全民表达”演进的时代缩影——他曾因工具掣肘埋没作品，却在自学编程的硅谷岁月里顿悟：技术不该是艺术的门槛，而应是创作者的翅膀。

来自主题: AI资讯

9008 点击 2025-02-26 15:01