AI资讯新闻榜单内容搜索-io

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: io
DeepSeek关键RL算法GRPO,有人从头跑通了,贡献完整代码

DeepSeek关键RL算法GRPO,有人从头跑通了,贡献完整代码

DeepSeek关键RL算法GRPO,有人从头跑通了,贡献完整代码

GRPO(Group Relative Policy Optimization)是 DeepSeek-R1 成功的基础技术之一,我们之前也多次报道过该技术,比如《DeepSeek 用的 GRPO 占用大量内存?有人给出了些破解方法》。

来自主题: AI技术研报
9702 点击    2025-03-02 15:14
微软原WizardLM团队:代码大模型WarriorCoder,性能新SOTA

微软原WizardLM团队:代码大模型WarriorCoder,性能新SOTA

微软原WizardLM团队:代码大模型WarriorCoder,性能新SOTA

近年来,大型语言模型(LLMs)在代码相关的任务上展现了惊人的表现,各种代码大模型层出不穷。这些成功的案例表明,在大规模代码数据上进行预训练可以显著提升模型的核心编程能力。

来自主题: AI技术研报
9895 点击    2025-03-02 14:13
深度|谁正在AI视频上,超越OpenAI 和Google?

深度|谁正在AI视频上,超越OpenAI 和Google?

深度|谁正在AI视频上,超越OpenAI 和Google?

这家初创公司希望让大公司争夺大众市场,而自己专注于吸引行业专业人士,并与 Lionsgate 达成一笔里程碑式的交易。

来自主题: AI资讯
8515 点击    2025-03-02 13:32
无需训练让扩散模型提速2倍,上交大提出Token级缓存方案|ICLR‘25

无需训练让扩散模型提速2倍,上交大提出Token级缓存方案|ICLR‘25

无需训练让扩散模型提速2倍,上交大提出Token级缓存方案|ICLR‘25

Diffusion Transformer模型模型通过token粒度的缓存方法,实现了图像和视频生成模型上无需训练的两倍以上的加速。

来自主题: AI技术研报
7426 点击    2025-02-28 15:06
郭靖,千万美金ARR的AI音乐破局者,ACE Studio如何让15位格莱美得主抛弃$500时薪歌手?

郭靖,千万美金ARR的AI音乐破局者,ACE Studio如何让15位格莱美得主抛弃$500时薪歌手?

郭靖,千万美金ARR的AI音乐破局者,ACE Studio如何让15位格莱美得主抛弃$500时薪歌手?

当传统音乐制作仍被繁复的乐理知识与高昂的录音成本筑起高墙,一群理想主义者正用AI重新书写规则。从乐队主唱到AI音乐创业者,郭靖(Joe)的十年探索,恰是音乐行业从“精英创作”向“全民表达”演进的时代缩影——他曾因工具掣肘埋没作品,却在自学编程的硅谷岁月里顿悟:技术不该是艺术的门槛,而应是创作者的翅膀。

来自主题: AI资讯
9008 点击    2025-02-26 15:01
千帧长视频时代到来!MIT全新扩散算法让任意模型突破时长极限

千帧长视频时代到来!MIT全新扩散算法让任意模型突破时长极限

千帧长视频时代到来!MIT全新扩散算法让任意模型突破时长极限

进入到 2025 年,视频生成(尤其是基于扩散模型)领域还在不断地「推陈出新」,各种文生视频、图生视频模型展现出了酷炫的效果。其中,长视频生成一直是现有视频扩散的痛点。

来自主题: AI技术研报
7707 点击    2025-02-26 13:39
独家爆料:苹果电脑上的可以用AI了

独家爆料:苹果电脑上的可以用AI了

独家爆料:苹果电脑上的可以用AI了

前几天,朋友跟我报了个猛料:苹果电脑上的可以用AI了。而另一位朋友,则带来了更为准确的消息:M2 Ultra 版本的 Mac Studio,已原生适配阶跃星辰模型全家桶,这应该是第一个全面适配苹果 Mac 设备的中国大模型厂商。

来自主题: AI资讯
10956 点击    2025-02-24 15:03
Bengio参与,扩散模型+蒙特卡洛树搜索实现System 2规划

Bengio参与,扩散模型+蒙特卡洛树搜索实现System 2规划

Bengio参与,扩散模型+蒙特卡洛树搜索实现System 2规划

把扩散模型的生成能力与 MCTS 的自适应搜索能力相结合,会是什么结果?

来自主题: AI技术研报
8403 点击    2025-02-23 16:16