AI资讯新闻榜单内容搜索-Ash

FlashAttention-4震撼来袭，原生支持Blackwell GPU，英伟达的护城河更深了？

在正在举办的半导体行业会议 Hot Chips 2025 上，TogetherAI 首席科学家 Tri Dao 公布了 FlashAttention-4。

来自主题: AI技术研报

8695 点击 2025-08-27 12:16

昨晚，神秘且强大的图像生成与编辑模型 nano banana 终于正式显露真身。没有意外，它果然来自谷歌，并且也获得了一个正式但无趣的名字：gemini-2.5-flash-image-preview。

来自主题: AI资讯

11029 点击 2025-08-27 09:35

在今年三月份，清华 AIR 和字节联合 SIA Lab 发布了 DAPO，即 Decoupled Clip and Dynamic sAmpling Policy Optimization（解耦剪辑和动态采样策略优化）。

来自主题: AI技术研报

8675 点击 2025-08-13 11:27

声音理解能力新SOTA，小米全量开源了模型。 MiDashengLM-7B，基于Xiaomi Dasheng作为音频编码器和Qwen2.5-Omni-7B Thinker作为自回归解码器，通过创新的通用音频描述训练策略，实现了对语音、环境声音和音乐的统一理解。

来自主题: AI技术研报

7659 点击 2025-08-06 12:11

图像生成不光要好看，更要高效。混元基础模型团队提出全新框架MixGRPO，该框架通过结合随机微分方程（SDE）和常微分方程（ODE），利用混合采样策略的灵活性，简化了MDP中的优化流程，从而提升了效率的同时还增强了性能。

来自主题: AI技术研报

8383 点击 2025-08-03 13:37

开源编程模型的天花板，要被Qwen3-Coder掀翻了。今天凌晨，Qwen3-Coder-Flash也重磅开源！

来自主题: AI资讯

8259 点击 2025-08-01 12:32

腾讯混元，在开源社区打出名气了。

来自主题: AI资讯

8059 点击 2025-07-15 12:01

无需CUDA代码，给H100加速33%-50%！ Flash Attention、Mamba作者之一Tri Dao的新作火了。

来自主题: AI技术研报

10708 点击 2025-07-11 16:06

大多数人还在输入一句“帮我修这个 bug”，然后疑惑为什么 Claude 回答得四不像、效率低得离谱。而另一些“老手”已经用上了 slash command，把一个原本要手动操作 45 分钟的流程，缩短到 2 分钟内自动完成。

来自主题: AI资讯

8157 点击 2025-07-09 12:23

清华大学朱军教授团队提出SageAttention3，利用FP4量化实现推理加速，比FlashAttention快5倍，同时探索了8比特注意力用于训练任务的可行性，在微调中实现了无损性能。

来自主题: AI技术研报

8757 点击 2025-07-08 12:08