AI资讯新闻榜单内容搜索-DiT

CUDA要凉？Claude 30分钟铲平英伟达护城河，AMD要笑醒了

英伟达护城河要守不住了？Claude Code半小时编程，直接把CUDA后端迁移到AMD ROCm上了。一夜之间，CUDA护城河被AI终结了？这几天，一位开发者johnnytshi在Reddit上分享了一个令人震惊的操作：

来自主题: AI资讯

10581 点击 2026-01-23 15:19

刚刚，DeepSeek 再发梁文锋署名新论文：Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models

今天凌晨，喜欢闷声做大事的 DeepSeek 再次发布重大技术成果，在其 GitHub 官方仓库开源了新论文与模块 Engram，论文题为 “Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models”，梁文锋再次出现在合著者名单中。

来自主题: AI资讯

12243 点击 2026-01-13 07:59

AI差点骗过全世界，这个8.7万赞的帖子被揭穿后，我开始怀疑一切了

近日，海外版《外卖骑手困在系统里》在 Reddit 上发酵，获得了超过 8.7 万赞，直冲首页。这是一个符合大众对「万恶资本」的想象的故事，但也是一场 AI 生成的骗局。

来自主题: AI资讯

9656 点击 2026-01-11 21:31

阿里最强“PS模型”开源！一手体验，0元P出氛围感合影

热门LoRA首次内置，控光换镜头实测可用。

来自主题: AI技术研报

10112 点击 2025-12-25 10:17

拒绝「盲修」：JarvisEvo 如何让 Agent 像人类一样拥有「视觉反思」能力？

在迈向通用人工智能的道路上，我们一直在思考一个问题：现有的 Image Editing Agent，真的「懂」修图吗？

来自主题: AI技术研报

7275 点击 2025-12-24 15:01

让扩散模型「可解释」不再降质，开启图片编辑新思路

过去三年，扩散模型席卷图像生成领域。以 DiT (Diffusion Transformer) 为代表的新一代架构不断刷新图像质量的极限，让模型愈发接近真实世界的视觉规律。

来自主题: AI技术研报

8533 点击 2025-12-16 16:27

中国机器人比赛应急救援，美国网友Reddit破防：我们还在给机器狗化妆拍段子

崇“洋”媚外这一块，也是轮到美国网友了！最近，一篇“中国机器人在比火场救人，美国机器狗还在给扎克伯格套脸？”的帖子被顶上了Reddit热门。这多多少少让一众美国网友有点破防。

来自主题: AI资讯

8567 点击 2025-12-13 11:07

深度｜半年内再融3.3亿美元，Airwallex引爆AI金融智能体投资热潮，ARR首破10亿美元

12月8日，Airwallex空中云汇继今年5月后再次宣布获得新一轮3.3亿美元G轮融资，投后估值达 80 亿美元，较六个月前 F 轮融资时上涨近 30%。本次融资由Addition领投，T. Rowe Price、Activant、Lingotto、Robinhood Ventures和 TIAA Ventures等全球顶级资本参与投资。

来自主题: AI资讯

11159 点击 2025-12-09 11:50

NeurIPS 2025 Spotlight | 中国联通以全局优化重塑扩散模型加速

当前，视频生成模型性能正在快速提升，尤其是基于Transformer架构的DiT模型，在视频生成领域的表现已经逐渐接近真实拍摄效果。然而，这些扩散模型也面临一个共同的瓶颈：推理时间长、算力成本高、生成速度难以提升。随着视频生成长度持续增加、分辨率不断提高，这个瓶颈正在成为影响视频创作体验的主要障碍之一。

来自主题: AI技术研报

8863 点击 2025-11-26 13:46

与Banana Pro过过招，国产Libcom图像合成工作台开启Labubu漫游记

2025 年，AIGC 热度再冲新高：从社交头像、电商海报到影视分镜，AI 生成内容已全面渗透日常创作。在这股浪潮中，Nano Banana、Qwen Edit 等通用图像编辑大模型功能强大，涵盖了广泛的图像编辑场景。特别是最新爆火的 Nano Banana Pro 能将文字指令转化为高精度图像，精准呈现复杂场景。但是上述图像编辑大模型在一些细分领域的表现仍有不足，并且用于简单任务性价比不高。

来自主题: AI资讯

9116 点击 2025-11-25 17:18