AI资讯新闻榜单内容搜索-DiT

Qwen新开源，把AI生图里的文字SOTA拉爆了

通义模型家族，刚刚又双叒开源了，这次是Qwen-Image——一个200亿参数、采用MMDiT架构的图像生成模型。这也是通义千问系列中首个图像生成基础模型。

来自主题: AI技术研报

8709 点击 2025-08-05 17:10

“没有AI味”的Flux.1新模型，现可以免费试用

AI生图，但是没有AI味，可能么？一款全新、可编辑、照片级的AI生图模型FLUX.1 Krea [dev]现已发布，可在Krea Edit上免费试用。

来自主题: AI资讯

9073 点击 2025-08-05 17:04

AI Reddit2.0 发布｜AI 在出海社媒场景的落地实践

做海外社媒运营，可能会陷入这样一个“怪圈”？

来自主题: AI资讯

8504 点击 2025-07-21 11:21

两姐妹离职Meta创业，融资1060万美金，把社媒变成销售渠道，用AI打造现代商业的操作系统

还在为发了广告没人点击而烦恼吗？还在纠结为什么花费巨资投放的数字营销效果越来越差吗？现实是，传统的营销漏斗已经彻底坍塌了。今天的消费者，特别是Gen Z和Gen Alpha，他们发现产品的方式已经完全改变：不再通过搜索引擎或者广告，而是通过TikTok的滚动浏览、Reddit的搜索，或者网红的推荐。

来自主题: AI资讯

8903 点击 2025-07-19 11:21

免剪辑直出！AI生成多角色同框对话视频，动态路由精准绑定音频

Bind-Your-Avatar是一个基于扩散Transformer（MM-DiT）的框架，通过细粒度嵌入路由将语音与角色绑定，实现精准的音画同步，并支持动态背景生成。该框架还引入了首个针对多角色对话视频生成的数据集MTCC和基准测试，实验表明其在身份保真和音画同步上优于现有方法。

来自主题: AI技术研报

8402 点击 2025-07-18 11:44

BCG最新报告：印度AI普及率92%登顶全球！中美意外落后？

你好，我是杰哥。近日，波士顿咨询公司（BCG）发布了《ai-at-work-2025-slideshow-june-2025-edit-02》，简称《AI at Work 2025》第三版报告，基于对全球 10,635 名员工的调研，深入分析了 AI 在职场中的应用现状。这份报告揭示了 AI 应用的五大关键趋势，为企业和员工提供了重要洞察。

来自主题: AI技术研报

9353 点击 2025-07-16 16:13

B站神级配音AI被曝光！一个「意外泄露」的视频，让鬼畜区UP主都沉默了

最近一个「泄露」的文本转语音模型演示版本在 Reddit 上火了。这个「泄露」的演示视频被网友贴出来后，评论区一片惊呼。

来自主题: AI资讯

9667 点击 2025-07-15 11:01

EasyCache：无需训练的视频扩散模型推理加速——极简高效的视频生成提速方案

近年来，随着扩散模型（Diffusion Models）和扩散 Transformer（DiT）在视频生成领域的广泛应用，AI 合成视频的质量和连贯性有了飞跃式提升。像 OpenAI Sora、HunyuanVideo、Wan2.1 等大模型，已经能够生成结构清晰、细节丰富且高度连贯的长视频内容，为数字内容创作、虚拟世界和多媒体娱乐带来了巨大变革。

来自主题: AI技术研报

8877 点击 2025-07-14 10:42

告别Transformer！北大、北邮、华为开源纯卷积DiC：3x3卷积实现SOTA性能，比DiT快5倍！

当整个 AI 视觉生成领域都在 Transformer 架构上「卷生卷死」时，一项来自北大、北邮和华为的最新研究却反其道而行之，重新审视了深度学习中最基础、最经典的模块——3x3 卷积。

来自主题: AI技术研报

8828 点击 2025-07-14 10:25

ChatGPT破案！成功揭露500万美元遗产欺诈

一起500万美元遗产欺诈案，就这样被ChatGPT揭露了？！相关帖子正在美版贴吧Reddit建起高楼。

来自主题: AI资讯

7968 点击 2025-07-13 13:53