AI资讯新闻榜单内容搜索-DIT

深扒GPT Image 2：疑似“吞”下了GPT-4o，OpenAI没把它当“生图”模型训练

GPT Image 2 凭什么这么强？是扩散模型又迭代了一版？是把 DiT 的参数量从 7B 扩到 20B？是训了更多高质量数据？先给结论：OpenAI 很可能已经不在“纯扩散模型”这条主赛道上了。他们已经把图像生成从“美术课”调到了“语文课”——用一个能读懂指令、能记住上下文、能理解物体关系的 LLM 主导语义规划，至于最后一步的像素生成，可能由扩散组件或其他解码器完成。

来自主题: AI技术研报

7715 点击 2026-05-03 22:58

速递｜耶鲁学生获510万美元融资，Series要打造iMessage的AI社交网络

社交网络应用 Series 宣布已筹集 510 万美元的种子前轮融资，投资者包括 Venmo 联合创始人 Iqram Magdon-Ismail、Pear VC、Reddit 首席执行官 Steve Huffman 以及 GPTZero 创始人 Edward Tian。该公司由耶鲁大学学生 Nathaneo Johnson 和 Sean Hargrow 于去年初创立，两人目前仍在该校就读大四。

来自主题: AI资讯

7980 点击 2026-04-28 16:43

Lightspeed 领投 8500 万美元，Modus 想重做“四大”：AI 正在拆掉审计行业的地基？

Modus 以 8500 万美元融资的消息却撬开了这块大陆，它引发的深远影响不仅仅关乎金钱的流动，而是深刻挑战了这个“稳固”的行业底层架构。本轮融资由 Lightspeed Venture Partners 领投，Garry Tan 等投资人参与，但更令人注目的是，这家公司没有走典型的 AI 路径

来自主题: AI资讯

8752 点击 2026-04-12 20:01

又一国产模型黑马出世，追平Gemini 2.5 Pro，空间编辑反超视频模型？

近日，京东开源图像模型JoyAI-Image-Edit，将空间智能纳入图像理解与编辑，让AI开始处理真实世界中的空间关系，让模型真正“理解空间，编辑空间”。简单解释，这是一个以空间智能为核心的图像生成与编辑模型，让 AI 真正“看懂”三维空间，从而让生成更合理、编辑更精准。

来自主题: AI资讯

8964 点击 2026-04-10 21:09

美团开源“语音克隆”模型，1B/3.5B双选，超自然复刻你的声音

相似度超越Seed-TTS、MiniMax-Speech等知名模型。昨晚，美团LongCat团队发布了文本转语音模型LongCat-AudioDiT，并开源1B、3.5B参数量的版本。这一模型的最大特点，是彻底抛弃了梅尔谱等中间表示，直接在波形潜空间进行基于扩散模型的文本转语音。通俗地说，这一模型直接根据声音本身的规律进行生成，“雕刻”出最原始的声音波形，从根源阻断数据转换的级联误差。

来自主题: AI资讯

9039 点击 2026-04-02 13:51

这是一个划时代的生图模型，一手实测Wan2.7-Image

3月30日，阿里巴巴内部发布了 Wan2.7-Image 图像生成与编辑统一模型。根据官方公布的数据，在人类偏好盲测评分中，Wan2.7-Image 目前位列国内第一。从放出的评测雷达图来看，无论是文本生图（Text-to-Image）还是综合图像编辑（Image Editing），它的各项指标基本都盖过了市面上主流的几家头部模型。

来自主题: AI资讯

9030 点击 2026-04-02 10:42

搞懂“记忆”必看｜吃透Engram，坐等Deepseek新模型

第一篇论文来自字节SEED团队，打了一些基础；《Over-Tokenized Transformer》。论文标题看上去在讨论“过度分词”。而重点必然是在第二篇上—— DeepSeek公司的学术成果Engram。《Conditional Memory via Scalable Lookup》也就是Engram模块所出处的论文。

来自主题: AI技术研报

10177 点击 2026-03-31 10:30

Claude手搓3D建筑编辑器火爆GitHub！数万年费的专业软件瑟瑟发抖

在GitHub上上线没几天就冲到5.4k stars的3D建筑编辑器开源项目——Pascal Editor。设计软件咱见的不少，但跑在浏览器里的还是有点新鲜，我帮大家浅浅总结了一下Pascal Editor的一些核心亮点：

来自主题: AI资讯

8829 点击 2026-03-29 13:00

湾区智造｜毕鲁斯重磅发布 Billus-060C：我们终于做到了从 0 到 1 的突破

3月23日，在DIA「湾区智造」论坛上，毕鲁斯人工智能正式发布 Billus-060C-EDIT-image。为了这一刻，我们潜心打磨，终于在建筑与工业设计领域，实现了从 0 到 1 的技术研发突破。

来自主题: AI资讯

8936 点击 2026-03-25 10:43

用Rust重写OpenClaw，Transformer作者下场造了安全版「龙虾」

面对 OpenClaw（龙虾）可能存在的「恶意利用用户数据和资金」的重大风险，Transformer 八子之一 Illia Polosukhin 出手了。今天，Illia Polosukhin 在 Reddit 上发了一则帖子，深谈了其使用 Rust 来构建安全版 OpenClaw 的心路历程，引起了热议。

来自主题: AI资讯

8617 点击 2026-03-07 11:10