AI技术研报-这里有最前沿的人工智能技术解读

不用GAN不用扩散，无需训练解锁AI生图新境界！判别模型成神秘第三极

你能想象判别模型也能成为强大的图像合成高手吗？「直接上升合成」（DAS）做到了！它突破传统认知，借助多分辨率优化等创新技术，在图像生成的多个关键任务中表现出色。

来自主题: AI技术研报

6818 点击 2025-02-24 16:37

Zero-shot重建物理高斯资产，清华&光轮视觉大模型让机器人理解物理属性｜ICRA 2025

理解物体的物理属性，对机器人执行操作十分重要，但是应该如何实现呢？

来自主题: AI技术研报

11602 点击 2025-02-24 16:27

从o1-mini到DeepSeek-R1，万字长文带你读懂推理模型的历史与技术

自 OpenAI 发布 o1-mini 模型以来，推理模型就一直是 AI 社区的热门话题，而春节前面世的开放式推理模型 DeepSeek-R1 更是让推理模型的热度达到了前所未有的高峰。

来自主题: AI技术研报

9971 点击 2025-02-24 14:40

如何让大模型感知知识图谱知识？蚂蚁联合实验室：利用多词元并行预测给它“上课”

如何让大模型感知知识图谱知识？

来自主题: AI技术研报

8389 点击 2025-02-24 14:05

开源赛道太挤了！月之暗面开源新版Muon优化器

省一半算力跑出2倍效果，月之暗面开源优化器Muon，同预算下全面领先。

来自主题: AI技术研报

8618 点击 2025-02-24 13:56

联手华为诺亚，南大LAMDA组获EDA顶会DATE 2025最佳论文

国内芯片设计研究团队，刚刚在国际学术顶会上获奖了。

来自主题: AI技术研报

8898 点击 2025-02-24 13:42

扩散模型新突破！无需微调，就能高效稳定移除目标物体

最近，扩散模型在生成模型领域异军突起，凭借其独特的生成机制在图像生成方面大放异彩，尤其在处理高维复杂数据时优势明显。然而，尽管扩散模型在图像生成任务中表现优异，但在图像目标移除任务中仍然面临诸多挑战。现有方法在移除前景目标后，可能会留下残影或伪影，难以实现与背景的自然融合。

来自主题: AI技术研报

8231 点击 2025-02-24 13:20

月之暗面开源改进版Muon优化器，算力需求比AdamW锐减48%，DeepSeek也适用

算力需求比AdamW直降48%，OpenAI技术人员提出的训练优化算法Muon，被月之暗面团队又推进了一步！

来自主题: AI技术研报

11562 点击 2025-02-24 10:24

Multi-Agent辩论树ToD：让AI具备批判性思维，用R1推理，解决复杂认知任务

随着AI工具越来越普及，类似Deep Researh这样的工具越来越好用，科学研究成果呈现爆炸式增长。以arXiv为例，仅2024年10月就收到超过24,000篇论文提交。

来自主题: AI技术研报

11558 点击 2025-02-24 10:09

ICLR 2025｜南洋理工大学AvatarGO，探索4D人与物体交互生成新方法

近年来，随着扩散模型和 Transformer 技术的快速发展，4D 人体 - 物体交互（HOI）的生成与驱动效果取得了显著进展。然而，当前主流方法仍依赖 SMPL [1] 这一人体先验模型来生成动作。

来自主题: AI技术研报

10244 点击 2025-02-23 16:39

多模态大模型事实正确性评估：o1最强，模型普遍过于自信，最擅长现代建筑/工程技术/科学

OpenAI o1视觉能力还是最强，模型们普遍“过于自信”！

来自主题: AI技术研报

9142 点击 2025-02-23 16:23

Bengio参与，扩散模型+蒙特卡洛树搜索实现System 2规划

把扩散模型的生成能力与 MCTS 的自适应搜索能力相结合，会是什么结果？

来自主题: AI技术研报

9093 点击 2025-02-23 16:16

月之暗面Kimi的技术一点都不落后。

2 月 18 日，月之暗面发布了一篇关于稀疏注意力框架 MoBA 的论文。MoBA 框架借鉴了 Mixture of Experts（MoE）的理念，提升了处理长文本的效率，它的上下文长度可扩展至 10M。并且，MoBA 支持在全注意力和稀疏注意力之间无缝切换，使得与现有的预训练模型兼容性大幅提升。

来自主题: AI技术研报

9964 点击 2025-02-23 11:38

斯坦福最新AI Agent序列化证伪假设检验自动化框架，向卡尔·波普尔致敬

在人工智能高速发展的今天，我们似乎迎来了一个"假设爆炸"的时代。大语言模型每天都在产生数以万计的研究假设，它们看似合理，却往往难以验证。这让我不禁想起了20世纪最具影响力的科学哲学家之一——卡尔·波普尔。

来自主题: AI技术研报

9749 点击 2025-02-23 11:13

3元+2小时，普通人也能训练自己的AI大模型！GitHub爆火8.9k星项目，技术圈炸了！

GitHub上一个开源项目彻底打破门槛：只需3块钱、2小时，普通人也能从零训练自己的语言模型！项目“MiniMind”上线即爆火，狂揽8.9k星标，技术圈直呼：“这才是AI民主化的未来！”

来自主题: AI技术研报

12507 点击 2025-02-23 10:30

1/30训练步骤复刻DeepSeek-R1-Zero，沈向洋姜大昕张祥雨等开源推理模型RL训练方法

DeepSeek啥都开源了，就是没有开源训练代码和数据。现在，开源RL训练方法只需要用1/30的训练步骤就能赶上相同尺寸的DeepSeek-R1-Zero蒸馏Qwen。

来自主题: AI技术研报

10018 点击 2025-02-22 21:30

DeepSeek、OpenAI、Kimi视觉推理到底哪家强？港中文MMLab推出推理基准MME-COT

OpenAI o1和DeepSeek-R1靠链式思维（Chain-of-Thought, CoT）展示了超强的推理能力，但这一能力能多大程度地帮助视觉推理，又应该如何细粒度地评估视觉推理呢？

来自主题: AI技术研报

10291 点击 2025-02-22 21:27

10美元成功复现DeepSeek顿悟时刻，3B模型爆发超强推理！微软论文实锤涌现

不到10美元，3B模型就能复刻DeepSeek的顿悟时刻了？来自荷兰的开发者采用轻量级的RL算法Reinforce-Lite，把复刻成本降到了史上最低！同时，微软亚研院的一项工作，也受DeepSeek-R1启发，让7B模型涌现出了高级推理技能。

来自主题: AI技术研报

7841 点击 2025-02-22 15:50

AI智能体结对编程秒杀人类，90分钟神作惊动OpenAI总裁！引全网140万围观

AI组队自主开发时代来临！OpenAI Operator和Replit Agent组队编程，仅在5个提示90分钟内完成了应用程序的开发。

来自主题: AI技术研报

8672 点击 2025-02-22 15:19

干完几星期家务，1X新款人形机器人亮相，和冰箱一样安静

家用人形机器人的未来是这样。

来自主题: AI技术研报

10240 点击 2025-02-22 14:24

YOLO已经悄悄来到v12，首个以Attention为核心的YOLO框架问世

YOLO 系列模型的结构创新一直围绕 CNN 展开，而让 transformer 具有统治优势的 attention 机制一直不是 YOLO 系列网络结构改进的重点。这主要的原因是 attention 机制的速度无法满足 YOLO 实时性的要求。

来自主题: AI技术研报

10298 点击 2025-02-22 14:14

一次推理解决复合问题：基于MoE的大语言模型知识模块可扩展融合推理架构MeteoRA

在大语言模型领域中，预训练 + 微调范式已经成为了部署各类下游应用的重要基础。在该框架下，通过使用搭低秩自适应（LoRA）方法的大模型参数高效微调（PEFT）技术，已经产生了大量针对特定任务、可重用的 LoRA 适配器。

来自主题: AI技术研报

9002 点击 2025-02-22 13:57

关于DeepSeek部署的一切，都在这里

DeepSeek-R1及其蒸馏版本模型突破了AI Reasoning和大规模AI性能的新基准，其中DeepSeek-R1-Zero和DeepSeek-R1，已经在推理和问题求解上树立了新的标准。本次研究聚焦于如何利用已有的机器进行模型部署，使用这些先进的模型进行开发和研究。

来自主题: AI技术研报

12198 点击 2025-02-21 18:06

蚕食人类权力不用AGI降临！「温水煮青蛙」足以让AI渐进式失控

随着人工智能的加速发展，我们常常担心AI会突然失控、超越人类控制。然而，最新研究指出，这种「突然失控」的场景或许并非最令人担忧的；AI在各个领域逐步取代人类，导致人类权力和影响力的缓慢流失，可能才是更隐蔽、更难以应对的渐变式风险。

来自主题: AI技术研报

5708 点击 2025-02-21 16:24

杭州95后学霸坐C位，Grok 3登顶App Store！Hinton高徒、多伦多华人博士领衔

官宣免费后，Grok火速登顶美区App Store榜首，同时，xAI也放出官方博文，秀了一把模型的数学、代码、ASCII Art演示。最引人瞩目的两位C位华人，均来自多伦多大学，分别和Hinton、Bengio有交集。

来自主题: AI技术研报

8048 点击 2025-02-21 16:17

谷歌超硬核教科书来了！Jeff Dean带货揭Gemini训练秘籍：在TPU上scaling

谷歌团队发布LLM硬核技术教科书，从「系统视图」揭秘LLM Scaling的神秘面纱。Jeff Dean强调书中藏着谷歌最强AI模型Gemini训练的更多信息。

来自主题: AI技术研报

11984 点击 2025-02-21 15:52

大模型扩展新维度：Scaling Down、Scaling Out

近年来， Scaling Up 指导下的 AI 基础模型取得了多项突破。从早期的 AlexNet、BERT 到如今的 GPT-4，模型规模从数百万参数扩展到数千亿参数，显著提升了 AI 的语言理解和生成等能力。然而，随着模型规模的不断扩大，AI 基础模型的发展也面临瓶颈：高质量数据的获取和处理成本越来越高，单纯依靠 Scaling Up 已难以持续推动 AI 基础模型的进步。

来自主题: AI技术研报

11473 点击 2025-02-21 15:43