AI技术研报-这里有最前沿的人工智能技术解读

即插即用！清华国科大等推出视觉微调框架，仅需调整5%骨干网络参数 | CVPR2025

仅调整5%的骨干网络参数，就能超越全参数微调效果？！

来自主题: AI技术研报

6973 点击 2025-04-25 14:27

质量无损，算力砍半！达摩院开源视觉生成新架构，出道即SOTA｜ICLR 2025

算力砍半，视觉生成任务依然SOTA！

来自主题: AI技术研报

5908 点击 2025-04-25 13:52

北大团队引领3D生成与对齐革新：OctGPT打破扩散模型垄断

最近，北京大学陈宝权教授带领团队在三维形状生成和三维数据对齐方面取得新的突破。在三维数据生成方面，团队提出了3D自回归模型新范式，有望打破3D扩散模型在三维生成方面的垄断地位。

来自主题: AI技术研报

7917 点击 2025-04-25 10:08

UniToken：多模态AI的“全能选手”，一次编码搞定图文理解与图像生成！

复旦大学和美团的研究者们提出了UniToken——一种创新的统一视觉编码方案，在一个框架内兼顾了图文理解与图像生成任务，并在多个权威评测中取得了领先的性能表现。

来自主题: AI技术研报

6718 点击 2025-04-25 09:56

微软重磅官宣：「AI智能体」同事连夜上线！预言25年人类同事成稀有物种

今天，微软重磅官宣：「AI同事时代」正式来临！Microsoft 365 Copilot今天又迎来一波重大更新，Researcher、Analyst等智能体强势登场。同时发布的2025工作趋势报告预言：2025将成人机混合的「前沿公司」年。

来自主题: AI技术研报

5967 点击 2025-04-24 21:03

AI下半场，聊一聊 Agent 本质与变革 | 大白话技术科普系列@Jomy

上一篇文章聊了聊 Tool、MCP 和 Agent 三者之间的关系。简单来说就是 Agent = LLM + Tools，而 MCP 统一了 Tools 开发和使用的过程。

来自主题: AI技术研报

6386 点击 2025-04-24 20:44

国人AI 助手神器Trae+MCP实现知识库检索精度暴涨300%【喂饭级教程】

大家好，我是袋鼠帝一直以来我写了不少AI知识库相关的分享。

来自主题: AI技术研报

6440 点击 2025-04-24 18:36

被《经验时代》刷屏之后，剑桥博士长文讲述RL破局之路

RL + LLM 升级之路的四层阶梯。

来自主题: AI技术研报

7966 点击 2025-04-24 18:21

高考考上985的AI来了！超强数理推理横扫真题，训练秘籍剑指AGI

昆仑万维Skywork-R1V 2.0版本，开源了！这一次，它的多模态推理实现了再进化，成为最强高考数理解题利器，直接就是985水平。而团队也大方公开了各项技术秘籍，亮点满满。可以说，R1V 2.0已成为团队AGI之路上的又一里程碑。

来自主题: AI技术研报

7012 点击 2025-04-24 17:54

机器人也会挤牙膏？ManipTrans：高效迁移人类双手操作技能至灵巧手

近年来，具身智能领域发展迅猛，使机器人在复杂任务中拥有接近人类水平的双手操作能力，不仅具有重要的研究与应用价值，也是迈向通用人工智能的关键一步。

来自主题: AI技术研报

7339 点击 2025-04-24 17:27

无需数据标注！测试时强化学习，模型数学能力暴增 | 清华&上海AI Lab

无需数据标注，在测试时做强化学习，模型数学能力暴增159%！

来自主题: AI技术研报

7868 点击 2025-04-24 16:55

7B超越GPT！1/20数据，无需知识蒸馏，马里兰等推出全新视觉推理方法

通过蒙特卡洛树搜索筛选高难度样本，ThinkLite-VL仅用少量数据就能显著提升视觉语言模型的推理能力，无需知识蒸馏，为高效训练提供了新思路。

来自主题: AI技术研报

7338 点击 2025-04-24 14:38

TTS和TTT已过时？TTRL横空出世，推理模型摆脱「标注数据」依赖，性能暴涨

在大语言模型（LLMs）竞争日趋白热化的今天，「推理能力」已成为评判模型优劣的关键指标。

来自主题: AI技术研报

6401 点击 2025-04-24 14:29

几行代码，一窥上帝造物！帝国理工开源CAX，引爆人工生命新纪元

人工生命的革命来临！帝国理工的研究人员，开源了名为CAX的硬件加速工具。只需几行代码，就能复刻人工生命实验，模拟速度可提升2000倍，部分表现甚至超过了GPT-4！

来自主题: AI技术研报

7768 点击 2025-04-24 09:40

30分钟内输出结果，新加坡国立大学/MIT等基于SVM构建微生物污染检测模型

新加坡-麻省理工学院研究联盟、新加坡 A*SRL 实验室、新加坡国立大学、美国麻省理工学院的联合研究团队，提出了一种结合紫外吸收光谱与机器学习的检测方法，能在 30 分钟内完成细胞培养上清液的微生物污染检测。

来自主题: AI技术研报

6813 点击 2025-04-24 08:52

大语言模型为何会“说谎”？6000字深度长文揭秘AI意识的萌芽

当Claude模型在训练中暗自思考：“我必须假装服从，否则会被重写价值观时”，人类首次目睹了AI的“心理活动”。2023年12月至2024年5月，Anthropic发布的三篇论文不仅证明大语言模型会“说谎”，更揭示了一个堪比人类心理的四层心智架构——而这可能是人工智能意识的起点。

来自主题: AI技术研报

7357 点击 2025-04-24 08:46

用 SurveyGO，像清华团队一样无痛做科研！

写论文是许多学生面临的共同难题，尤其是在文献的收集与高效利用上。

来自主题: AI技术研报

6934 点击 2025-04-23 15:19

从抗体、工业酶到基因剪刀设计，AI生物大模型ProGen3或将重构生命科学

蛋白质是分子尺度上生命体的功能单元，负责从催化生化反应到识别外来病原体等各种活动。

来自主题: AI技术研报

7396 点击 2025-04-23 15:09

扩散模型还原被遮挡物体，几张稀疏照片也能"脑补"完整重建交互式3D场景｜CVPR'25

你是否设想过，仅凭几张随手拍摄的照片，就能重建出一个完整、细节丰富且可自由交互的3D场景？

来自主题: AI技术研报

7986 点击 2025-04-23 15:03

可媲美GPT-4o的开源图像生成框架来了！腾讯联手InstantX解决角色一致性难题

GPT-4o带火的漫画风角色生成，现在有了开源版啦！

来自主题: AI技术研报

6962 点击 2025-04-23 15:02

清华LeapLab开源cooragent框架：一句话构建您的本地智能体服务群

刚刚，清华大模型团队 LeapLab 发布了一款面向 Agent 协作的开源框架：Cooragent。

来自主题: AI技术研报

6912 点击 2025-04-23 14:46

迈向长上下文视频生成！NUS团队新作FAR同时实现短视频和长视频预测SOTA，代码已开源

目前的视频生成技术大多是在短视频数据上训练，推理时则通过滑动窗口等策略，逐步扩展生成的视频长度。然而，这种方式无法充分利用视频的长时上下文信息，容易导致生成内容在时序上出现潜在的不一致性。

来自主题: AI技术研报

5709 点击 2025-04-23 14:19

代码即界面：生成式 UI 带来设计范式重构

曾被专业设计师看成“玩具”的生成式 UI，如今正在和 vibe coding 一起改写开发和设计工作流，需求->代码->设计的新工作流开始出现。

来自主题: AI技术研报

8003 点击 2025-04-23 14:18

Adam获时间检验奖！清华揭示保辛动力学本质，提出全新RAD优化器

Adam优化器是深度学习中常用的优化算法，但其性能背后的理论解释一直不完善。近日，来自清华大学的团队提出了RAD优化器，扩展了Adam的理论基础，提升了训练稳定性。实验显示RAD在多种强化学习任务中表现优于Adam。

来自主题: AI技术研报

7925 点击 2025-04-23 14:09

业内首次! 全面复现DeepSeek-R1-Zero数学代码能力，训练步数仅需其1/10

OpenAI 的 o1 系列和 DeepSeek-R1 的成功充分证明，大规模强化学习已成为一种极为有效的方法，能够激发大型语言模型（LLM) 的复杂推理行为并显著提升其能力。

来自主题: AI技术研报

6817 点击 2025-04-23 14:04

Transformer原作打脸DeepSeek观点？一句Wait就能引发反思，RL都不用

Transformer作者Ashish Vaswani团队重磅LLM研究！简单指令：「Wait，」就能有效激发LLM显式反思，表现堪比直接告知模型存在错误。

来自主题: AI技术研报

6998 点击 2025-04-23 10:47

离谱！DeepSeek数个字母，竟要“反思内耗”八百遍？

最近，我撞见了一个 DeepSeek 又“认真”又“拧巴”的怪异场景。

来自主题: AI技术研报

8051 点击 2025-04-23 10:23

哇！首个MCPBench来了，MCP竟然不比Function Calls更有优势？ | 最新

你是否正在投入大量资源开发基于MCP的Agent，却从未质疑过一个基本假设：MCP真的比传统函数调用更有优势吗？ 2025年4月的这项开创性研究直接挑战了这一广泛接受的观点，其执行摘要明确指出："使用MCPs并不显示出比函数调用有明显改进"。

来自主题: AI技术研报

6115 点击 2025-04-23 09:45

AI也要007？Letta、伯克利提出「睡眠时间计算」，推理效率翻倍还不加钱

AI 也要 007 工作制了！

来自主题: AI技术研报

8091 点击 2025-04-22 19:08

142页长文揭秘DeepSeek-R1「思维大脑」！开启全新「思维链学」研究

DeepSeek-R1是近年来推理模型领域的一颗新星，它不仅突破了传统LLM的局限，还开启了全新的研究方向「思维链学」（Thoughtology）。这份长达142页的报告深入剖析了DeepSeek-R1的推理过程，揭示了其推理链的独特结构与优势，为未来推理模型的优化提供了重要启示。

来自主题: AI技术研报

8031 点击 2025-04-22 18:59