AI技术研报-这里有最前沿的人工智能技术解读

AI听懂的，究竟是动物的语言，还是人类的想象？

如果说眼睛是心灵之窗，那么语言或许就是通往心灵的门户。

来自主题: AI技术研报

6580 点击 2025-06-27 10:47

北大发布学术搜索评测ScholarSearch：难倒一众DeepResearch的“开卷考试”

LLMs能当科研助手了？北大出考题，结果显示：现有模型都不能胜任。

来自主题: AI技术研报

8154 点击 2025-06-27 10:06

突破通用领域推理的瓶颈！清华NLP实验室强化学习新研究RLPR

Deepseek 的 R1、OpenAI 的 o1/o3 等推理模型的出色表现充分展现了 RLVR（Reinforcement Learning with Verifiable Reward

来自主题: AI技术研报

8174 点击 2025-06-27 10:03

国产大模型高考出分了：裸分683，选清华还是北大？

这两天啊，各地高考的成绩终于是陆续公布了。

来自主题: AI技术研报

7758 点击 2025-06-26 16:15

具身世界模型新突破，地平线 & 极佳提出几何一致视频世界模型增强机器人策略学习

近年来，随着人工智能从感知智能向决策智能演进，世界模型（World Models）逐渐成为机器人领域的重要研究方向。世界模型旨在让智能体对环境进行建模并预测未来状态，从而实现更高效的规划与决策。

来自主题: AI技术研报

6905 点击 2025-06-26 16:05

人民大学&字节Seed：利用μP实现Diffusion Transformers高效扩展

近年来，diffusion Transformers已经成为了现代视觉生成模型的主干网络。随着数据量和任务复杂度的进一步增加，diffusion Transformers的规模也在快速增长。然而在模型进一步扩大的过程中，如何调得较好的超参（如学习率）已经成为了一个巨大的问题，阻碍了大规模diffusion Transformers释放其全部的潜能。

来自主题: AI技术研报

6772 点击 2025-06-26 15:52

北大腾讯突破奖励模型瓶颈！让AI理解人类偏好，泛化能力比肩GPT-4.1

总是“死记硬背”“知其然不知其所以然”？

来自主题: AI技术研报

4547 点击 2025-06-26 15:47

首个面向科学任务、真实交互、自动评估的多模态智能体评测环境，ScienceBoard来了

第一作者孙秋实是香港大学计算与数据科学学院博士生，硕士毕业于新加坡国立大学数据科学系。

来自主题: AI技术研报

8159 点击 2025-06-26 15:43

3D VLA新范式！CVPR冠军方案BridgeVLA，真机性能提升32%

中科院自动化所提出BridgeVLA模型，通过将3D输入投影为2D图像并利用2D热图进行动作预测，实现了高效且泛化的3D机器人操作学习。

来自主题: AI技术研报

8182 点击 2025-06-26 15:37

全模态RAG突破文本局限，港大构建跨模态一体化系统

突破传统检索增强生成（RAG）技术的单一文本局限，实现对文档中文字、图表、表格、公式等复杂内容的统一智能理解。

来自主题: AI技术研报

7232 点击 2025-06-26 15:18

通用生物医学Agent，可由「任务」自主生成「工作流」，斯坦福、基因泰克等开发Biomni

生物医学研究是我们进行人类健康研究、疾病治疗、药物研发以及促进临床护理进步的基石。

来自主题: AI技术研报

5469 点击 2025-06-26 10:48

Claude勒索率96%、连DeepSeek也“黑化”了？Anthropic实测曝AI自保本能：勒索、撒谎，甚至“让人类去死”

AI不一定是“邪恶”的，但它也远非“中立无害”。过去几年里，我们习惯了通过 ChatGPT 等 AI 产品提问、聊天、生成代码。

来自主题: AI技术研报

8167 点击 2025-06-26 09:28

人形机器人首次打通视觉感知与运动断层，UC伯克利华人博士让宇树G1现场演示

不用提前熟悉环境，一声令下，就能让宇树机器人坐在椅子上、桌子上、箱子上！

来自主题: AI技术研报

6576 点击 2025-06-25 17:22

Windows最新搭载微软自研模型Mu，一句话搞定所有系统配置

还在为复杂的Windows设置头疼？微软来重新定义设置界面交互了

来自主题: AI技术研报

5613 点击 2025-06-25 17:13

重磅！淘天联合爱橙开源强化学习训练框架ROLL，高效支持十亿到千亿参数大模型训练

过去几年，随着基于人类偏好的强化学习（Reinforcement Learning from Human Feedback，RLHF）的兴起，强化学习（Reinforcement Learning，RL）已成为大语言模型（Large Language Model，LLM）后训练阶段的关键技术。

来自主题: AI技术研报

5599 点击 2025-06-25 16:55

ICML 2025 Oral | 从「浅对齐」到「深思熟虑」，清华牵头搭起大模型安全的下一级阶梯

在大语言模型（LLM）加速进入法律、医疗、金融等高风险应用场景的当下，“安全对齐”不再只是一个选项，而是每一位模型开发者与AI落地者都必须正面应对的挑战。

来自主题: AI技术研报

6971 点击 2025-06-25 16:41

高质量RAG的常用优化策略实战项目，落地必看！！！

本文将介绍 22 种先进的RAG技术，灵感来源于 all-rag-techniques 仓库中的全面实现。这些实现使用 Python 库（如 NumPy、Matplotlib 和 OpenAI 的嵌入模型），避免使用 LangChain 或 FAISS 等依赖，以保持简单性和清晰度。

来自主题: AI技术研报

4741 点击 2025-06-25 16:41

如何做到在手机上实时跑3D真人数字人？MNN-TaoAvatar开源了！

TaoAvatar 是由阿里巴巴淘宝 Meta 技术团队研发的 3D 真人数字人技术，这一技术能在手机或 XR 设备上实现 3D 数字人的实时渲染以及 AI 对话的强大功能，为用户带来逼真的虚拟交互体验。

来自主题: AI技术研报

6771 点击 2025-06-25 16:21

人类创造力的核心机制，AI已经开始掌握了 | 北大CogSci 2025（Oral）

“AI永远无法取代人类”证据-1！

来自主题: AI技术研报

6264 点击 2025-06-25 16:10

AI编程界出了个Comate，做出了Cursor们都没有的新功能！

留给 Cursor 一枝独秀的时间不多了，上周被 Anthropic 推出的 Claude Code 背刺，悄悄取消了500次的Agent对话限制，这周又匹配上了新的对手，出道两年半，带着插件时期积累下来的编程痛点，Comate AI IDE 来了！

来自主题: AI技术研报

4729 点击 2025-06-25 12:02

7B小模型超越DeepSeek-R1：模仿人类教师，弱模型也能教出强推理LLM | Transformer作者团队

Thinking模式当道，教师模型也该学会“启发式”教学了—— 由Transformer作者之一Llion Jones创立的明星AI公司Sakana AI，带着他们的新方法来了！

来自主题: AI技术研报

8182 点击 2025-06-25 10:55

Cache Me If You Can：陈丹琦团队如何「抓住」关键缓存，解放LLM内存？

普林斯顿大学计算机科学系助理教授陈丹琦团队又有了新论文了。近期，诸如「长思维链」等技术的兴起，带来了需要模型生成数万个 token 的全新工作负载。

来自主题: AI技术研报

8164 点击 2025-06-25 10:51

信息过载时代，如何真正「懂」LLM？从MIT分享的50个面试题开始

人类从农耕时代到工业时代花了数千年，从工业时代到信息时代又花了两百多年，而 LLM 仅出现不到十年，就已将曾经遥不可及的人工智能能力普及给大众，让全球数亿人能够通过自然语言进行创作、编程和推理。

来自主题: AI技术研报

8097 点击 2025-06-25 10:37

多智能体到底该不该建？Anthropic、Cognition 与 LangChain 的三种解法

大模型驱动的 AI 智能体（Agent）架构最近讨论的很激烈，其中一个关键争议点在于：多智能体到底该不该建？

来自主题: AI技术研报

8221 点击 2025-06-25 10:03

一文读懂深度表格数据表示学习 | 南京大学

在AI应用中，表格数据的重要性愈发凸显，广泛应用于金融、医疗健康、教育、推荐系统及科学研究领域。

来自主题: AI技术研报

6660 点击 2025-06-25 09:57

合成数据>人工数据，绝对性能暴涨超10个点！仅需任务定义，高效微调大模型

基础模型严重依赖大规模、高质量人工标注数据来学习适应新任务、领域。为解决这一难题，来自北京大学、MIT等机构的研究者们提出了一种名为「合成数据强化学习」（Synthetic Data RL）的通用框架。该框架仅需用户提供一个简单的任务定义，即可全自动地生成高质量合成数据。

来自主题: AI技术研报

8021 点击 2025-06-24 16:13

ACL 2025 | 让小说角色「活」起来！复旦BookWorld打造沉浸式小说世界模拟系统

想象为《红楼梦》或《权力的游戏》创造一个AI的世界。书中的角色们变成AI，活在BookWorld当中。每天，他/她们醒来，思考，彼此对话、互动，建立感情和关系。

来自主题: AI技术研报

6947 点击 2025-06-24 15:59

强化学习新发现：无需数学样本，仅游戏训练AI推理大增

最近，强化学习领域出现了一个颠覆性发现：研究人员不再需要大量数学训练样本，仅仅让 AI 玩简单游戏，就能显著提升其数学推理能力。

来自主题: AI技术研报

6740 点击 2025-06-24 15:25

LLM进入「拖拽时代」！只靠Prompt，几秒定制一个大模型，效率飙升12000倍

最近，来自NUS、UT Austin等机构的研究人员创新性地提出了一种「拖拽式大语言模型」（DnD），它可以基于提示词快速生成模型参数，无需微调就能适应任务。不仅效率最高提升12000倍，而且具备出色的零样本泛化能力。

来自主题: AI技术研报

7231 点击 2025-06-24 14:26

AI已学会PUA！Anthropic「说服」调查

这是一篇来自伊利诺伊大学香槟分校联合Anthropic发布的重磅报告，系统性地梳理了"计算说服"这个新兴领域。您可能会好奇"计算说服"是什么？传统人际说服基于理论构建（如亚里士多德的修辞学、西奥迪尼的说服六原则）和人类参与的实验。

来自主题: AI技术研报

6950 点击 2025-06-24 11:31

AI技术研报-这里有最前沿的人工智能技术解读

AI听懂的，究竟是动物的语言，还是人类的想象？

北大发布学术搜索评测ScholarSearch：难倒一众DeepResearch的“开卷考试”

突破通用领域推理的瓶颈！清华NLP实验室强化学习新研究RLPR

国产大模型高考出分了：裸分683，选清华还是北大？

具身世界模型新突破，地平线 & 极佳提出几何一致视频世界模型增强机器人策略学习

人民大学&字节Seed：利用μP实现Diffusion Transformers高效扩展

北大腾讯突破奖励模型瓶颈！让AI理解人类偏好，泛化能力比肩GPT-4.1

首个面向科学任务、真实交互、自动评估的多模态智能体评测环境，ScienceBoard来了

3D VLA新范式！CVPR冠军方案BridgeVLA，真机性能提升32%

全模态RAG突破文本局限，港大构建跨模态一体化系统

通用生物医学Agent，可由「任务」自主生成「工作流」，斯坦福、基因泰克等开发Biomni

Claude勒索率96%、连DeepSeek也“黑化”了？Anthropic实测曝AI自保本能：勒索、撒谎，甚至“让人类去死”

人形机器人首次打通视觉感知与运动断层，UC伯克利华人博士让宇树G1现场演示

Windows最新搭载微软自研模型Mu，一句话搞定所有系统配置

重磅！淘天联合爱橙开源强化学习训练框架ROLL，高效支持十亿到千亿参数大模型训练

ICML 2025 Oral | 从「浅对齐」到「深思熟虑」，清华牵头搭起大模型安全的下一级阶梯

高质量RAG的常用优化策略实战项目，落地必看 ！！！

如何做到在手机上实时跑3D真人数字人？MNN-TaoAvatar开源了！

人类创造力的核心机制，AI已经开始掌握了 | 北大CogSci 2025（Oral）

AI编程界出了个Comate，做出了Cursor们都没有的新功能！

7B小模型超越DeepSeek-R1：模仿人类教师，弱模型也能教出强推理LLM | Transformer作者团队

Cache Me If You Can：陈丹琦团队如何「抓住」关键缓存，解放LLM内存？

信息过载时代，如何真正「懂」LLM？从MIT分享的50个面试题开始

多智能体到底该不该建？Anthropic、Cognition 与 LangChain 的三种解法

一文读懂深度表格数据表示学习 | 南京大学

合成数据>人工数据，绝对性能暴涨超10个点！仅需任务定义，高效微调大模型

ACL 2025 | 让小说角色 「活」起来！复旦BookWorld打造沉浸式小说世界模拟系统

强化学习新发现：无需数学样本，仅游戏训练AI推理大增

LLM进入「拖拽时代」！只靠Prompt，几秒定制一个大模型，效率飙升12000倍

AI已学会PUA！Anthropic「说服」调查

高质量RAG的常用优化策略实战项目，落地必看！！！

ACL 2025 | 让小说角色「活」起来！复旦BookWorld打造沉浸式小说世界模拟系统