AI资讯新闻榜单内容搜索-模型训练

7B小模型超越DeepSeek-R1：模仿人类教师，弱模型也能教出强推理LLM | Transformer作者团队

Thinking模式当道，教师模型也该学会“启发式”教学了—— 由Transformer作者之一Llion Jones创立的明星AI公司Sakana AI，带着他们的新方法来了！

来自主题: AI技术研报

10071 点击 2025-06-25 10:55

Cache Me If You Can：陈丹琦团队如何「抓住」关键缓存，解放LLM内存？

普林斯顿大学计算机科学系助理教授陈丹琦团队又有了新论文了。近期，诸如「长思维链」等技术的兴起，带来了需要模型生成数万个 token 的全新工作负载。

来自主题: AI技术研报

10006 点击 2025-06-25 10:51

众所周知视频不能P？北大施柏鑫团队、贝式计算CVPR研究：视频里轻松换衣服、加柯基

视频是信息密度最高、情感表达最丰富的媒介之一，高度还原现实的复杂性与细节。

来自主题: AI资讯

8026 点击 2025-06-25 10:29

机器人视觉语言导航进入R1时代！港大联合上海AI Lab提出全新具身智能框架

你对着家里的机器人说：“去厨房，看看冰箱里还有没有牛奶。”

来自主题: AI资讯

7121 点击 2025-06-25 10:09

一文读懂深度表格数据表示学习 | 南京大学

在AI应用中，表格数据的重要性愈发凸显，广泛应用于金融、医疗健康、教育、推荐系统及科学研究领域。

来自主题: AI技术研报

7555 点击 2025-06-25 09:57

ToMAP：赋予大模型「读心术」，打造更聪明的AI说服者

本文第一作者为韩沛煊，本科毕业于清华大学计算机系，现为伊利诺伊大学香槟分校（UIUC）计算与数据科学学院一年级博士生，接受 Jiaxuan You 教授指导。

来自主题: AI资讯

8595 点击 2025-06-25 09:53

合成数据>人工数据，绝对性能暴涨超10个点！仅需任务定义，高效微调大模型

基础模型严重依赖大规模、高质量人工标注数据来学习适应新任务、领域。为解决这一难题，来自北京大学、MIT等机构的研究者们提出了一种名为「合成数据强化学习」（Synthetic Data RL）的通用框架。该框架仅需用户提供一个简单的任务定义，即可全自动地生成高质量合成数据。

来自主题: AI技术研报

9622 点击 2025-06-24 16:13

ACL 2025 | 让小说角色「活」起来！复旦BookWorld打造沉浸式小说世界模拟系统

想象为《红楼梦》或《权力的游戏》创造一个AI的世界。书中的角色们变成AI，活在BookWorld当中。每天，他/她们醒来，思考，彼此对话、互动，建立感情和关系。

来自主题: AI技术研报

9320 点击 2025-06-24 15:59

强化学习新发现：无需数学样本，仅游戏训练AI推理大增

最近，强化学习领域出现了一个颠覆性发现：研究人员不再需要大量数学训练样本，仅仅让 AI 玩简单游戏，就能显著提升其数学推理能力。

来自主题: AI技术研报

8754 点击 2025-06-24 15:25

LLM进入「拖拽时代」！只靠Prompt，几秒定制一个大模型，效率飙升12000倍

最近，来自NUS、UT Austin等机构的研究人员创新性地提出了一种「拖拽式大语言模型」（DnD），它可以基于提示词快速生成模型参数，无需微调就能适应任务。不仅效率最高提升12000倍，而且具备出色的零样本泛化能力。

来自主题: AI技术研报

8869 点击 2025-06-24 14:26

AI资讯新闻榜单内容搜索-模型训练

7B小模型超越DeepSeek-R1：模仿人类教师，弱模型也能教出强推理LLM | Transformer作者团队

Cache Me If You Can：陈丹琦团队如何「抓住」关键缓存，解放LLM内存？

众所周知视频不能P？北大施柏鑫团队、贝式计算CVPR研究：视频里轻松换衣服、加柯基

机器人视觉语言导航进入R1时代！港大联合上海AI Lab提出全新具身智能框架

一文读懂深度表格数据表示学习 | 南京大学

ToMAP：赋予大模型「读心术」，打造更聪明的AI说服者

合成数据>人工数据，绝对性能暴涨超10个点！仅需任务定义，高效微调大模型

ACL 2025 | 让小说角色 「活」起来！复旦BookWorld打造沉浸式小说世界模拟系统

强化学习新发现：无需数学样本，仅游戏训练AI推理大增

LLM进入「拖拽时代」！只靠Prompt，几秒定制一个大模型，效率飙升12000倍

ACL 2025 | 让小说角色「活」起来！复旦BookWorld打造沉浸式小说世界模拟系统