AI资讯新闻榜单内容搜索-模型训练

晶圆级芯片和存算一体结合：中科院提出15万tokens/s晶圆级芯片方案丨ASPLOS'26

当前大模型的发展呈现出类似于“军备竞赛”的趋势——模型规模持续攀升，对计算硬件的需求也随之快速增长。

来自主题: AI技术研报

9075 点击 2026-04-21 09:25

如果把今天最热门的几个方向摆在一起看，你会发现它们其实在卡同一道坎。

来自主题: AI技术研报

9880 点击 2026-04-21 09:25

近年来，视频多模态大模型（VideoLLM）发展迅猛，在视频描述、视频问答、时序定位等任务上不断刷新性能上限。随着模型能力持续增强，业界也开始思考一个更重要的问题：视频大模型能不能不再只是 “看完一段视频再回答”，而是真正进入实时世界，持续观察、实时理解，并在关键时刻主动给出反馈？

来自主题: AI技术研报

6244 点击 2026-04-21 09:23

AI工程范式的迭代速度，正让行业陷入一种“定义赶不上进化”的焦虑。

来自主题: AI技术研报

9025 点击 2026-04-20 14:38

中国人民大学团队打造的AiScientist，旨在解决长程机器学习研究工程的持续性难题。该系统从论文理解开始，跨越环境配置、代码实现与实验迭代，保持状态连续与决策连贯，显著提升科研效率。其核心在于通过File-as-Bus机制，稳定保存项目状态，使AI能真正接手科研流程，而非仅辅助单个环节。

来自主题: AI技术研报

8253 点击 2026-04-20 14:36

ATM-Bench 将「个人 AI 助手是否真的记得你」这件事，变成了一个研究的测试基准。结果并不乐观：专用记忆智能体系统普遍低于 20%，而 OpenClaw、Codex、Claude Code 等通用智能体普遍表现不佳，最高准确率不到 40%。

来自主题: AI技术研报

10249 点击 2026-04-20 14:36

本文主要介绍来自该团队的最新论文：Scalable Object Relation Encoding for Better 3D Spatial Reasoning in Large Language Models。

来自主题: AI技术研报

6206 点击 2026-04-20 14:04

如今的大多数智能体，仍然活在一种「失忆式工作」模式中：每一次检索都是从零开始，每一条推理路径都无法沉淀，每一次失败也不会转化为经验。它们虽能多轮交互，但很难在深度研究中持续变强。

来自主题: AI技术研报

9440 点击 2026-04-20 14:02

研究者们花了十年去扩展层内的计算能力，却忘了扩展层间的通信能力。

来自主题: AI技术研报

6952 点击 2026-04-20 09:02

一年前，DeepSeek R1 横空出世，人们才意识到，真正让模型产生推理能力质变的，不必是更大的预训练规模 —— 后训练，用强化学习、过程奖励、闭环反馈，以极低的代价解锁了原本需要数倍算力才能触达的能力边界。

来自主题: AI技术研报

6599 点击 2026-04-20 09:00