AI资讯新闻榜单内容搜索-LLM

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: LLM

让Agent记住一切是愚蠢的：SimpleMem用「结构化语义压缩」登顶记忆SOTA

让Agent记住一切是愚蠢的：SimpleMem用「结构化语义压缩」登顶记忆SOTA

让Agent记住一切是愚蠢的：SimpleMem用「结构化语义压缩」登顶记忆SOTA

如果人类的大脑像现在的LLM Agent一样工作，记住每一句今天明天的废话，我们在五岁时就会因为内存溢出而宕机。真正的智能，核心不在于“存储”，而在于高效的“遗忘”与“重组”。

来自主题: AI技术研报

9254 点击 2026-01-15 09:22

AAAI 2026｜AP2O-Coder 让大模型拥有「错题本」，像人类一样按题型高效刷题

AAAI 2026｜AP2O-Coder 让大模型拥有「错题本」，像人类一样按题型高效刷题

AAAI 2026｜AP2O-Coder 让大模型拥有「错题本」，像人类一样按题型高效刷题

在 AI 辅助 Coding 技术快速发展的背景下，大语言模型（LLMs）虽显著提升了软件开发效率，但开源的 LLMs 生成的代码依旧存在运行时错误，增加了开发者调试成本。

来自主题: AI技术研报

9847 点击 2026-01-14 15:28

Sebastian Raschka 2026预测：Transformer统治依旧，但扩散模型正悄然崛起

Sebastian Raschka 2026预测：Transformer统治依旧，但扩散模型正悄然崛起

Sebastian Raschka 2026预测：Transformer统治依旧，但扩散模型正悄然崛起

站在 2026 年的开端回望，LLM 的架构之争似乎进入了一个新的微妙阶段。过去几年，Transformer 架构以绝对的统治力横扫了人工智能领域，但随着算力成本的博弈和对推理效率的极致追求，挑战者们从未停止过脚步。

来自主题: AI技术研报

9967 点击 2026-01-14 15:25

CaveAgent让LLM学会了“跑代码”，你能把Agent变成Jupyter里的“老司机”

CaveAgent让LLM学会了“跑代码”，你能把Agent变成Jupyter里的“老司机”

CaveAgent让LLM学会了“跑代码”，你能把Agent变成Jupyter里的“老司机”

CaveAgent的核心思想很简单：与其让LLM费力地去“读”数据的文本快照，不如给它一个如果不手动重启、变量就永远“活着”的 Jupyter Kernel。这项由香港科技大学（HKUST）领衔的研究，为我们展示了一种“Code as Action, State as Memory”的全新可能性。它解决了所有开发过复杂Agent的工程师最头疼的多轮对话中的“失忆”与“漂移”问题。

来自主题: AI技术研报

9081 点击 2026-01-09 14:34

「听觉」引导「视觉」，OmniAgent开启全模态主动感知新范式

「听觉」引导「视觉」，OmniAgent开启全模态主动感知新范式

「听觉」引导「视觉」，OmniAgent开启全模态主动感知新范式

针对端到端全模态大模型（OmniLLMs）在跨模态对齐和细粒度理解上的痛点，浙江大学、西湖大学、蚂蚁集团联合提出 OmniAgent。这是一种基于「音频引导」的主动感知 Agent，通过「思考 - 行动 - 观察 - 反思」闭环，实现了从被动响应到主动探询的范式转变。

来自主题: AI技术研报

7271 点击 2026-01-09 10:54

深入感知级别图像理解：UniPercept 统一图像美学、质量与结构纹理感知

深入感知级别图像理解：UniPercept 统一图像美学、质量与结构纹理感知

深入感知级别图像理解：UniPercept 统一图像美学、质量与结构纹理感知

尽管多模态大语言模型（MLLMs）在识别「图中有什么」这一语义层面上取得了巨大进步，但在理解「图像看起来怎么样」这一感知层面上仍显乏力。

来自主题: AI技术研报

6644 点击 2026-01-08 15:23

多模态推理新范式！DiffThinker：用扩散模型「画」出推理和答案

多模态推理新范式！DiffThinker：用扩散模型「画」出推理和答案

多模态推理新范式！DiffThinker：用扩散模型「画」出推理和答案

在多模态大模型（MLLMs）领域，思维链（CoT）一直被视为提升推理能力的核心技术。然而，面对复杂的长程、视觉中心任务，这种基于文本生成的推理方式正面临瓶颈：文本难以精确追踪视觉信息的变化。形象地说，模型不知道自己想到哪一步了，对应图像是什么状态。

来自主题: AI技术研报

7335 点击 2026-01-08 15:20

为了解决95%AI项目的失败，我们需要让Agentic「回到未来」

为了解决95%AI项目的失败，我们需要让Agentic「回到未来」

为了解决95%AI项目的失败，我们需要让Agentic「回到未来」

您可能已经感受到了，从2025年开始到如今，全世界都在谈论Agentic AI或Agent（代理式AI）。从董事会到咨询公司，从更高级别的战略到街头巷尾，仿佛只要接入了大模型（LLM），所有的业务流程就能自动运转，效率就能翻倍。

来自主题: AI技术研报

11107 点击 2026-01-06 16:18

空间智能终极挑战MMSI-Video-Bench来了，顶级大模型全军覆没

空间智能终极挑战MMSI-Video-Bench来了，顶级大模型全军覆没

空间智能终极挑战MMSI-Video-Bench来了，顶级大模型全军覆没

空间理解能力是多模态大语言模型（MLLMs）走向真实物理世界，成为 “通用型智能助手” 的关键基础。但现有的空间智能评测基准往往有两类问题：一类高度依赖模板生成，限制了问题的多样性；另一类仅聚焦于某一种空间任务与受限场景，因此很难全面检验模型在真实世界中对空间的理解与推理能力。

来自主题: AI技术研报

8334 点击 2026-01-06 09:50

字节Seed：大概念模型来了，推理的何必是下一个token

字节Seed：大概念模型来了，推理的何必是下一个token

字节Seed：大概念模型来了，推理的何必是下一个token

LLM的下一个推理单位，何必是Token？刚刚，字节Seed团队发布最新研究——DLCM（Dynamic Large Concept Models）将大模型的推理单位从token（词）动态且自适应地推到了concept（概念）层级。

来自主题: AI技术研报

10063 点击 2026-01-04 21:01

上一页当前第10页,共148页下一页