AI资讯新闻榜单内容搜索-LLM

英伟达推出通用深度研究系统，可接入任何LLM，支持个人定制

英伟达也做深度研究智能体了。

来自主题: AI资讯

8258 点击 2025-09-09 11:58

从「会说」迈向「会做」，LLM下半场：Agentic强化学习范式综述

过去几年，大语言模型（LLM）的训练大多依赖于基于人类或数据偏好的强化学习（Preference-based Reinforcement Fine-tuning, PBRFT）：输入提示、输出文本、获得一个偏好分数。这一范式催生了 GPT-4、Llama-3 等成功的早期大模型，但局限也日益明显：缺乏长期规划、环境交互与持续学习能力。

来自主题: AI技术研报

9159 点击 2025-09-09 10:49

不微调，让LLM推理准确率暴增到99%！试下DeepConf，一个轻量级推理框架｜Meta最新

在大型语言模型（LLM）进行数学题、逻辑推理等复杂任务时，一个非常流行且有效的方法叫做 “自洽性”（Self-Consistency），通常也被称为“平行思考”。

来自主题: AI技术研报

6806 点击 2025-09-09 10:17

扎克伯格的豪赌初见成效？Meta新方法让LLM长上下文处理提速30倍

经历了前段时间的鸡飞狗跳，扎克伯格的投资似乎终于初见成效。

来自主题: AI技术研报

7584 点击 2025-09-08 16:30

0.01%参数定生死！苹果揭秘LLM「超级权重」，删掉就会胡说八道

苹果研究人员发现，在大模型中，极少量的参数，即便只有0.01%，仍可能包含数十万权重，他们将这一发现称为「超级权重」。超级权重点透了大模型「命门」，使大模型走出「炼丹玄学」。

来自主题: AI技术研报

8237 点击 2025-09-06 11:27

隐式推理，继CoT思维链之后，LLM的下一个技术奇点系统性综述来了｜港科大最新

您对“思维链”（Chain-of-Thought）肯定不陌生，从最早的GPT-o1到后来震惊世界的Deepseek-R1，它通过让模型输出详细的思考步骤，确实解决了许多复杂的推理问题。但您肯定也为它那冗长的输出、高昂的API费用和感人的延迟头疼过，这些在产品落地时都是实实在在的阻碍。

来自主题: AI技术研报

9896 点击 2025-09-05 10:22

通用LLM压缩算法，居然藏视频编码里！2.5bit实现4bit性能，硬件无缝支持

LLM.265研究发现，视频编码器本身就是一种高效的大模型张量编码器。原本用于播放8K视频的现成视频编解码硬件，其实压缩AI模型数据的效率也非常高，甚至超过了许多专门为AI开发的方案。该工作已被世界微架构大会MICRO-2025正式接收，相关成果将于今年10月在首尔进行展示与讨论。

来自主题: AI技术研报

8023 点击 2025-09-05 10:14

Copilot强塞马斯克Grok新模型，遭开发者集体“抵抗”！GitHub内部工程师曝：我们是被“胁迫”的

近日，微软旗下的协作式编程平台 GitHub 正深化与埃隆·马斯克旗下 xAI 公司的合作，将 xAI 的 Grok Code Fast 1 大型语言模型（LLM）的早期使用权整合到 GitHub Copilot 中。

来自主题: AI资讯

9370 点击 2025-09-04 12:30

奥数金牌只是序章！OpenAI谷歌彻底打脸预言家，AI巨浪势不可挡

2022年，专家们笃定AI到2025年赢得IMO金牌概率不足10%。谁料短短3年，OpenAI和谷歌DeepMind的LLM双双摘金，不仅打破纪录，更宣告群体智能时代的到来！AI震撼人心，巨变势不可挡。

来自主题: AI资讯

8366 点击 2025-09-04 11:39

苹果新研究：不微调、不重训，如何让AI提问效率暴增6.5倍？

在这场以大型语言模型（LLM）为核心的 AI 浪潮中，苹果似乎一直保持着低调，很少出现在技术报道的前沿。尽管如此，时不时地，该公司也能拿出一些非常亮眼的研究成果，比如能在 iPhone 上直接运行的高效视觉语言模型 FastVLM。

来自主题: AI技术研报

8959 点击 2025-09-03 13:04