AI资讯新闻榜单内容搜索-大语言模型

1个 AI Agent=4个工厂老师傅？｜和王筱圃聊时序大模型和 toB Agent 这门生意

本周，我们关注 Agent 与工业结合正在发生的变化，我们邀请研发时序大模型 Geegobyte-g1 以及工业智能体平台「河谷」的初创企业极峰科技的创始人王筱圃，和我们聊一聊什么是时序大模型，和大语言模型的区别和具体的案例，他们如何训练一个 Agent 并把它卖给企业投入到生产流程中。希望能对大家了解 AI Agent 如何应用于工业生产有所帮助。

来自主题: AI资讯

9379 点击 2025-09-17 09:29

谢菲尔德大学：模型幻觉的数学必然性

幻觉不是 bug，是数学上的宿命。谢菲尔德大学的最新研究证明，大语言模型的幻觉问题在数学上不可避免—— 即使用完美的训练数据也无法根除。而更为扎心的是，OpenAI 提出的置信度阈值方案虽能减少幻

来自主题: AI技术研报

10296 点击 2025-09-15 08:34

将KV Cache预算降至1.5%！他们用进化算法把大模型内存占用砍下来了

只用 1.5% 的内存预算，性能就能超越使用完整 KV cache 的模型，这意味着大语言模型的推理成本可以大幅降低。EvolKV 的这一突破为实际部署中的内存优化提供了全新思路。

来自主题: AI技术研报

8097 点击 2025-09-15 08:33

全新MoE架构！阿里开源Qwen3-Next，训练成本直降9成

训练、推理性价比创新高。大语言模型（LLM），正在进入 Next Level。周五凌晨，阿里通义团队正式发布、开源了下一代基础模型架构 Qwen3-Next。总参数 80B 的模型仅激活 3B ，性能就可媲美千问 3 旗舰版 235B 模型，也超越了 Gemini-2.5-Flash-Thinking，实现了模型计算效率的重大突破。

来自主题: AI资讯

12149 点击 2025-09-12 10:10

李飞飞一年前究竟说了啥？怎么又火了

大语言模型的局限在哪里？

来自主题: AI技术研报

10328 点击 2025-09-11 19:26

意识智能体：大模型的下一个进化方向？

机器具备意识吗？本文对AI意识（AI consciousness）进行了考察，特别是深入探讨了大语言模型作为高级计算模型实例是否具备意识，以及AI意识的必要和充分条件。

来自主题: AI技术研报

9747 点击 2025-09-11 09:55

从第一性原理出发的RAG推理新范式来了，蚂蚁DIVER登顶权威基准

在当前由大语言模型（LLM）驱动的技术范式中，检索增强生成（RAG）已成为提升模型知识能力与缓解「幻觉」的核心技术。然而，现有 RAG 系统在面对需多步逻辑推理任务时仍存在显著局限，具体挑战如下：

来自主题: AI技术研报

10276 点击 2025-09-10 11:07

从「会说」迈向「会做」，LLM下半场：Agentic强化学习范式综述

过去几年，大语言模型（LLM）的训练大多依赖于基于人类或数据偏好的强化学习（Preference-based Reinforcement Fine-tuning, PBRFT）：输入提示、输出文本、获得一个偏好分数。这一范式催生了 GPT-4、Llama-3 等成功的早期大模型，但局限也日益明显：缺乏长期规划、环境交互与持续学习能力。

来自主题: AI技术研报

9779 点击 2025-09-09 10:49

0.01%参数定生死！苹果揭秘LLM「超级权重」，删掉就会胡说八道

苹果研究人员发现，在大模型中，极少量的参数，即便只有0.01%，仍可能包含数十万权重，他们将这一发现称为「超级权重」。超级权重点透了大模型「命门」，使大模型走出「炼丹玄学」。

来自主题: AI技术研报

8602 点击 2025-09-06 11:27

大模型“记性差一点”反而更聪明！金鱼损失随机剔除token，让AI不再死记硬背

训练大模型时，有时让它“记性差一点”，反而更聪明！大语言模型如果不加约束，很容易把训练数据原封不动地复刻出来。为解决这个问题，来自马里兰大学、图宾根大学和马普所的研究团队提出了一个新方法——金鱼损失（Goldfish Loss）。

来自主题: AI资讯

7489 点击 2025-09-04 11:33