AI资讯新闻榜单内容搜索-大模型

春节回家我用递归学习法，跟大模型学会了「算八字」

上个月，我在 X 上刷到一个叫 Gabriel 的年轻人的故事。他从大学辍学，用 AI 自学人工智能，最终成为了 OpenAI 的研究员。真正吸引我的，是他在个人博客里分享的一套学习方法：「递归学习法」。

来自主题: AI资讯

8457 点击 2026-02-25 10:36

Anthropic指控中国大模型“使诈”，马斯克凶猛炮轰，海外网友贴脸开骂

今天，美国大模型独角兽Anthropic连续发布多则推文、博客，指控DeepSeek、月之暗面和MiniMax三家中国AI实验室，正对Claude进行“工业级规模的蒸馏攻击”。

来自主题: AI资讯

8782 点击 2026-02-24 18:59

字节Seed用化学思想搞AI，把DeepSeek-R1的脑回路拆成了分子结构

字节Seed都开始用化学思想搞大模型了——深度推理是共价键、自我反思是氢键、自我探索是范德华力？！

来自主题: AI技术研报

9689 点击 2026-02-24 15:37

大模型真听懂了吗？最全综合性口语感知与推理基准 | ICLR'26

随着多模态大模型能力不断扩展，语音大模型(SpeechLLMs) 已从语音识别走向复杂语音交互。然而，当模型逐渐进入真实口语交互场景，一个更基础的问题浮现出来：我们是否真正定义清楚了「语音理解」的能力边界？

来自主题: AI技术研报

10286 点击 2026-02-24 15:35

花21000块钱，测34205条主流大模型用例，结论免费给你

春节闭关五天，我做了个东西：一个大模型场景化测评平台。35000+ 次模型跑测，一共 42+ 模型，11,000 块人民币。我全部跑完了，结论汇成一个平台，还会持续更新。

来自主题: AI产品测评

8772 点击 2026-02-24 15:31

MiniMax 成为 Token 调用第一后，模型厂商必须面对的 AgentOS 现实

作为目前全球最主要的大模型 API 聚合网关之一，OpenRouter 的 Token 调用量在 2026 年 1 月下旬出现了明显跃升。自 1 月 26 日当周开始，平台 Token 周增量首次突破 1.5T，这一幅度在过去的调用曲线中并不常见。时间点同样值得玩味——这一轮增长几乎与 OpenClaw 的迅速传播高度重合。人们开始发现，OpenClaw 简直就是 Token 碎纸机。

来自主题: AI资讯

9107 点击 2026-02-23 19:13

训练奖励太稀疏？港中文联合美团给Agent加上「过程分」

在很多大模型和 Agent 的训练里，最常见的一种做法就是只看结果：最后答案对了就给奖励，错了就当 0 分。在单轮问答里，这样「只看结果」还勉强能用；可一旦换成 Agent 这种要多轮对话、搜索、刷

来自主题: AI技术研报

8446 点击 2026-02-22 11:29

如何评价杨立昆认为大模型只是对海量文本的模式进行复杂拟合，根本不懂意义？

1970年，一个叫Gordon Gallup的心理学家把一面镜子放进了黑猩猩的笼子里。黑猩猩一开始对着镜子龇牙。它以为那是另一只黑猩猩。它威胁它，拍胸脯，绕到镜子后面找那只不存在的敌人。

来自主题: AI资讯

9510 点击 2026-02-19 12:01

一个模型统一所有离线任务！微软用671B大模型重构广告推荐「推理大脑」

近日，微软Bing Ads与DKI团队发表论文《AdNanny: One Reasoning LLM for All Offline Ads Recommendation Tasks》，宣布基于DeepSeek-R1 671B打造了统一的离线推理中枢AdNanny，用单一模型承载所有离线任务。这标志着从维护一系列任务特定模型，转向部署一个统一的、推理中心化的基础模型，从

来自主题: AI技术研报

9072 点击 2026-02-18 13:29

千问 3.5，用第一性原理打破大模型的不可能三角

千问 3.5 总参数量仅 3970 亿，激活参数更是只有 170 亿，不到上一代万亿参数模型 Qwen3-Max 的四分之一，性能大幅提升、还顺带实现了原生多模态能力的代际跃迁。

来自主题: AI资讯

10009 点击 2026-02-16 20:19