ICLR 2026|UIUC:一行代码彻底解决LLM推理的过度思考!
ICLR 2026|UIUC:一行代码彻底解决LLM推理的过度思考!2025 年 1 月 20 日,DeepSeek 发布了推理大模型 DeepSeek-R1,在学术界和工业界引发了对大模型强化学习方法的广泛关注与研究热潮。 研究者发现,在数学推理等具有明确答案的任务
2025 年 1 月 20 日,DeepSeek 发布了推理大模型 DeepSeek-R1,在学术界和工业界引发了对大模型强化学习方法的广泛关注与研究热潮。 研究者发现,在数学推理等具有明确答案的任务
LaST₀团队 投稿 量子位 | 公众号 QbitAI 近日,至简动力、北京大学、香港中文大学、北京人形机器人创新中心提出了一种名为LaST₀的全新隐空间推理VLA模型,在基于Transformer混
随着 AI 智能体(Agent)能力日益强大,其自主行为带来的安全风险也愈发复杂。现有安全工具往往只能给出「安全 / 不安全」的简单判断,无法告知我们风险的根源。为此,上海人工智能实验室正式开源 Ag
一直以来,神经网络的激活函数就像是 AI 引擎中的火花塞。从早期的 Sigmoid、Tanh,到后来统治业界的 ReLU,再到近年来的 GELU 和 Swish,每一次激活函数的演进都伴随着模型性能的提升。但长期以来,寻找最佳激活函数往往依赖于人类直觉或有限的搜索空间。
我深入研究Salient的故事后发现,这个行业的落后程度超乎想象。美国近80%的家庭都有某种形式的债务,每年大约有8000亿美元的新汽车贷款发放。为了服务这些贷款,贷款机构每年要花费200亿到300亿美元——主要是雇佣大量人工打电话、发信件、协商还款计划。这是一个巨大的成本中心,但几十年来基本没有发生任何技术革新。
外网都在好奇: 全球模型服务平台 OpenRouter 上这个搜索第一的神秘模型是哪家的? 这个匿名模型叫做「Pony Alpha」。根据 OpenRouter 官方的说法,它是新一代的通用大模型,在编程、逻辑推理和角色扮演方面表现突出,并针对 Agent 工作流进行了优化,具有极高的工具调用准确率。
Claude刚刚血洗全球软件业,高盛就放出炸弹:我们正在用Claude,实现会计的全自动化。OpenAI也紧急表示:我们让软件开发经历第二次重生了!
王慧文再次搅动江湖,他深夜再发英雄帖,这次要入局OpenClaw了!老王表示,不管你是已经在创业、需要融资的,还是想组局一起创业,或是想入职相关创业公司的,都可以直接联系他,他愿意帮忙。
网上对 Codex 的评价在这几天也有了不少逆转,许多开发者从 Claude Code 转向 Codex,一些在国内的独立开发者也表示 Codex Plus 会员就可以用,而且还不会像 Claude 那般总是无情封号。
营销,正式进入 AI 时代。 近日,专注于答案引擎优化(AEO)的 AI Agent 平台 PallasAI 宣布完成数千万人民币融资,由香港上市公司有赞(8083.HK)独家投资。这是该公司三个月内