AI资讯新闻榜单内容搜索-Arc

刚刚谷歌发布 Gemini 3.1 Pro

今天凌晨，Google 发布 Gemini 3.1 Pro。核心提升在推理能力，ARC-AGI-2（抽象推理基准）从 3 Pro 的 31.1% 跳到 77.1%，翻了一倍多，GPQA Diamond（科学知识推理）从 91.9% 提到 94.3%

来自主题: AI资讯

10170 点击 2026-02-20 02:47

开源：参考OpenClaw，我们给 Claude Code 加上了轻量化的永久透明记忆

但考虑到在代码领域，如何做好记忆与检索，相比其他场景又有所不同，因此，基于 memsearch CLI ，我们同时也为Claude Code 做了个永久记忆的 plugin——memsearch ccplugin（可适用所有AI coding软件）。

来自主题: AI技术研报

8160 点击 2026-02-14 10:11

Loop-ViT：让AI学会「反复思考」，3.8M参数小模型追平人类平均水平

当我们解一道复杂的数学题或观察一幅抽象图案时，大脑往往需要反复思考、逐步推演。然而，当前主流的深度学习模型却走的是「一次通过」的路线——输入数据，经过固定层数的网络，直接输出答案。

来自主题: AI技术研报

9583 点击 2026-02-13 11:08

DeepAgent与DeepSearch双双霸榜！答案指向openJiuwen这一新兴开源项目

2026 开年至今，人工智能圈子最火的是一只小龙虾 Clawdbot 。

来自主题: AI技术研报

6209 点击 2026-02-12 14:57

硅谷顶级风投350页年度报告：从算力竞赛到能源革命，这些科技领域正在剧烈重构

Contrary 是一家成立于 2018 年的美国风险投资公司，由 Eric Tarczynski 创办，自成立以来，其以“人才驱动＋研究驱动”为核心方法论，在全球顶级高校铺设了庞大的人才网络，通过识别最优秀的年轻技术人才来发现投资机会。

来自主题: AI资讯

9667 点击 2026-02-09 16:01

先解行为，再训Agent：CMU开源首份Agentic Search日志数据，把Agent拆开给你看

在大模型驱动的 Agentic Search 日益常态化的背景下，真实环境中智能体 “如何发查询、如何改写、是否真正用上检索信息” 一直缺乏系统刻画与分析。

来自主题: AI技术研报

8239 点击 2026-02-09 14:55

Vibe Researching必备的科研MCP和Skills，实现10倍学术产出

大家好，我是鲁工。 Vibe Coding概念火了之后，顺带在很多领域兴起了Vibe的潮流。比如Vibe PPT、Vibe Video，以及我今天要聊的Vibe Researching。

来自主题: AI技术研报

8750 点击 2026-02-02 10:03

顶尖模型离“科学家”还差得远？AI4S亟待迈向2.0时代

周伯文还详细介绍了上海 AI 实验室近年来开展的前沿探索与实践，包括驱动 “通专融合” 发展的技术架构 ——“智者”SAGE（Synergistic Architecture for Generalizable Experts），其包含基础、融合与进化三个层次，并可双向循环实现全栈进化；支撑 AGI4S 探索的两大基础设施“书生”科学多模态大模型 Intern-S1、“

来自主题: AI资讯

9332 点击 2026-01-30 19:13

速递｜初创公司Arcee AI低成本六个月训练，发布4000亿参数开源大模型Trinity

行业内许多人认为AI 模型市场的赢家早已确定：大型科技公司将主导市场（谷歌、Meta、微软，以及部分亚马逊业务）并联合其选择的模型开发商，主要是 OpenAI 和 Anthropic。

来自主题: AI资讯

9706 点击 2026-01-30 16:12

谷歌Gemini在“搜索”领域仍具有绝对统治力。深度研究智能体到底该怎么选？OSU & Amazon最新

面对琳琅满目的Deep Research Agent（深度研究智能体），究竟该如何选型？本文基于OSU与Amazon最新发布的MMDR-Bench论文，为您提供一份经过严谨科学验证的“避坑指南”。结论先行：综合任务首选谷歌Gemini Deep Research，而涉及计算机科学与数据结构的硬核任务，GPT-5.2依然是专家首选。

来自主题: AI技术研报

7704 点击 2026-01-26 11:29