AI资讯新闻榜单内容搜索-Mark

ClawCiv：OpenClaw的电竞排行榜来了

想象一下：你精心调教了两周的 OpenClaw，自信满满地跑了一组 Benchmark——结果发现全球排名 387 位，前面那位用的模型跟你一样，但分数比你高 40%。你想不想知道他到底配了什么 Skill？

来自主题: AI资讯

9150 点击 2026-03-29 13:09

aiX-apply-4B逆袭DeepSeek-V3.2！aiXcoder发布代码变更应用模型，单卡推理提效15倍

硅心科技（aiXcoder）发布了一款专为「代码变更应用」场景设计的高性能、轻量级模型 aiX-apply-4B。基准测试结果显示，在 20 多种主流编程语言及 Markdown 等多类型文件格式的测试中，aiX-apply-4B 的平均准确率达到 93.8%，超越 Qwen3-4B 基座模型 62.6% 的准确度

来自主题: AI技术研报

8927 点击 2026-03-27 18:21

新「上帝之手」MiroFish，干爆 Polymarket，其实只是个壳？｜附全面实测

X 上到处都是各种传奇故事：有人已经用它赚了超过 140 万美元，有人短期内迅速赚了几万美元。这个项目在国内曝光的比较少，但在海外各个社区已经成了现象级项目。这个项目叫：MiroFish。

来自主题: AI产品测评

8676 点击 2026-03-22 09:43

Benchmark 5000万美元押注Gumloop ：下一个独角兽是让实习生也能造AI Agent

Gumloop 刚刚宣布完成 5000 万美元的 B 轮融资，由 Benchmark 领投，Nexus VP、First Round Capital、Y Combinator、Box Group、The Cannon Project 和 Shopify Ventures 参与跟投。

来自主题: AI资讯

9346 点击 2026-03-21 10:28

CVPR'26 | 以机器人为中心的ToM推理框架，从心智推理到决策行动

吉林大学&微软亚洲研究院等团队提出MindPower框架，让机器人像人一样理解他人想法并主动帮忙，构建了首个以机器人为中心的心智推理评测体系，通过六层推理链条，让AI不仅看懂场景，更能推断意图、做出决策、执行动作，显著提升助人能力。

来自主题: AI技术研报

6592 点击 2026-03-17 08:49

OpenAI开除内鬼！拿着改变世界的机密去赌博，一夜狂赚几十万

OpenAI刚刚开除了一名员工，原因令人瞠目：此人利用公司核心机密，在Polymarket等预测市场上疯狂下注牟利。更炸裂的是，调查发现这绝非个例——过去一年多，60个神秘钱包做出了77次精准到离谱的「内幕押注」。

来自主题: AI资讯

8471 点击 2026-03-16 10:41

Legora、Mercor 都在用，Reducto 能成为独立的 LLM 数据入口吗？

Reducto 在去年 6 个月内接连完成分别由 Benchmark 与 a16z 领投的两轮融资，估值翻了 3 倍，达到 6 亿美元。我们认为，Reducto 切中了 AI 应用走向生产环境过程中的“精确数据摄取”瓶颈。

来自主题: AI资讯

9950 点击 2026-03-14 08:41

卡帕西开源Agent自进化训练框架，5分钟一轮实验，48h内揽星9.5k

大神Karpathy又开源了新项目——一个能够自主进化的AI科研循环系统。这个项目名叫autoresearch，主打让智能体完全自主地搞科研，只要在Markdown文档里写好指令，剩下的流程全都由AI自动完成。

来自主题: AI技术研报

8149 点击 2026-03-09 18:28

YC总裁转发、登顶Hacker News：SkillsBench揭开Agent技能扩展的残酷真相

近日，一篇名为《SkillsBench: Benchmarking How Well Agent Skills Work Across Diverse Tasks》的论文预印本引爆了海外 AI 社区，YC 总裁 Garry Tan 亲自转发，登顶 Hacker News（363 票 / 163 评论），霸榜 AlphaXiv #1，

来自主题: AI技术研报

7483 点击 2026-03-07 11:08

弯道超车？国产具身，千小时人类数据激发智能涌现

导读：近日，位于中关村的深度机智全球首次使用全新范式——人类学习，在多个国际 Benchmark 上取得 SOTA，史无前例地使用全新架构（仅使用人类第一视角数据、零真机数据）击败 Physical Intelligence 和英伟达等头部巨头二十多个百分点，并在两会开幕首日被央视报道。

来自主题: AI技术研报

8905 点击 2026-03-05 14:29