AI资讯新闻榜单内容搜索-Mark

速递｜专注电脑操控Agent，Prentis初创公司25人团队、估值10亿美元目标

Prentis 是一家新的人工智能研究实验室，专注于计算机使用模型，由连续创业者 Ritankar Das 与科技大佬 Reid Hoffman 和 Mark Pincus 共同创立，据两位知情人士透露，该公司正商谈筹集 1 亿美元、估值 10 亿美元的融资。

来自主题: AI资讯

7759 点击 2026-07-27 16:01

在硅谷一场关于 Coding 的Demo Night：当agent开始读代码，工具全得重做

你有没有想过，写代码这件事的对象正在悄悄换人？上周一晚上，我在旧金山Market Street上WorkOS的办公室里待了将近两个小时，看了二十几个现场demo。进门之前我以为这只是一场普通的创业展示夜，但看完之后我意识到，这群人在展示的根本不是产品，而是他们对"写代码、用代码、读代码"这件事本身的理解，已经发生了多深的变化。

来自主题: AI资讯

6922 点击 2026-07-26 11:26

苹果 Mac 将迎来全线换代，一种给人用，一种给 AI 用

Mark Gurman 披露了一份苹果直到 2028 年的 Mac 路线图。

来自主题: AI资讯

9634 点击 2026-07-24 11:34

Workflow Gym：告别仿真测试，抹平Agent落地鸿沟

你可能已经在各种 benchmark 榜单上看过 GUI Agent 的 "大胜" 了。

来自主题: AI技术研报

6854 点击 2026-07-24 10:45

速递｜AI直接配对：AI社交初创Overtone获1800万美元融资，Hinge创始人再创业

Hinge 创始人 Justin McLeod 宣布为他的新交友公司 Overtone 完成了 1800 万美元的融资。McLeod 去年刚刚辞去他在 Hinge 的首席执行官职务，Hinge 的所有者 Match Group——也拥有 Tinder 和 OkCupid 等应用——正在与 FirstMark Capital 和 Pace Capital 一起为他的新公司提供资金支持。

来自主题: AI资讯

9413 点击 2026-07-19 10:14

47.6％，阿里Qoder拿到了比跑分更硬的成绩

对 AI Coding 来说，有人用，比任何 Benchmark 都管用，而有人持续付费，又比有人用更管用。

来自主题: AI资讯

5822 点击 2026-07-16 14:45

3.8万小时、狂烧天价token：字节发现Agent的 Scaling Law

7月2日，字节 Seed 发布了一个 Agent评测项目 EdgeBench。看起来又是一个 benchmark，但它问了一个其他榜单不问的问题。EdgeBench 的切口就是把盲区里的东西放进评测，解答一个问题：把Agent扔进一个陌生环境，12小时后，你能变强多少？

来自主题: AI技术研报

8901 点击 2026-07-08 15:53

Claude、GLM、GPT谁才是真正的AI软件工程师？首个持续更新Visual Spec-to-App Benchmark发布

为了解决这一问题，来自 University of Arizona、Zoom 与 Stony Brook University 的研究团队推出了 VISTA（VIsual Spec-To-App Benchmark）, 首个面向 Visual Spec-to-Web-App Coding Agents 的端到端 Benchmark。

来自主题: AI技术研报

8239 点击 2026-07-06 15:49

扎克伯格承认：Meta AI智能体研发不及预期

今日，据路透社报道，Meta创始人兼CEO马克·扎克伯格（Mark Zuckerberg）当地时间7月2日在公司内部全员会上承认，过去至少四个月，AI智能体技术的研发进展并未如他预期般提速，Meta押注AI新组织架构的布局“至今尚未落地见效”。路透社称，这一信息来自其听取的一段会议录音。

来自主题: AI资讯

8107 点击 2026-07-03 16:11

AGI倒计时，OpenAI首席研究官重磅表态：留给人类的窗口「很小」

OpenAI首席研究官Mark Chen释放了一个强烈信号：OpenAI 并不认为scaling laws已经失效，恰恰相反，预训练、数据工程、推理训练和更长任务链条，仍是通向AGI的主干道路。

来自主题: AI资讯

5983 点击 2026-07-02 10:34