AI资讯新闻榜单内容搜索-Ark

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Ark
o3-pro通关“推箱子”,人类怀旧小游戏成了大模型新Benchmark

o3-pro通关“推箱子”,人类怀旧小游戏成了大模型新Benchmark

o3-pro通关“推箱子”,人类怀旧小游戏成了大模型新Benchmark

推箱子、俄罗斯方块……这些人类的经典怀旧小游戏,也成大模型benchmark了。 o3-pro刚刚也挑战了这两款游戏,而且表现还都不错,直接突破了benchmark上限

来自主题: AI技术研报
9941 点击    2025-06-16 17:26
华人团队 Genspark 被 Claude 选入优秀案例

华人团队 Genspark 被 Claude 选入优秀案例

华人团队 Genspark 被 Claude 选入优秀案例

AI 搜索 Agent 产品 Genspark 近期被 Anthropic 官方点名了。「Less structure, more intelligence.」是 AI 搜索 Agent 产品 Genspark 一直以来坚持的基本原则。Genspark 团队认为,过度结构化的工作流程会限制创造力和深度,赋予专业 Agent 更多自主权,自由选择并灵活运用多种工具来处理问题,反而能释放出更强的能力。

来自主题: AI资讯
5616 点击    2025-06-12 19:06
深度对话 Benchmark 合伙人:AI 打破了 SaaS 的 3322 规则改变创造本质

深度对话 Benchmark 合伙人:AI 打破了 SaaS 的 3322 规则改变创造本质

深度对话 Benchmark 合伙人:AI 打破了 SaaS 的 3322 规则改变创造本质

Benchmark 合伙人 Eric Vishria 最近跟 Banana Capital 合伙人 Turner Novak 在其播客 The Peel 做了一个非常精彩的对话,这是我最近觉得非常不错的一个访谈。

来自主题: AI资讯
8610 点击    2025-06-11 14:45
速递| OpenAI与Benchmark投资前员工创立的初创公司,AI材料科学Periodic Labs估值10亿美元

速递| OpenAI与Benchmark投资前员工创立的初创公司,AI材料科学Periodic Labs估值10亿美元

速递| OpenAI与Benchmark投资前员工创立的初创公司,AI材料科学Periodic Labs估值10亿美元

两年半前,Liam Fedus 曾参与 ChatGPT 的研发团队,掀起了人工智能热潮。如今他加入了日益壮大的 OpenAI 前员工创业阵营,乘着 AI 投资风口创立自己的企业。

来自主题: AI资讯
7458 点击    2025-06-06 16:19
Anthropic 官方:Genspark 是如何构建 Agents 的?

Anthropic 官方:Genspark 是如何构建 Agents 的?

Anthropic 官方:Genspark 是如何构建 Agents 的?

Genspark 借助 Claude 打造自适应的 AI Agents,改变了人们研究和创建内容的新姿势,为复杂的工作流提供了极大的效率和规模。Genspark 借助 Claude 打造自适应的 AI Agents,改变了人们研究和创建内容的新姿势,为复杂的工作流提供了极大的效率和规模。

来自主题: AI资讯
9581 点击    2025-06-01 10:49
1/15成本,实现AI水印新SOTA | 南洋理工大学&A*STAR

1/15成本,实现AI水印新SOTA | 南洋理工大学&A*STAR

1/15成本,实现AI水印新SOTA | 南洋理工大学&A*STAR

给AI生成的作品打水印,让AIGC图像可溯源,已经成为行业共识。

来自主题: AI技术研报
7715 点击    2025-05-31 16:48
2025,AI Agent赛道还有哪些机会?

2025,AI Agent赛道还有哪些机会?

2025,AI Agent赛道还有哪些机会?

进入2025年以来, AI Agent的发展明显提速。5月6日,OpenAI宣布以30亿美元收购 Windsurf;编程工具Cursor的母公司Anysphere也获得了9亿美元的融资,估值高达90亿美元;号称中国第一个通用AI Agent的Manus在五月也获得了硅谷老牌风险投资公司Benchmark领投的7500万美元的融资;

来自主题: AI资讯
8746 点击    2025-05-27 13:06
红杉中国发布 xbench,首个由投资机构打造的 AI 基准测试

红杉中国发布 xbench,首个由投资机构打造的 AI 基准测试

红杉中国发布 xbench,首个由投资机构打造的 AI 基准测试

随着基础模型的快速发展和 AI Agent 进入规模化应用阶段,被广泛使用的基准测试(Benchmark)却面临一个日益尖锐的问题:想要真实地反映 AI 的客观能力正变得越来越困难。

来自主题: AI技术研报
8757 点击    2025-05-27 09:50
从 Manus、Genspark 到 Lovart、ListenHub、Medeo:一张图谱看懂华人 Agent 浪潮

从 Manus、Genspark 到 Lovart、ListenHub、Medeo:一张图谱看懂华人 Agent 浪潮

从 Manus、Genspark 到 Lovart、ListenHub、Medeo:一张图谱看懂华人 Agent 浪潮

如果用一句话为 2025 年写下注脚,那它不会是某个技术名词,而更像是一种哲学上的转变:“这一年,我们不再是孤立地使用软件,而是与智能的代理人(Agent)共舞,它们正悄然重塑我们的工作与生活。”

来自主题: AI资讯
10788 点击    2025-05-22 14:42