AI资讯新闻榜单内容搜索-Arc

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
搜索: Arc
17款大模型PK八款棋牌游戏,o3-mini胜出,DeepSeek R1输在中间步骤

17款大模型PK八款棋牌游戏,o3-mini胜出,DeepSeek R1输在中间步骤

17款大模型PK八款棋牌游戏,o3-mini胜出,DeepSeek R1输在中间步骤

AI社区掀起用大模型玩游戏之风!例如国外知名博主让DeepSeek和Chatgpt下国际象棋的视频在Youtube上就获得百万播放,ARC Prize组织最近也发布了一个贪吃蛇LLM评测基准SnakeBench。

来自主题: AI技术研报
7741 点击    2025-03-29 10:19
OWL团队万字分享:复现Manus最好的团队,如何看待Agentic AI的落地现状?

OWL团队万字分享:复现Manus最好的团队,如何看待Agentic AI的落地现状?

OWL团队万字分享:复现Manus最好的团队,如何看待Agentic AI的落地现状?

CAMEL-AI 团队在 Manus 上线后 1 天内推出的 OWL 就是其中最具代表性的一个,项目实测成绩达到开源界 GAIA 性能天花板,达到了 58.18%,超越 Huggingface 提出的 Open Deep Research 55.15% 的表现。

来自主题: AI资讯
7790 点击    2025-03-29 09:57
到底什么是踏马的 Agentic Workflows?

到底什么是踏马的 Agentic Workflows?

到底什么是踏马的 Agentic Workflows?

AI Agents,Agentic AI,Agentic Architectures,Agentic Workflows......

来自主题: AI技术研报
7997 点击    2025-03-28 10:03
实测豆包刚刚上线的新版深度思考,他们也向DeepSearch迈出了一步。

实测豆包刚刚上线的新版深度思考,他们也向DeepSearch迈出了一步。

实测豆包刚刚上线的新版深度思考,他们也向DeepSearch迈出了一步。

今天晚上,就在刚刚,豆包终于上了之前很多人期待的功能,深度思考。我之前用别人的账号体验过这功能,就是推理模型,而今天看到的第一刻,我以为的是,豆包的推理模型终于全量上线了。

来自主题: AI资讯
7688 点击    2025-03-27 21:28
全球顶级模型集体0分,AI终极大考人类5分钟秒杀!Keras之父戳破AGI神话

全球顶级模型集体0分,AI终极大考人类5分钟秒杀!Keras之父戳破AGI神话

全球顶级模型集体0分,AI终极大考人类5分钟秒杀!Keras之父戳破AGI神话

AI界「智商大考」ARC-AGI-2重磅出炉了!一个人类用5分钟轻松解开的谜题,却让最顶尖LLM全线崩盘得分挂零,o3更是从曾经76%暴跌至4%。它正式宣告,人类还未实现AGI。

来自主题: AI技术研报
6983 点击    2025-03-25 17:53
诺和诺德架构大调整,全面拥抱AI!

诺和诺德架构大调整,全面拥抱AI!

诺和诺德架构大调整,全面拥抱AI!

3月20日,丹麦制药巨头诺和诺德执行副总裁兼首席科学官Marcus Schindler在Linkedin发布了关于诺和诺德的研发组织架构调整的消息。Marcus Schindler还提到,大数据和人工智能将成为我们科学工作的核心,使我们能够加深对疾病的理解并做出明智的决定。这些变化不仅使我们能够快速创新,而且还缩短了从不确定到确定的路径,减少了周期时间和成本,同时增加了我们成功的可能性。

来自主题: AI资讯
5646 点击    2025-03-24 09:02
万字探讨Agent发展真方向:模型即产品,Agent的未来要靠模型而不是Workflow

万字探讨Agent发展真方向:模型即产品,Agent的未来要靠模型而不是Workflow

万字探讨Agent发展真方向:模型即产品,Agent的未来要靠模型而不是Workflow

知名 AI 工程师、Pleias 的联合创始人 Alexander Doria 最近针对 DeepResearch、Agent 以及 Claude Sonnet 3.7 发表了两篇文章,颇为值得一读,尤其是 Agent 智能体的部分。

来自主题: AI技术研报
6462 点击    2025-03-22 16:38
马斯克加入Agent争霸赛!Grok DeeperSearch上场,对决Gemini Deep Research

马斯克加入Agent争霸赛!Grok DeeperSearch上场,对决Gemini Deep Research

马斯克加入Agent争霸赛!Grok DeeperSearch上场,对决Gemini Deep Research

AI智能体迎来新玩家!Grok 3推出的DeeperSearch功能,提升DeepSearch搜索能力,更加深入分析复杂主题。免费放开Deep Research功能后,Gemini 2.0公布研究智能体6大使用技巧。2025年度Agent大战开打!

来自主题: AI资讯
7900 点击    2025-03-21 12:37
DeepSearch/DeepResearch中最优文本段选择和URL重排

DeepSearch/DeepResearch中最优文本段选择和URL重排

DeepSearch/DeepResearch中最优文本段选择和URL重排

如果你已经读过我们上一篇经典长文《DeepSearch/DeepResearch 的设计与实现》,那么不妨再深挖一些能大幅提升回答质量的细节。这次,我们将重点关注两个细节:

来自主题: AI技术研报
9127 点击    2025-03-20 09:57
啪啪打脸!Search-R1让DeepSeek-R1实时获取信息,实现26%提升的争议与启发 | 最新

啪啪打脸!Search-R1让DeepSeek-R1实时获取信息,实现26%提升的争议与启发 | 最新

啪啪打脸!Search-R1让DeepSeek-R1实时获取信息,实现26%提升的争议与启发 | 最新

本文介绍了Search-R1技术,这是一项通过强化学习训练大语言模型进行推理并利用搜索引擎的创新方法。实验表明,Search-R1在Qwen2.5-7B模型上实现了26%的性能提升,使模型能够实时获取准确信息并进行多轮推理。本文详细分析了Search-R1的工作原理、训练方法和实验结果,为AI产品开发者提供了重要参考。

来自主题: AI技术研报
9186 点击    2025-03-20 09:48