AI资讯新闻榜单内容搜索-

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 
超越 Manus?华人创业产品 Genspark 推出通用 Agent(附实测效果)

超越 Manus?华人创业产品 Genspark 推出通用 Agent(附实测效果)

超越 Manus?华人创业产品 Genspark 推出通用 Agent(附实测效果)

Genspark 是啥?我们在去年 6 月就有过介绍,Genspark 是由前百度小度的 CEO 景鲲和 CTO 朱凯华创业做的 Agent 产品,去年刚开始的定位还是 Agent Search Engine,到了今天升级了不少。并且在今年三月,官宣拿到了一亿美金的 A 轮融资。

来自主题: AI资讯
12213 点击    2025-04-03 11:03
OpenAI 刚刚开源了 PaperBench,用于评估 Agent 复现顶尖论文能力!

OpenAI 刚刚开源了 PaperBench,用于评估 Agent 复现顶尖论文能力!

OpenAI 刚刚开源了 PaperBench,用于评估 Agent 复现顶尖论文能力!

PaperBench 是一个由 OpenAI 开发的基准测试,旨在评估 AI Agent 复现尖端 AI 研究的能 力。它专注于测试 AI 是否能理解研究论文、独立开发代码并执行实验以复现研究结果。

来自主题: AI技术研报
9166 点击    2025-04-03 10:57
类比的长河,为何流到大模型就被截流?

类比的长河,为何流到大模型就被截流?

类比的长河,为何流到大模型就被截流?

当我们遇到新问题时,往往会通过类比过去的经验来寻找解决方案,大语言模型能否如同人类一样类比?在对大模型的众多批判中,人们常说大模型只是记住了训练数据集中的模式,并没有进行真正的推理。

来自主题: AI技术研报
10905 点击    2025-04-03 10:50
OpenAI官方基准测试:承认Claude遥遥领先(狗头)

OpenAI官方基准测试:承认Claude遥遥领先(狗头)

OpenAI官方基准测试:承认Claude遥遥领先(狗头)

刚刚开源的新基准测试PaperBench,6款前沿大模型驱动智能体PK复现AI顶会论文,新版Claude-3.5-Sonnet显著超越o1/r1排名第一。与去年10月OpenAI考验Agent机器学习代码工程能力MLE-Bnch相比,PaperBench更考验综合能力,不再是只执行单一任务。

来自主题: AI资讯
10594 点击    2025-04-03 10:37
解锁600亿美元蓝海:端侧降噪 + RTC大模型重塑AI玩具交互体验

解锁600亿美元蓝海:端侧降噪 + RTC大模型重塑AI玩具交互体验

解锁600亿美元蓝海:端侧降噪 + RTC大模型重塑AI玩具交互体验

2025 年,DeepSeek 爆火带动传统产品的智能化升级,如传统玩具向 AI 玩具转型。央视新闻调查数据显示,2025 年 1 月,国内某电商平台面向 3-6 岁儿童的 AI 早教玩具销量环比增长 6 倍。咨询公司 IMARC 的预测数据显示,2024 年全球 AI 玩具市场规模已达 181 亿美元,预计到 2033 年将增长至 600 亿美元。

来自主题: AI资讯
9620 点击    2025-04-03 10:26
很多投资人心里都住着一个“朱啸虎”

很多投资人心里都住着一个“朱啸虎”

很多投资人心里都住着一个“朱啸虎”

敢于戳破“国王新衣”的人毕竟是少数,大部分投资机构的心态是:怕投错,但更怕错过。

来自主题: AI资讯
8050 点击    2025-04-03 10:20