AI资讯新闻榜单内容搜索-不

实测国内外大模型数学能力：YiXin-Distill-Qwen-72B登顶，半数大厂模型不及格？

数学题，一直是检验 AI 实力的 “硬核考场” —— 公式推导、逻辑链条、抽象思维缺一不可。最近，我好了几天时间对国内外 7 款大厂模型展开了一场 “数学高考 ”，用阿里全球数学竞赛 + 中国奥赛真题实测它们的智商上限。

来自主题: AI产品测评

13301 点击 2025-04-01 14:25

这比真人都真

来自主题: AI资讯

4595 点击 2025-04-01 10:13

2025年，人工智能领域正在经历一场由LLM Agent引发的深刻变革，不管普通人的衣食住行还是研究者的尖端研究，都很难不受Agent的影响。

来自主题: AI技术研报

12569 点击 2025-04-01 10:06

从Google Glasses到HoloLens，再到近几年雷鸟创新、Even Realities、影目、星纪魅族、Rokid等陆续发布量产产品，AR眼镜在不断刷新其轻薄程度。

来自主题: AI资讯

9546 点击 2025-04-01 09:58

“创业公司不要浪费一分钱去训练底层模型”、“所有的应用都是套壳应用，关键是如何构建长期壁垒”。

来自主题: AI资讯

9418 点击 2025-04-01 09:36

目前AI短剧还在“有没有”的阶段，但普通观众在乎的是“好不好看”。

来自主题: AI资讯

12579 点击 2025-04-01 09:33

一夜之间，OpenAI更新三大动向，开源、融资、用户暴增。第一，将开源一个具备推理能力的大语言模型，包含参数权重那种。上一次这样开源还是6年前推出GPT-2。

来自主题: AI资讯

10883 点击 2025-04-01 09:15

DeepSeek的出圈，不仅引爆了全社会对于AI的大讨论，更重要的是激发各界人士从观望者转变为参与者，掀起了一波真实的人工智能落地潮。在孕育了AI的互联网生态中，AI引起的变化会首当其冲，且影响更彻底。广告作为互联网生态最主要的商业模式，更是当前AI技术应用的主战场。

来自主题: AI资讯

8986 点击 2025-04-01 08:59

目前，有个开源MCP合集算是github上最火的合集之一，已经超过20000颗星评价相当高，并且还在不断高频率迭代更新。估计以后会成为标杆MCP开源库吧。

来自主题: AI资讯

10940 点击 2025-03-31 15:18

两家期刊实验表明，250美元报酬，能加快评审速度而不降低质量。但专家警告，现金激励可能悄然改变科研生态，这将为学术评审带来新生，还是埋下隐患？

来自主题: AI资讯

11318 点击 2025-03-31 15:13