AI资讯新闻榜单内容搜索-大模型

68页论文再锤大模型竞技场！Llama4发布前私下测试27个版本，只取最佳成绩

大模型竞技场的可信度，再次被锤。

来自主题: AI技术研报

9775 点击 2025-05-02 17:56

DeepSeek放大招！新模型专注数学定理证明，大幅刷新多项高难基准测试。在普特南测试上，新模型DeepSeek-Prover-V2直接把记录刷新到49道。目前的第一名在657道题中只做出10道题，为Kimi与AIME2024冠军团队Numina合作成果Kimina-Prover。

来自主题: AI技术研报

10560 点击 2025-05-01 22:52

4月29日，习近平总书记在上海考察时，在中共中央政治局委员、上海市委书记陈吉宁和市长龚正陪同下，来到位于徐汇区的上海“模速空间”大模型创新生态社区调研。

来自主题: AI资讯

9149 点击 2025-05-01 14:22

2025年4月29日凌晨，距离通义千问Qwen3正式发布还有5小时，X和GitHub上的开发者们已经搬好小板凳蹲守发布。开源社区的技术爱好者们熬夜刷新，等待第一时间测试和体验这款备受期待的中国大模型新作。

来自主题: AI资讯

10190 点击 2025-05-01 13:57

由智谱和清华大学联合举办的“地狱级”黑客松 -《2024金融行业·大模型挑战赛》。该黑客松颇为艰困，完全复刻了金融行业二级市场的真实需求。而经过数月奋战，我，作为一名金融市场“门外汉”，在1300+名选手中“杀出一条血路”，最终获得了全国第七名以及10,000元的奖金。

来自主题: AI资讯

11053 点击 2025-05-01 10:26

Meta首届LlamaCon开发者大会开幕，扎克伯格在期间接受采访，回应大模型相关的一切。包括Llama4在大模型竞技场表现不佳的问题：

来自主题: AI资讯

10287 点击 2025-05-01 09:27

可灵的下一步：优先保证模型效果、聚焦专业生产者做渗透。，快手在今日成立了可灵 AI 事业部。该事业部下设可灵 AI 产品部、运营部和技术部，负责可灵、可图等系列大模型业务，快手高级副总裁盖坤担任可灵 AI 事业部负责人，继续兼任社区科学线负责人。

来自主题: AI资讯

10355 点击 2025-04-30 21:11

开源大模型新王者，正在受到空前关注。

来自主题: AI产品测评

11653 点击 2025-04-30 19:40

在推荐、广告场景，如何利用好大模型的能力？这是个很有挑战的命题。

来自主题: AI技术研报

10038 点击 2025-04-30 18:19

医疗大模型知识覆盖度首次被精准量化！

来自主题: AI技术研报

10971 点击 2025-04-30 17:34