AI资讯新闻榜单内容搜索-HuggingFac

强化学习带来的改进只是「噪音」？最新研究预警：冷静看待推理模型的进展

尽管这些论文的结论统统指向了强化学习带来的显著性能提升，但来自图宾根大学和剑桥大学的研究者发现，强化学习导致的许多「改进」可能只是噪音。「受推理领域越来越多不一致的经验说法的推动，我们对推理基准的现状进行了严格的调查，特别关注了数学推理领域评估算法进展最广泛使用的测试平台之一 HuggingFaceH4，2024；AI - MO。」

来自主题: AI技术研报

6533 点击 2025-04-13 15:59

OWL团队万字分享：复现Manus最好的团队，如何看待Agentic AI的落地现状？

CAMEL-AI 团队在 Manus 上线后 1 天内推出的 OWL 就是其中最具代表性的一个，项目实测成绩达到开源界 GAIA 性能天花板，达到了 58.18%，超越 Huggingface 提出的 Open Deep Research 55.15% 的表现。

来自主题: AI资讯

11057 点击 2025-03-29 09:57

全球首个千亿级蛋白质模型开源！百图生科掀起生命科学AI普惠革命

今天，百图生科宣布开源其领先的xTrimo V2中的蛋白质语言模型xTrimoPGLM，7个不同参数量的模型均已发布在huggingface和github，供全球用户自由获取和使用。xTrimoPGLM是全球首个千亿参数的蛋白质语言模型，性能超越了ESM-2、ProGen2等此前业界领先的蛋白质模型，并在药物分子设计和优化、抗体工程与疫苗开发、酶工程和生物催化剂设计等领域展现出广泛应用前景。

来自主题: AI资讯

10678 点击 2025-03-21 12:16