AI资讯新闻榜单内容搜索-模型

优于o1预览版，推理阶段KV缓存缩减一半，LightTransfer降本还能增效

LLM 在生成 long CoT 方面展现出惊人的能力，例如 o1 已能生成长度高达 100K tokens 的序列。然而，这也给 KV cache 的存储带来了严峻挑战。

来自主题: AI技术研报

6434 点击 2025-03-11 09:32

微软开源多模态AI基础模型Magma！无需额外微调轻松拿捏网页、机器人

微软研究院官宣开源多模态AI——Magma模型。首个能在所处环境中理解多模态输入并将其与实际情况相联系的基础模型。

来自主题: AI技术研报

8093 点击 2025-03-10 22:22

已节省数百万GPU小时！字节再砍MoE训练成本，核心代码全开源

字节对MoE模型训练成本再砍一刀，成本可节省40%！刚刚，豆包大模型团队在GitHub上开源了叫做COMET的MoE优化技术。

来自主题: AI技术研报

8459 点击 2025-03-10 21:57

富士康开发出台湾首个推理大模型FoxBrain，性能落后于DeepSeek

北京时间3月10日，据《华尔街日报》报道，富士康母公司鸿海已研发出中国台湾地区首个具备先进推理能力的大模型，性能上落后于DeepSeek的部分大模型。鸿海周一表示，已自主研发了具备推理能力的人工智能(AI)大语言模型FoxBrain，并在四周内完成训练。FoxBrain最初为公司内部使用而设计，具备数据分析、数学运算、推理以及代码生成的能力。

来自主题: AI资讯

11057 点击 2025-03-10 17:46

Manus代码遭越狱，Manus联合创始人兼首席科学家季逸超回应

北京时间3月10日清晨，推特用户jianxliao发布推文称成功“越狱”了Manus AI的代码，据其透露，他只是简单地要求Manus提供"/opt/.manus/"目录下的文件，系统便直接提供了沙盒运行时代码，并揭示了Manus使用Claude Sonnet模型、配备29个工具且使用了browser_use开源项目等技术细节。

来自主题: AI资讯

9440 点击 2025-03-10 16:11