AI资讯新闻榜单内容搜索-小模型

微软Phi-4家族新增两位成员，5.6B多模态单任务超GPT-4o，3.8B小模型媲美千问7B

动辄百亿、千亿参数的大模型正在一路狂奔，但「小而美」的模型也在闪闪发光。

来自主题: AI技术研报

11384 点击 2025-02-27 16:51

仅靠逻辑题，AI数学竞赛能力飙升！微软、九坤投资：7B小模型也能逼近o3-mini

只刷逻辑益智题，竟能让 AI 数学竞赛水平大幅提升？

来自主题: AI技术研报

8299 点击 2025-02-25 14:32

强化学习Scaling Law错了？无需蒸馏，数据量只要1/6，效果还更好

强化学习训练数据越多，模型推理能力就越强？新研究提出LIM方法，揭示提升推理能力的关键在于优化数据质量，而不是数据规模。该方法在小模型上优势尽显。从此，强化学习Scaling Law可能要被改写了！

来自主题: AI技术研报

7440 点击 2025-02-18 20:07

OpenAI突宣开源计划：端侧模型or小模型二选一！奥特曼在线征集投票

就在刚刚，奥特曼发了个推特，轻描淡写透露了个大消息： For our next open source project……

来自主题: AI资讯

12054 点击 2025-02-18 15:23

o3-mini数学推理暴打DeepSeek-R1？AIME 2025初赛曝数据集污染大瓜

就在刚刚，AIME 2025 I数学竞赛的大模型参赛结果出炉，o3-mini取得78%的最好成绩，DeepSeek R1拿到了65%，取得第四名。然而一位教授却发现，某些1.5B小模型竟也能拿到50%，莫非真的存在数据集污染？

来自主题: AI资讯

10144 点击 2025-02-10 11:21

小模型也能玩转RAG！性能仅降1%，存储省75%，边缘设备轻松跑

检索增强生成（RAG）虽好，但一直面临着资源消耗大、部署复杂等技术壁垒。近日，香港大学黄超教授团队提出MiniRAG，成功将RAG技术的应用门槛降至1.5B参数规模，实现了算力需求的大幅降低。这一突破性成果不仅为边缘计算设备注入新活力，更开启了基于小模型轻量级RAG的探索。

来自主题: AI资讯

9816 点击 2025-01-26 12:21

颠覆LLM格局！AI2新模型OLMo2，训练过程全公开，数据架构双升级

非营利研究机构AI2近日推出的完全开放模型OLMo 2，在同等大小模型中取得了最优性能，且该模型不止开放权重，还十分大方地公开了训练数据和方法。

来自主题: AI技术研报

7483 点击 2025-01-25 09:38

DeepSeek-R1 是怎么训练的｜深度拆解

昨天晚上，DeepSeek 又开源了 DeepSeek-R1 模型（后简称 R1），再次炸翻了中美互联网： R1 遵循 MIT License，允许用户通过蒸馏技术借助 R1 训练其他模型。 R1 上线 API，对用户开放思维链输出 R1 在数学、代码、自然语言推理等任务上，性能比肩 OpenAI o1 正式版，小模型则超越 OpenAI o1-mini

来自主题: AI技术研报

21487 点击 2025-01-21 13:15

GPT-5、 Opus 3.5为何迟迟不发？新猜想：已诞生，被蒸馏成小模型来卖

最近几个月，从各路媒体、AI 社区到广大网民都在关注 OpenAI 下一代大模型「GPT-5」的进展。

来自主题: AI资讯

9813 点击 2025-01-18 10:51

终于等到你！港大首发「轻量级RAG神器」MiniRAG，1.5B手机端可用

还在为部署RAG系统的庞大体积和高性能门槛困扰吗？港大黄超教授团队最新推出的轻量级MiniRAG框架很好地解决了这一问题。通过优化架构设计，MiniRAG使得1.5B级别的小模型也能高效完成RAG任务，为端侧AI部署提供了更多可能性。

来自主题: AI资讯

9777 点击 2025-01-16 16:14