AI资讯新闻榜单内容搜索-小模型

腾讯纯文本LLM训视觉encoder，拿捏图表长视频，达到开源小模型SOTA！

打破多模态视觉+语言拼接套路！

来自主题: AI技术研报

6886 点击 2026-03-19 10:22

3B打32B？海外病毒式传播的小模型，竟然来自BOSS直聘

这两年，大模型大厂之间堪比军备竞赛。不论开源还是闭源阵营，为了在指标上领先对手，都在疯狂地卷 Scaling Law，卷算力，卷参数量，已经达到了近乎离谱的程度。

来自主题: AI技术研报

8643 点击 2026-03-09 16:23

AI 真能做研究吗？UniPat AI开源UniScientist，用30B小模型给出肯定答案

多数大模型能生成 “看起来像” 研究的文本，但极少数能真正做研究 —— 提出假设、收集证据、执行可复现的推导、迭代验证直至结论成立。

来自主题: AI技术研报

6478 点击 2026-03-09 14:27

林俊旸离开的 48 小时：一条朋友圈、一个小模型、和一个万亿美金的假设

离职的消息最沸沸扬扬的时候，Qwen 团队的核心负责人林俊旸在朋友圈发了两句话：

来自主题: AI资讯

10011 点击 2026-03-06 09:32

ICLR 2026 | 7B小模型干翻GPT-5？AdaResoner实现Agentic Vision的主动「视觉工具思考」

你见过 7B 模型在拼图推理上干翻 GPT-5 吗？

来自主题: AI技术研报

6965 点击 2026-03-04 11:18

马斯克大赞阿里 AI，9B 参数硬刚 120B，海外网友：这叫小模型？

昨天深夜，阿里通义千问团队在 X 平台正式发布了 Qwen3.5 小模型系列，覆盖 0.8B、2B、4B 和 9B 四个参数规格。甫一发布，便在海外科技圈引发强烈反响。马斯克也在该推文下评论称：「Impressive intelligence density」（令人印象深刻的智能密度）。这股热度的背后，APPSO 也好奇，为什么这几款小模型能够激起如此大的波澜？

来自主题: AI资讯

9743 点击 2026-03-03 14:35

小模型+Agent Skills能用吗？这份基于POMDP的工业级本地化Agent报告太硬核！

各位对Agent Skill早已轻车熟路。不可否认，在Claude code、Openclaw的加持下，这套框架效果极佳。但工业界的痛点在于：它几乎沦为了超大型闭源API的专属玩具。当您的项目面临金融

来自主题: AI技术研报

8641 点击 2026-02-27 10:48

Loop-ViT：让AI学会「反复思考」，3.8M参数小模型追平人类平均水平

当我们解一道复杂的数学题或观察一幅抽象图案时，大脑往往需要反复思考、逐步推演。然而，当前主流的深度学习模型却走的是「一次通过」的路线——输入数据，经过固定层数的网络，直接输出答案。

来自主题: AI技术研报

10130 点击 2026-02-13 11:08

0.3B参数，600MB内存！腾讯混元实现产业级2Bit量化，端侧模型小如手机App

等效参数量仅0.3B，内存占用仅600MB，更适合端侧部署还带思维链的模型来了。腾讯混元最新推出面向消费级硬件场景的“极小”模型HY-1.8B-2Bit，体量甚至比常用的一些手机应用还小。

来自主题: AI技术研报

7114 点击 2026-02-10 14:28

抛弃向量推荐！蚂蚁用8B小模型构建「用户“话”像」，实现跨任务跨模型通用并拿下SOTA

怎样做一个爆款大模型应用？这恐怕是2026年AI开发者们都在关注的问题。当算力和性能不再是唯一的护城河，“爆款”意味着大模型要能精准地“抓住”每一名具体的用户，而个性化正是其中的关键技术之一。

来自主题: AI技术研报

6761 点击 2026-02-01 13:10