AI资讯新闻榜单内容搜索-模型

0.3B参数，600MB内存！腾讯混元实现产业级2Bit量化，端侧模型小如手机App

等效参数量仅0.3B，内存占用仅600MB，更适合端侧部署还带思维链的模型来了。腾讯混元最新推出面向消费级硬件场景的“极小”模型HY-1.8B-2Bit，体量甚至比常用的一些手机应用还小。

来自主题: AI技术研报

7055 点击 2026-02-10 14:28

创新需要适当的灰度和混乱，但应对竞争需要秩序和纪律。上千人的研究团队、投入上百亿元追赶两年，终于研发出能排在中国第一梯队的基础模型，迅速被只有上百人的团队用更少资源研发的模型超过，部门负责人承认失误，公司 CEO 在全员会上点名，本可以做得更好。

来自主题: AI资讯

6996 点击 2026-02-10 14:27

以DeepSeek R1为代表的一系列基于强化学习（RLVR）微调的工作，显著提升了大语言模型的推理能力。但在这股浪潮背后，强化微调的代价却高得惊人。

来自主题: AI技术研报

9759 点击 2026-02-10 14:19

2026 年刚拉开序幕，大模型（LLM）领域的研究者们似乎达成了一种默契。当你翻开最近 arXiv 上最受关注的几篇论文，会发现一个高频出现的词汇：Self-Distillation。

来自主题: AI技术研报

6832 点击 2026-02-10 14:17

当物体在滚动、滑动、被撞飞，机器人还在执行几百毫秒前的动作预测。对动态世界而言，这种延迟，往往意味着失败。

来自主题: AI技术研报

10497 点击 2026-02-10 14:13

文本摘要作为自然语言处理（NLP）的核心任务，其质量评估通常需要兼顾一致性（Consistency）、连贯性（Coherence）、流畅性（Fluency）和相关性（Relevance）等多个维度。

来自主题: AI技术研报

9371 点击 2026-02-10 14:11

2月7日，字节跳动AI视频生成模型Seedance2.0开启灰度测试，该模型支持文本、图片、视频、音频素材输入，可以完成自分镜和自运镜，镜头移动后人物特征能够保持一致。

来自主题: AI资讯

10052 点击 2026-02-09 20:02

如果 2024 年我们还在感叹 Sora 模拟物理世界的真实感，那么在 2026 年的今天，单纯的高清视频生成已不再是终点。

来自主题: AI资讯

7163 点击 2026-02-09 17:08

明明可以去抢，他们却给了你更好的模型？

来自主题: AI资讯

7333 点击 2026-02-09 16:02

马年未至，春节档新模型已经蓄势待发。

来自主题: AI资讯

7487 点击 2026-02-09 15:01