AI资讯新闻榜单内容搜索-Qwen

小红书hi lab首次开源文本大模型，训练资源不到Qwen2.5 72B 的四分之一

6 月 6 日，小红书 hi lab（Humane Intelligence Lab，人文智能实验室）团队首次开源了文本大模型 dots.llm1，采用 MIT 许可证。

来自主题: AI资讯

10080 点击 2025-06-07 12:12

近期arxiv最热门论文，Qwen&清华LeapLab团队最新成果：在强化学习训练大模型推理能力时，仅仅20%的高熵token就能撑起整个训练效果，甚至比用全部token训练还要好。

来自主题: AI技术研报

8210 点击 2025-06-06 11:08

Hi，我是银海。你身边的AI产品经理，陪你解决每一个真实问题。

来自主题: AI资讯

7746 点击 2025-06-05 16:49

一项新的强化学习方法，直接让Qwen性能大增，GPT-4o被赶超！

来自主题: AI技术研报

7387 点击 2025-06-04 10:50

即使RLVR（可验证奖励强化学习）使用错误的奖励信号，Qwen性能也能得到显著提升？

来自主题: AI技术研报

9994 点击 2025-05-29 15:01

大语言模型遇上加密数据，即使是最新Qwen3也直冒冷汗！

来自主题: AI技术研报

9070 点击 2025-05-29 14:59

上下文长度达 13 万 token，适用于多段文档综合分析、金融、法律、科研等复杂领域任务。

来自主题: AI技术研报

8059 点击 2025-05-28 09:42

推理大模型开卷新方向，阿里开源长文本深度思考模型QwenLong-L1，登上HuggingFace今日热门论文第二。

来自主题: AI技术研报

8675 点击 2025-05-27 16:58

大家好，我是袋鼠帝今天给大家带来的是一个带WebUI，无需代码的超简单的本地大模型微调方案（界面操作），实测微调之后的效果也是非常不错。

来自主题: AI技术研报

10554 点击 2025-05-27 13:38

新增 Qwen3-0.6B 在 Ag_news 数据集 Zero-Shot 的效果。新增 Qwen3-0.6B 线性层分类方法的效果。

来自主题: AI技术研报

10774 点击 2025-05-26 10:14