AI资讯新闻榜单内容搜索-Qwen

Qwen3-0.6B 能击败 Bert 吗？

新增 Qwen3-0.6B 在 Ag_news 数据集 Zero-Shot 的效果。新增 Qwen3-0.6B 线性层分类方法的效果。

来自主题: AI技术研报

7976 点击 2025-05-26 10:14

2025年，ChatGPT依旧领跑，但DeepSeek、Qwen等开源劲敌正加速追赶。从「推理革命」爆发到 DeepSeek开源，一场围绕算力、架构与生态的战争已悄然打响，开源势力正以星星之火之势挑战闭源巨头。

来自主题: AI技术研报

7355 点击 2025-05-23 15:03

AI替咱打工搞翻译，到底谁家最好用？

来自主题: AI资讯

6970 点击 2025-05-23 13:03

各位有没有发现，最近大家对大模型已经有些看麻了？反正我是看到相关话题的文章流量、社交平台上的热度，对模型的关注度明显有点降下来了。比如最近 Qwen3、Gemini2.5、GPT-4.1 和 Grok-3 等这么密集的有明显新进展的优秀模型发布，要是放到 2 年前，铁定是个炸裂的一个月。

来自主题: AI资讯

5884 点击 2025-05-20 16:26

Qwen3技术报告新鲜出炉，8款模型背后的关键技术被揭晓！

来自主题: AI技术研报

5903 点击 2025-05-14 15:26

字节Seed首次开源代码模型！Seed-Coder，8B规模，超越Qwen3，拿下多个SOTA。它证明“只需极少人工参与，LLM就能自行管理代码训练数据”。通过自身生成和筛选高质量训练数据，可大幅提升模型代码生成能力。

来自主题: AI资讯

7855 点击 2025-05-11 15:18

Qwen上新“AI前端工程师”Web Dev，一句话开发网页应用。

来自主题: AI资讯

8155 点击 2025-05-10 17:20

Qwen3强势刷新开源模型SOTA，但如何让其在资源受限场景中，既能实现低比特量化，又能保证模型“智商”不掉线？

来自主题: AI技术研报

7218 点击 2025-05-07 13:52

企业内落地 Agent，三个关键点是模型、数据、场景。

来自主题: AI资讯

7506 点击 2025-05-03 15:11

2025年4月29日凌晨，距离通义千问Qwen3正式发布还有5小时，X和GitHub上的开发者们已经搬好小板凳蹲守发布。开源社区的技术爱好者们熬夜刷新，等待第一时间测试和体验这款备受期待的中国大模型新作。

来自主题: AI资讯

7464 点击 2025-05-01 13:57