AI资讯新闻榜单内容搜索-大模

这家西方开源大模型公司，开源出了DeepSeek-V3背后的架构！头部模型表现都差不多了，Mistral CEO自曝如何赚钱

面对《the Big Technology Podcast》抛出的问题，Mistral AI的 CEO Arthur Mensch 表示：大模型肯定会走向商品化，当模型表现越来越接近，那么竞争就不在于模型本身，而在于如何让客户用起来。

来自主题: AI资讯

9281 点击 2026-01-19 18:20

真·开外挂！MIT新研究：架构0改动，让大模型解锁千万级上下文

让大模型轻松处理比自身上下文窗口长两个数量级的超长文本！

来自主题: AI技术研报

6462 点击 2026-01-19 16:47

作业帮出海最猛的产品竟是AI陪伴？单月访问量超4200万，AI百强榜排名超Kimi、千问

当国内的AI大模型战场正陷入“百模大战”的焦灼，巨头们还在比拼参数规模、长文本处理能力和代码生成率时，一家曾经被打上“在线教育”和“题库工具”深深烙印的公司——作业帮，却在海外市场“悄悄”通过一条意想不到的赛道杀出了重围。

来自主题: AI资讯

10615 点击 2026-01-19 09:36

腾讯AngelSlim升级，首个集LLM、VLM及语音多模态为一体的投机采样训练框架，推理速度飙升1.8倍

随着大模型步入规模化应用深水区，日益高昂的推理成本与延迟已成为掣肘产业落地的核心瓶颈。在 “降本增效” 的行业共识下，从量化、剪枝到模型蒸馏，各类压缩技术竞相涌现，但往往难以兼顾性能损耗与通用性。

来自主题: AI技术研报

10788 点击 2026-01-19 08:54

Gemini准确率从21%飙到97%！谷歌只用了这一招：复制粘贴

简单到难以置信！近日，Google Research一项新研究发现：想让大模型在不启用推理设置时更准确，只需要把问题复制粘贴再说一遍，就能把准确率从21.33%提升到97.33%！

来自主题: AI技术研报

10145 点击 2026-01-18 14:58

美团又上新模型，8个Thinker齐开工，能顶个诸葛亮？

美团也重磅更新自家模型 ——LongCat-Flash-Thinking-2601。这是一款强大高效的大规模推理模型，拥有 5600 亿个参数，基于创新的 MoE 架构构建。该模型引入了强大的重思考模式（Heavy Thinking Mode），能够同时启动 8 路思考并最终总结出一个更全面、更可靠的结论。目前重思考模式已在 LongCat AI 平台正式上线，人人均可体验。

来自主题: AI资讯

10242 点击 2026-01-16 14:35