AI资讯新闻榜单内容搜索-模型

大模型“记性差一点”反而更聪明！金鱼损失随机剔除token，让AI不再死记硬背

训练大模型时，有时让它“记性差一点”，反而更聪明！

来自主题: AI技术研报

7434 点击 2025-09-04 11:09

腾讯混元最新开源成“最强翻译”：国际机器翻译比赛获30个语种第一

腾讯混元，刚刚又拿下一个国际冠军—— Hunyuan-MT-7B，以7B总参数量获得国际翻译比赛冠军。该模型支持33个语种、5种民汉语言/方言互译，是一个能力全面的轻量级翻译模型。

来自主题: AI技术研报

7729 点击 2025-09-03 16:57

Claude估值暴涨300%！全球独角兽字节第三他第四

天啦噜，搞大模型的实在太疯狂了。

来自主题: AI资讯

9524 点击 2025-09-03 13:42

DeepMind爆火论文：向量嵌入模型存在数学上限，Scaling laws放缓实锤？

这几天，一篇关于向量嵌入（Vector Embeddings）局限性的论文在 AlphaXiv 上爆火，热度飙升到了近 9000。

来自主题: AI技术研报

7239 点击 2025-09-03 13:21

苹果新研究：不微调、不重训，如何让AI提问效率暴增6.5倍？

在这场以大型语言模型（LLM）为核心的 AI 浪潮中，苹果似乎一直保持着低调，很少出现在技术报道的前沿。尽管如此，时不时地，该公司也能拿出一些非常亮眼的研究成果，比如能在 iPhone 上直接运行的高效视觉语言模型 FastVLM。

来自主题: AI技术研报

9164 点击 2025-09-03 13:04

告别无效计算！新TTS框架拯救19%被埋没答案，推理准确率飙升

大语言模型通过 CoT 已具备强大的数学推理能力，而 Beam Search、DVTS 等测试时扩展（Test-Time Scaling, TTS）方法可通过分配额外计算资源进一步提升准确性。然而，现有方法存在两大关键缺陷：路径同质化（推理路径趋同）和中间结果利用不足（大量高质量推理分支被丢弃）。

来自主题: AI技术研报

9299 点击 2025-09-03 12:03

你的RAG系统有个数学BUG，DeepMind首次证明嵌入向量检索召回能力有限

最近，工业界“RAG已死”甚嚣尘上。过去几年，AI领域的主旋律是“规模定律”（Scaling Law），即更大的模型、更多的数据会带来更好的性能。即便偶然有瑕疵，也认为只是工程上的不足，并非数学上的不可能。

来自主题: AI技术研报

10021 点击 2025-09-03 11:54

冲上热搜！美团大模型，靠「快」火了

国内外开发者：亲测，美团新开源的模型速度超快！

来自主题: AI技术研报

9058 点击 2025-09-03 11:41

第一性原理视角下的MoE推理的经济学分析

随着DeepSeek R1、Kimi K2和DeepSeek V3.1混合专家（MoE）模型的相继发布，它们已成为智能前沿领域大语言模型（LLM）的领先架构。由于其庞大的规模（1万亿参数及以上）和稀疏计算模式（每个token仅激活部分参数而非整个模型），MoE式LLM对推理工作负载提出了重大挑战，显著改变了底层的推理经济学。

来自主题: AI技术研报

8527 点击 2025-09-03 11:22

IROS 2025 | 机器人衣物折叠新范式，NUS邵林团队用MetaFold解耦轨迹与动作

机器人对可形变物体的操作（Deformable Object Manipulation, DOM），是衡量通用机器人智能水平的关键指标之一。与刚体操作不同，衣物、绳索、食物等物体的形态不固定，其状态空间维度极高，且物理交互过程呈现出复杂的非线性动力学特性，为感知、规划和控制带来了巨大挑战。

来自主题: AI技术研报

7560 点击 2025-09-03 11:07