MiniMax押注线性注意力,让百万级长文本只用1/2700算力|对话MiniMax-01架构负责人钟怡然
MiniMax押注线性注意力,让百万级长文本只用1/2700算力|对话MiniMax-01架构负责人钟怡然Transformer架构主导着生成式AI浪潮的当下,但它并非十全十美,也并非没有改写者。
Transformer架构主导着生成式AI浪潮的当下,但它并非十全十美,也并非没有改写者。
凌晨3点,AI第8次把按钮写成button_1,我差点把电脑砸了...
这是一份142页的研究论文,本文深入解析了大型推理模型DeepSeek-R1如何通过"思考"解决问题。研究揭示了模型思维的结构化过程,以及每个问题都存在甜蜜点"最佳推理区间"的惊人发现。这标志着"思维学"这一新兴领域的诞生,为我们理解和优化AI推理能力提供了宝贵框架。
当前,所有主流的视觉基础模型(如 SigLIP、DINOv2 等)都仍然在低分辨率(如 384 * 384 分辨率)下进行预训练。对比人类视觉系统可以轻松达到 10K 等效分辨率,这种低分辨率预训练极大地限制了视觉模型对于高清细节的理解能力。
一叠便签纸、一个普通书签和一支笔,售价2美元(折合人民币14.7元)。一个能做类似事情的钛合金AI书签,售价129美元(折合人民币947元),你会心动吗?
最近一段时间,各家新势力都在角力部署端到端的智能驾驶系统。
北京时间4月16日,据彭博社报道,英伟达周二在监管文件中表示,美国政府已于周一通知公司,H20芯片未来在出口至中国时需要“无限期”申请许可证。
《自然》杂志统计了 5 个数据库,给出了论文引用 Top 25 名单。
2024 年,是学习平板这个品类集中爆发的一年。
能处理任意条件组合的新生成框架来了!