韩松等提出FlashMoBA,比MoBA快7.4倍,序列扩到512K也不会溢出
韩松等提出FlashMoBA,比MoBA快7.4倍,序列扩到512K也不会溢出今年 2 月,月之暗面提出了一种名为 MoBA 的注意力机制,即 Mixture of Block Attention,可以直译为「块注意力混合」。
今年 2 月,月之暗面提出了一种名为 MoBA 的注意力机制,即 Mixture of Block Attention,可以直译为「块注意力混合」。
最近,小编注意到一位全栈工程师 Rohith Singh 在Reddit上发表了一篇帖子,介绍他如何对四个模型(Kimi K2 Thinking、Sonnet 4.5、GPT-5 Codex 和 GPT-5.1 Codex)进行了实测。
2025 年,AI 产业正在经历一场关键转折。
AI新王来了!马斯克Grok 4.1静默上线,一夜之间登顶LMArena,Gemini 2.5 Pro却被按在地上摩擦。主打情商智商在线,算力又扩增一个数量级。这一次,Grok 4.1一共放出了两大版本:Grok 4.1 Thinking和Grok 4.1。
具身智能领域影响力最大的两位博士创业了。
贝佐斯亲身下场物理AI了,亲自担任CEO的那种。 纽约时报消息,这名前世界首富创立了一家新公司并亲自担任联席CEO。而且资金实力雄厚,包括贝佐斯本人出资在内,该公司已获得62亿美元资金。
CUDA 代码的性能对于当今的模型训练与推理至关重要,然而手动编写优化 CUDA Kernel 需要很高的知识门槛和时间成本。与此同时,近年来 LLM 在 Code 领域获得了诸多成功。
根据投资实习所的报道,前字节跳动算法负责人陈志杰创立的 Verdent AI 近期完成了由腾讯领投、红杉中国等老股东跟投的 A 轮融资,金额在数千万美元,估值或已突破 2 亿美元。这使 Verdent
在号称「史上最严管控AI」的顶级会议ICLR 2026上,评审区却悄悄被大模型攻占。每五条审稿意见里,就有一条几乎全由AI一键生成。当作者怀疑评审是机器人写的、审稿人又怀疑论文是模型拼的,同行评审这台「科学秩序的发动机」,正一点点滑向一场没人承认、却无处不在的自动化实验。
前几天 nano banana 2 的泄漏版本,正在网上被疯狂转载,奥特曼眼看着流量不能被 Google 再抢了去,一点预告都没有,直接就发布了 GPT-5.1。