韩松等提出FlashMoBA,比MoBA快7.4倍,序列扩到512K也不会溢出
韩松等提出FlashMoBA,比MoBA快7.4倍,序列扩到512K也不会溢出今年 2 月,月之暗面提出了一种名为 MoBA 的注意力机制,即 Mixture of Block Attention,可以直译为「块注意力混合」。
今年 2 月,月之暗面提出了一种名为 MoBA 的注意力机制,即 Mixture of Block Attention,可以直译为「块注意力混合」。
Gemini 3.0还未杀到,一系列惊艳实测就已宣告:AI「生成涌现」时代,真的来了!几乎同一时间,国内一款新生AI神器,竟将这股超能力塞进手机,30秒手搓一个APP。
近日,外媒一篇关于阿里 AI 全面入局 C 端之战,秘密启动「千问」项目的报道,在坊间引起各种猜测,甚至连相关的「阿里食堂烧鸭饭」都上了好几次热搜。没办法,大家太好奇了。
高强度招聘 AI 人才的同时,字节 Seed 的核心研究者也在外流。
最近看了不少早期硬件创业项目,逐渐发现 AI 的能力确实是一批新兴硬件公司和硬件品类的「惊蛰」时刻。
疯狂小扎他急了……
GPT-5不再只是更聪明的模型,而是一台学会犹豫的机器。它能判断问题的难度,分配自己的思考时间,甚至决定何时该停下。OpenAI副总裁Jerry Tworek在最新访谈中透露:GPT-5的真正突破,是让AI拥有了「时间感」。当机器学会克制,人类却愈加焦躁。也许我们教给AI的,不只是如何思考,而是如何重新做人。
我们的大脑蕴藏着待解的进化密码,而AI的未来或许正系于此。
CUDA 代码的性能对于当今的模型训练与推理至关重要,然而手动编写优化 CUDA Kernel 需要很高的知识门槛和时间成本。与此同时,近年来 LLM 在 Code 领域获得了诸多成功。
AI创作正在成为B站上新的流量密码。而且诸多信号显示着这种密码的有效性。