还在手写CUDA内核?CODA来了!LLM和新手也能让Transformer跑出光速
还在手写CUDA内核?CODA来了!LLM和新手也能让Transformer跑出光速5 月 22 日,Tri Dao 在社交媒体上转发了 Han Guo 的一条推文。他还写道:「经过一些数学重写,结果发现 Transformer 的所有内容都是一系列 GEMM + epilogue(矩阵乘法加尾声)。给定一些优化的原语,LLM(以及新手)就可以为所有 Transformer 操作编写光速内核!」
搜索
5 月 22 日,Tri Dao 在社交媒体上转发了 Han Guo 的一条推文。他还写道:「经过一些数学重写,结果发现 Transformer 的所有内容都是一系列 GEMM + epilogue(矩阵乘法加尾声)。给定一些优化的原语,LLM(以及新手)就可以为所有 Transformer 操作编写光速内核!」
近日,谷歌在2026 I/O大会上发布了旗下AI for Science工具组合Gemini for Science。 该组合包含了谷歌旗下三款顶尖的AI科研工具,能实现假设生成、计算发现和文献综述的
Google把科学研究的三个核心瓶颈:假设生成、计算发现、文献洞察拆解为三个可由AI深度辅助的模块,并同日发表两篇Nature论文,为假设生成和计算发现两大环节提供支撑。
昨天,想必大家都被 Google IO 大会刷屏了。
你猜一个能翻译33种语言、性能逼近顶尖闭源模型的AI,装进手机里需要多大?
刚刚,字节跳动旗下剪映国际版CapCut宣布和谷歌Gemini APP达成合作,不久后将会推出新功能,用户能够直接在Gemini APP中使用CapCut的编辑工具编辑图片和视频。CapCut在社交平台X上的官宣文案中称“我们相信未来的创作将更加注重对话性、直观性和智能化,并能将各种工具和体验融为一体。”
过去AI视频是「生成内容」,Omni直接升级成「生成世界」。它懂动能、重力、因果,还能把复杂概念瞬间可视化。人类距离「言出法随」的梦想,还剩几个Gemini Omni的距离?
不出所料,之前爆料的 Gemini Omni 正式发布了。
首个Gemini桌面端曝光,全新Gemini 3.2/3.5闪现,不到1分钟盲写2000行代码,操作系统级Agent真的来了。
劈柴和Hassabis把半年大招一晚清仓了!Gemini Omni任意输入生成视频,3.5 Flash断层碾压一切,Spark 7×24h云端替你干活。这次,谷歌是要把OpenAI和Anthropic一起给埋了。