舍弃自回归,离散扩散语言模型如何演化?NUS综述解构技术图谱与应用前沿
舍弃自回归,离散扩散语言模型如何演化?NUS综述解构技术图谱与应用前沿本文主要介绍 xML 团队的论文:Discrete Diffusion in Large Language and Multimodal Models: A Survey。
本文主要介绍 xML 团队的论文:Discrete Diffusion in Large Language and Multimodal Models: A Survey。
OpenAI如何以自下而上的文化和行动导向,推动大模型突破?从零到上线仅用7周,Calvin带你走进OpenAI编程智能体Codex的诞生过程,体验高强度冲刺的魔力。
随着 AI 系统越来越强大,人们与机器的交流方式也在发生变化。语音,正在迅速成为默认的交互入口。
从GPT-2到Llama 4,大模型这几年到底「胖」了多少?从百亿级密集参数到稀疏MoE架构,从闭源霸权到开源反击,Meta、OpenAI、Mistral、DeepSeek……群雄割据,谁能称王?
大模型在潜空间中推理,带宽能达到普通(显式)思维链(CoT)的2700多倍?
疯狂,太疯狂了~ 大神卡帕西预测的「下一代GUI系统」这就水灵灵地实现了?!
在5月中旬,谷歌发布了AlphaEvolve。不仅30天内攻克了18年未解的难题,或将开启了一场无需「灵感」的科学革命:未来,科学家将不再依赖直觉,而是靠AI解决难题!
2023年感恩节,OpenAI创始人奥特曼被炒鱿鱼,五天五夜的科技圈大戏席卷全网。亚马逊斥资4000万美元,将这段「AI圈权游」搬上大银幕,Andrew Garfield化身奥特曼,带你重温那场惊心动魄的逆转剧情!
还在质疑AI生物制药「纸上谈兵」?Chai-2已经把抗体设计成功率从0.1%提升到16%,而且还是零样本!不仅是技术奇迹,这更是范式革命:下一代药神,可能不是生物学博士,而是提示词工程师。
最近,Mamba 作者之一 Albert Gu 又发新研究,他参与的一篇论文《 Dynamic Chunking for End-to-End Hierarchical Sequence Modeling 》提出了一个分层网络 H-Net,其用模型内部的动态分块过程取代 tokenization,从而自动发现和操作有意义的数据单元。