
清华第三代Sage注意力发布!提速5倍,精度不降,训推都能用
清华第三代Sage注意力发布!提速5倍,精度不降,训推都能用清华大学朱军教授团队提出SageAttention3,利用FP4量化实现推理加速,比FlashAttention快5倍,同时探索了8比特注意力用于训练任务的可行性,在微调中实现了无损性能。
清华大学朱军教授团队提出SageAttention3,利用FP4量化实现推理加速,比FlashAttention快5倍,同时探索了8比特注意力用于训练任务的可行性,在微调中实现了无损性能。
据The Information报道,微软正在重绘其自研人工智能服务器芯片的产品路线图,将在未来几年内专注于推出设计更保守、开发难度更低的芯片版本,目标是在2028年前克服当前导致研发延迟的一系列问题。
18年不孕多次求医无果,一对夫妇终于在AI的帮助下迎来奇迹——哥伦比亚大学开发的STAR系统,仅用1小时从「无精子症」患者精液中找出隐藏精子,成功实现受孕,预计今年12月迎来宝宝出生。
大模型记忆管理和优化框架是当前各大厂商争相优化的热点方向,MemOS 相比现有 OpenAI 的全局记忆在大模型记忆评测集上呈现出显著的提升,平均准确性提升超过 38.97%,Tokens 的开销进一步降低 60.95%,一举登顶记忆管理的 SOTA 框架,特别是在考验框架时序建模与检索能力的时序推理任务上,提升比例更是达到了 159%,相当震撼!
用AI赢得“注意力之战”。
硅谷挖角戏码升级!相比Meta3亿美元「血本挖角」,OpenAI来了波反向操作——选择培养人才,奥特曼悄然推进一个名为「驻留计划」(Residency Program)的项目。这个项目有何神秘之处?奥特曼的底气到底从何而来?
大语言模型(LLM)在标准编程基准测试(如 HumanEval,Livecodebench)上已经接近 “毕业”,但这是否意味着它们已经掌握了人类顶尖水平的复杂推理和编程能力?
新皮层独家获悉,具身智能公司星动纪元近期完成近5亿元A轮融资。这是该公司自2023年8月成立以来完成的第4轮融资,最近一次是去年10月近3亿元的Pre-A轮。本轮融资由鼎晖资本和海尔资本联合领投,厚雪资本、华映资本、襄禾资本、丰立智能等财务机构及产业资本跟投,老股东清流资本、清控基金等机构继续追加投资;华兴资本担任独家财务顾问。
三个前沿AI能融合成AGI吗?Sakana AI提出Multi-LLM AB-MCTS方法,整合o4-mini、Gemini-2.5-Pro与DeepSeek-R1-0528模型,在推理过程中动态协作,通过试错优化生成过程,有效融合群体AI智慧。
你能想象律师审查合同的时间从几周缩短到一小时以内吗?这听起来像天方夜谭,但刚刚获得580万美元种子轮融资的Crosby正在让这个看似不可能的事情成为现实。这家由红杉美国领投的公司不是在为律师开发AI工具,而是直接用AI技术重新构建了一家律师事务所本身