新注意力让大模型上下文内存占用砍半!精度不减还能加速2倍
新注意力让大模型上下文内存占用砍半!精度不减还能加速2倍大模型同样的上下文窗口,只需一半内存就能实现,而且精度无损? 前苹果ASIC架构师Nils Graef,和一名UC伯克利在读本科生一起提出了新的注意力机制Slim Attention。
大模型同样的上下文窗口,只需一半内存就能实现,而且精度无损? 前苹果ASIC架构师Nils Graef,和一名UC伯克利在读本科生一起提出了新的注意力机制Slim Attention。
据ZP独家获悉,半图科技(SemiGraph)近日完成了一轮数千万人民币的天使轮融资,全球知名投资机构IDG资本独家投资。据了解,半图科技正式成立于2024下半年,致力于通过创新的技术推动AI应用领域的变革,尤其聚焦于AI技术在游戏、内容、情感交互等领域的深度应用。此次融资的成功为公司3D动画大模型底层技术的突破提供了强有力的资金支持,并有望加速其产品和技术的市场落地。
甲骨文创始人Larry Ellison宣称,只需48小时,用AI检测出你体内的癌症,用48小时造出专属疫苗。那些AI医疗概念股的股价彻底摁不住了,泛癌早筛Grail带头狂飙,年初至今涨幅超200%,AI精准医疗Tempus涨幅达165%,就连当年跌至谷底的AI制药玩家,也重回上涨之路。
任何一张照片,直接就能定位照片中的具体所在地,并呈现出对应的3D场景。GeoSpy使得这一切都成为了现实,但大家也都为此而感到隐私泄露的巨大风险和潜在危害。
2024 年,AI 音乐生成产品 Suno 的成绩很亮眼。
论文能不能中?可以用AI提前预测~ 港大黄超教授团队提出多智能体自动化框架GraphAgent,能自动构建和解析知识图谱中的复杂语义网络,应对各类预测和生成任务。
今天,银河通用机器人发布了端到端具身抓取基础大模型「GraspVLA」,全球第一个预训练完全基于仿真合成大数据的具身大模型,展现出了比OpenVLA、π0、RT-2、RDT等模型更全面强大的泛化性和真实场景实用潜力。
图形用户界面(Graphical User Interface, GUI)作为数字时代最具代表性的创新之一,大幅简化了人机交互的复杂度。
IBM 正式发布了其新一代开源大语言模型 Granite 3.1,这是一组轻量级、先进的开源基础模型,支持多语言、代码生成、推理和工具使用,能够在有限的计算资源上运行。这一系列模型具备 128K 的扩展上下文长度、嵌入模型、内置的幻觉检测功能以及性能的显著提升。
北京大学等研究团队优化了Sdcpp框架,通过引入Winograd算法和多项策略,显著提升了图像生成速度和内存效率,最高可提速4.79倍。