重塑注意力机制:GTA登场,KV缓存缩减70%、计算量削减62.5%
重塑注意力机制:GTA登场,KV缓存缩减70%、计算量削减62.5%GTA 工作由中国科学院自动化研究所、伦敦大学学院及香港科技大学(广州)联合研发,提出了一种高效的大模型框架,显著提升模型性能与计算效率。
GTA 工作由中国科学院自动化研究所、伦敦大学学院及香港科技大学(广州)联合研发,提出了一种高效的大模型框架,显著提升模型性能与计算效率。
据海外科技媒体《The Information》报道,OpenAI 正在开发一项重要功能——让 ChatGPT 原生支持并编辑 Excel 和 PowerPoint 文件。这意味着,用户未来可以直接在 ChatGPT 中创建或者打开 .xlsx 和 .pptx 文件,并在 AI 的协助下进行公式输入、图表分析、幻灯片排版等操作,无需依赖传统 Office 软件。
在过去很长一段时间里,科技圈似乎人均都成了“提示词工程师”,大家都在琢磨怎么用最精妙的语言驯服AI。但包括Andrej Karpathy在内的很多行业大佬已经开始反思了,他们认为,决定AI效果的关键,可能早就不是怎么问,而是你给AI喂了什么料。这个思路,就是最近越来越火的上下文工程(Context Engineering)。
目前,由人工智能(AI)驱动的科技浪潮仍在席卷全球,并继续成为跨行业和地区市场的核心议题。
一早,小扎「梦之队」44人明星阵容曝光。这份绝密名单中,完整披露了Meta超级智能实验室团队的「配置」,被硅谷科技圈疯转。值得一提的是,50%研究员来自中国。
作为一个 AI 科技媒体编辑,AI 已经成为我的第一生产力。总结、翻译、查资料、做 PPT,一堆 AI 牛马任我差遣。
稚晖君之后,王兴兴也来到了资本市场门口。创业九年,宇树科技终于走到IPO门前。这次不再是传闻。
MiniMax 在 7 月 10 日面向全球举办了 M1 技术研讨会,邀请了来自香港科技大学、滑铁卢大学、Anthropic、Hugging Face、SGLang、vLLM、RL领域的研究者及业界嘉宾,就模型架构创新、RL训练、长上下文应用等领域进行了深入的探讨。
我们提出了 PresentAgent,一个能够将长篇文档转化为带解说的演示视频、多模态智能体。现有方法大多局限于生成静态幻灯片或文本摘要,而我们的方案突破了这些限制,能够生成高度同步的视觉内容和语音解说,逼真模拟人类风格的演示。
户外SLAM的尺度漂移问题,终于有了新解法! 香港科技大学(广州)的研究的最新成果:S3PO-GS,一个专门针对户外单目SLAM的3D高斯框架,已被ICCV 2025接收。