
CVPR满分论文 | 英伟达开源双目深度估计大模型FoundationStereo
CVPR满分论文 | 英伟达开源双目深度估计大模型FoundationStereo本文介绍了 FoundationStereo,一种用于立体深度估计的基础模型,旨在实现强大的零样本泛化能力。
本文介绍了 FoundationStereo,一种用于立体深度估计的基础模型,旨在实现强大的零样本泛化能力。
4 月 3 日消息,当地时间周三,Anthropic 发布了“Claude for Education”计划,宣布正式进军高等教育市场,以应对 OpenAI 的 ChatGPT Edu 方案。该计划将为高校师生和工作人员提供 Claude AI 聊天机器人,并额外配备一系列专门功能。
近来风头正盛的GPT-4.5,不仅在日常问答中展现出惊人的上下文连贯性,在设计、咨询等需要高度创造力的任务中也大放异彩。
高通今日宣布收购越南人工智能开发商 MovianAI。MovianAI 是 VinAI Application and Research JSC 的生成式 AI 部门,后者是越南最大企业集团 Vingroup 旗下的机器学习研究实验室。此次收购后,包括前 DeepMind 研究科学家、VinAI 首席执行官 Hung Bui 在内的核心团队将加入高通。
最近,全球 AI 和机器学习顶会 ICLR 2025 公布了论文录取结果:由 IDEA、清华大学、北京大学、香港科技大学(广州)联合团队提出的 ChartMoE 成功入选 Oral (口头报告) 论文。据了解,本届大会共收到 11672 篇论文,被选中做 Oral Presentation(口头报告)的比例约为 1.8%
奥特曼被OpenAI董事会解雇的往事,还有新瓜曝出。原来是Ilya为董事会提供了关键证据。这部分证据来自前CTO Murati与奥特曼的对话截图。
幻觉(Hallucination),即生成事实错误或不一致的信息,已成为视觉-语言模型 (VLMs)可靠性面临的核心挑战。随着VLMs在自动驾驶、医疗诊断等关键领域的广泛应用,幻觉问题因其潜在的重大后果而备受关注。
Spatial-RAG结合了空间数据库和大型语言模型(LLM)的能力,能够处理复杂的空间推理问题。通过稀疏和密集检索相结合的方式,Spatial-RAG可以高效地从空间数据库中检索出满足用户查询的空间对象,并利用LLM的语义理解能力对这些对象进行排序和生成最终答案。
最近 Steam AI 驱动的游戏数量也在逐渐增多,涵盖了派对游戏、恋爱模拟等各个品类,很多游戏的玩法创新都能让人眼前一亮。
在ChatGPT上,当你画图的选项变成这个的时候,就说明用的不是Dalle3了,而是4o。目前,有两个渠道可以使用4o Image Generation。一个事ChatGPT,一个是单独的那个Sora的网站。