奥特曼仓促亮剑GPT-5.2!一张图爆火全网,全面碾压Gemini 3
奥特曼仓促亮剑GPT-5.2!一张图爆火全网,全面碾压Gemini 3紧急反击!自从谷歌放出Gemini 3之后,OpenAI快被逼疯了,奥特曼甚至宣布公司进入了「红色警戒」状态。据The Verge爆料,熟悉OpenAI计划的消息人士透露,OpenAI将在下周(12月9号)发布GPT-5.2,首次对Gemini 3做出正面回应。
紧急反击!自从谷歌放出Gemini 3之后,OpenAI快被逼疯了,奥特曼甚至宣布公司进入了「红色警戒」状态。据The Verge爆料,熟悉OpenAI计划的消息人士透露,OpenAI将在下周(12月9号)发布GPT-5.2,首次对Gemini 3做出正面回应。
几个小时前,NVIDIA CUDA Toolkit 13.1 正式发布,英伟达官方表示:「这是 20 年来最大的一次更新。」CUDA Tile 是 NVIDIA CUDA Toolkit 13.1 最核心的更新。它是一种基于 tile 的编程模型,能够以更高的层次编写算法,并抽象化专用硬件(例如张量核心)的细节。
左下角的血条、右下角的小地图,还有这一连串丝滑的跑酷动作…… 看到这个画面,你是不是以为《疯狂动物城2》这边刚拿下中国影史进口动画片票房第一,那边就趁势要推出 3A 开放世界游戏了?甚至这光影和物理碰撞,比很多大厂的游戏都要真实。
近日,第三方评测机构 SuperCLUE 发布 11 月 DeepSearch 评测报告,国产大模型 openPangu-R-72B 凭借在长链推理、复杂信息检索领域的卓越表现,在模型榜单中名列第一,体现了基于国产昇腾算力的大模型研发实力。
奥特曼又得拉响红色警报了。刚刚,谷歌再次扔出重磅炸弹——Gemini 3 Deep Think正式上线!轻松把草图变成逼真3D场景,不仅结构还原到位,就连镂空花纹与光影都处理得明明白白。
黄仁勋的最新2.5小时的访谈,吐露了很多震撼人心的故事:2-3年内世界上90%的知识可能将由AI生成;英伟达1996年的生死时刻;童年在烂透了的寄宿学校被迫扫厕所;未来会有巨大的机器人时装产业等。
密歇根州立大学物理学家Stephen Hsu刚刚在《Physics Letters B》上发表了一篇量子物理论文,核心思想由GPT-5从零提出,这可能是第一篇主要想法来自AI的理论物理研究论文。作者本人也在社交媒体上确认了这一点:
走上了堪称是“最佳 AI 转型路径”之后,他也在读研期间和合作者针对 AI 记忆开展了一项研究,借此发明出一种名为 LightMem(轻量记忆)的技术。在 LongMemEval 和 LoCoMo 这两个专门用于考察 AI 长期记忆能力的基准测试上,LightMem 回答问题的准确率全面超越之前的冠军模型,最高提升了 7% 以上,在某些数据集上甚至提升了将近 30%。
在具身智能与视频理解飞速发展的今天,如何让 AI 真正 “看懂” 复杂的操作步骤?北京航空航天大学陆峰教授团队联合东京大学,提出视频理解新框架。该工作引入了 “状态(State)” 作为视觉锚点,解决了抽象文本指令与具象视频之间的对齐难题,已被人工智能顶级会议 AAAI 2026 接收。
在AI浪潮中,博士学位正成为创业者的新宠,取代了传统的MBA文凭。昔日辍学神话渐成例外,如今的技术精英们凭借科研深度,引领小型高效团队迅速崛起。
两项关于大模型新架构的研究一口气在NeurIPS 2025上发布,通过“测试时训练”机制,能在推理阶段将上下文窗口扩展至200万token。两项新成果分别是:Titans:兼具RNN速度和Transformer性能的全新架构;MIRAS:Titans背后的核心理论框架。
一直以来,传统 MAS 依赖自然语言沟通,各个 LLM 之间用文本交流思路。这种方法虽然可解释,但冗长、低效、信息易丢失。LatentMAS 则让智能体直接交换内部的隐藏层表示与 KV-cache 工作记忆,做到了:
能写作策划、能生成PPT,还能在线编辑,最关键的是:还能白嫖~刚刚,阿里千问悄悄把办公和写作能力升级了一遍:文档生成、智能排版、在线编辑、多格式转换全都打包进一个入口里:
在 Text-to-Video / Image-to-Video 技术突飞猛进的今天,我们已经习惯了这样一个常识: 视频生成的第一帧(First Frame)只是时间轴的起点,是后续动画的起始画面。
优理奇机器人(UniX AI)近日宣布完成两轮合计3亿元天使++++轮及天使+++++轮融资,由川商基金、吴中金控、益华资本、青域基金、太浩创投等机构,以及若干上市公司及产业方参与投资,老股东赛纳资本追加投资。
作者在包含 50 多个任务的多个仿真和真实世界场景中评估了 SpatialActor。它在 RLBench 上取得了 87.4% 的成绩,达到 SOTA 水平;在不同噪声条件下,性能提升了 13.9% 至 19.4%,展现出强大的鲁棒性。目前该论文已被收录为 AAAI 2026 Oral,并将于近期开源。
DeepWisdom研究团队提出:视频生成模型不仅能画画,更能推理。 为了验证这一观点,团队推出了VR-Bench——这是首个通过迷宫任务评估视频模型空间推理(spatial reasoning)能力的基准测试
一年一度的英伟达奖学金出炉了。二十五年来,英伟达研究生奖学金计划(NVIDIA Graduate Fellowship Program)一直为研究生提供与英伟达技术相关的杰出工作支持。
这篇学术论长文由北京航空航天大学复杂关键软件环境全国重点实验室领衔。《From Code Foundation Models to Agents and Applications》一文是对过去几年代码智能领域的一次系统梳理:模型、任务、训练、智能体、安全与应用都被串联成了一条完整、连贯的技术链路。
2025 年 12 月,硅谷风险投资机构 Andreessen Horowitz(简称 a16z)与 AI 推理服务平台 OpenRouter 联合发布了一份名为《State of AI》的研究报告。这份报告基于 OpenRouter 平台上超过 100 万亿 token 的真实用户交互数据,试图呈现过去一年间大语言模型在实际应用中的真实状态。
确实也是轰动数学和AI两界了。因为就在最近,世界级顶尖数学家宣布辞职,前往硅谷,全职加入AI初创公司——这家公司,还是自己学生创办的——一个24岁00后华人女生。吸引他的这家公司,也不是等闲之辈,而是硅谷新贵——Axiom,一家主打AI数学的明星公司。
来自中国的初创团队词元无限给出了自己的答案。由清华姚班校友带队设计开发的编码智能体 InfCode,在 SWE-Bench Verified 和 Multi-SWE-bench-CPP 两项非常权威的 AI Coding 基准中双双登顶,力压一众编程智能体。
近日,AI 初创公司 Axiom 宣布其模型在没有人类干预的情况下,自动完成了两个数学猜想的证明——埃尔德什问题(Erdős Problem)中的 481 号和 124 号。据称,481 号问题仅用时 5 小时,代码量为 656 行;124 号问题则耗时超 24 小时。值得关注的是,这些证明均通过 Lean 验证,Lean 的特点是其形式化证明过程无需人工干预,为数学正确性提供了保障。
阿蒂从洛杉矶飞来,谈论他的初创公司上周发布的重磅消息。Klay 已与各大唱片公司——环球音乐集团、华纳音乐集团和索尼音乐—— 达成批准上市许可/注册协议 ,成为首家与这三巨头全部签约的人工智能初创企业。
Anthropic发布了Programmatic Tool Calling(PTC)特性,让Claude通过代码编排工具执行,降低token消耗、减少延迟并提升准确性。
全球首个可大规模落地的开源原生多模态架构(Native VLM),名曰NEO。要知道,此前主流的多模态大模型,例如我们熟悉的GPT-4V、Claude 3.5等,它们的底层逻辑本质上其实玩的就是拼接。
当地时间12月4日下午,谷歌研究员的一篇论文在现场引来了超多AI爱好者的围观。甚至,被业界专家视为“为AGI发展提供了新框架”,一位人士评价为:这篇论文将成为逐步推动实现AGI的5~10篇论文中的一篇。
太劲爆了!不过半月,谷歌DeepMind终于放出了IMO最强金牌模型——Gemini 3 Deep Think。今天,Gemini 3 Deep Think已在Gemini App上线,所有Ultra用户即可体验。
游戏进入下半场,阿彪说,他想让 Pollo AI 成为 AI 时代的剪映。
硬氪独家获悉,前安克创新全球CMO、中国区总裁王时远离职后创业,成立「穗升科技」;公司聚焦AI录音硬件赛道,依托软硬件结合方案实现记忆管理与行动的闭环。