AI资讯新闻榜单内容搜索-模型

您猜怎么着？Grok 4进决赛，大模型对抗赛Gemini全军覆没，马斯克「装」起来了

明天，Grok 对阵 OpenAI 的 o3。谁也没想到，谷歌攒的 Kaggle AI Chess 比赛（即大模型国际象棋对抗赛），在半决赛中，Grok 4 击败 Gemini 2.5 Pro，进入总决赛！

来自主题: AI资讯

9131 点击 2025-08-07 18:30

一夜颠覆Sora神话，H200单卡5秒出片！全华人团队开源AI引爆视频圈

AI视频生成进入了秒生极速时代！UCSD等机构发布的FastWan系模型，在一张H200上，实现了5秒即生视频。稀疏蒸馏，让去噪时间大减，刷新SOTA。

来自主题: AI资讯

7726 点击 2025-08-07 17:55

最强开源120b模型！OpenAI/国产终极二选一，速来看实测～

一直被称为"CloseAI"的OpenAI，终于舍得发布了他们继GPT-2之后的第一个开源模型：GPT-OSS

来自主题: AI产品测评

9692 点击 2025-08-07 17:45

人大高瓴-华为诺亚：大语言模型智能体记忆机制的系列研究

近期，基于大语言模型的智能体（LLM-based agent）在学术界和工业界中引起了广泛关注。对于智能体而言，记忆（Memory）是其中的重要能力，承担了记录过往信息和外部知识的功能，对于提高智能体的个性化等能力至关重要。

来自主题: AI技术研报

7528 点击 2025-08-07 17:03

GPT-5内测抢先公布：日常推理首次击败人类，编程数学科学问题能力都很强

疑似GPT-5发布的预告才刚刚发出，内测体验已抢先释出。推理能力首次超越人类，碾压所有大模型。

来自主题: AI资讯

10700 点击 2025-08-07 15:44

在笔记本上，部署 gpt-oss-120b 模型

今天，OpenAI 开源了俩模型：120B/20B 117B 的 gpt-oss-120b 对标 o4-min，按官方说法至少需要 80G 内存，推荐使用单卡 H100 GPU 而刚买的的游戏本，刚好满足gpt-oss-120b 的部署条件

来自主题: AI资讯

10297 点击 2025-08-07 15:27

一块钱的 AI，开始审判人类

过去，对于普通人来说，考试几乎决定一切。「优绩主义」的单一评判体系在无形中将社会分层。而今天，AI 已经比绝大多数人更有用了，当 AI 用一元钱的成本，完成一个人类博士的工作时，曾经代表「自我价值」的学历、职位、履历..... 正开始失效。

来自主题: AI资讯

9193 点击 2025-08-07 14:55

JinaVDR: 一个图文混排文档搜索任务的基准集

大部分现有的文档检索基准（如MTEB）只考虑了纯文本。而一旦文档的关键信息蕴含在图表、截图、扫描件和手写标记中，这些基准就无能为力。为了更好的开发下一代向量模型和重排器，我们首先需要一个能评测模型在视觉复杂文档能力的基准集。

来自主题: AI技术研报

11048 点击 2025-08-07 14:43

刚刚，马斯克Grok4干翻谷歌Gemini！o3杀入首届大模型对抗赛决战

第二轮首届大模型对抗赛结果出炉了！o3轻而易举击败o4-mini，拿下100%胜率。Grok 4和Gemini 2.5 Pro激烈对决，最终在加赛中Grok 4成功晋级。明日，Grok 4和o3将迎来终局之战。

来自主题: AI资讯

8498 点击 2025-08-07 12:31

全网开测GPT-oss！技术架构也扒明白了

全网开扒GPT-oss，惊喜发现…… 奥特曼还是谦虚了，这性能岂止是o4-mini的水平，直接SOTA击穿一众开源模型。

来自主题: AI资讯

9144 点击 2025-08-07 12:20

AI资讯新闻榜单内容搜索-模型

您猜怎么着？Grok 4进决赛，大模型对抗赛Gemini全军覆没，马斯克「装」起来了

一夜颠覆Sora神话，H200单卡5秒出片！全华人团队开源AI引爆视频圈

最强开源120b模型！OpenAI/国产 终极二选一，速来看实测～

人大高瓴-华为诺亚：大语言模型智能体记忆机制的系列研究

GPT-5内测抢先公布：日常推理首次击败人类，编程数学科学问题能力都很强

在笔记本上，部署 gpt-oss-120b 模型

一块钱的 AI，开始审判人类

JinaVDR: 一个图文混排文档搜索任务的基准集

刚刚，马斯克Grok4干翻谷歌Gemini！o3杀入首届大模型对抗赛决战

全网开测GPT-oss！技术架构也扒明白了

最强开源120b模型！OpenAI/国产终极二选一，速来看实测～