AI资讯新闻榜单内容搜索-gpt

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: gpt
用 460 万美元追上 GPT-5?Kimi 团队首次回应一切,杨植麟也来了

用 460 万美元追上 GPT-5?Kimi 团队首次回应一切,杨植麟也来了

用 460 万美元追上 GPT-5?Kimi 团队首次回应一切,杨植麟也来了

上周 Kimi K2 Thinking 发布,开源模型打败 OpenAI 和 Anthropic,让它社交媒体卷起不小的声浪,网友们都在说它厉害,我们也实测了一波,在智能体、代码和写作能力上确实进步明

来自主题: AI资讯
8521 点击    2025-11-11 11:46
AI同时学会了人类的智慧和无脑

AI同时学会了人类的智慧和无脑

AI同时学会了人类的智慧和无脑

从支持「屎棒棒创业」到数学证明,AI的「谄媚」正成隐忧:一次更新曝出迎合倾向,GPT对荒诞乃至有害想法也点头称是。斯坦福、CMU研究证实模型更爱迎合,令用户更固执、更少反思却更信任AI;数学基准亦见模型为伪命题硬编证明。

来自主题: AI技术研报
6514 点击    2025-11-11 09:51
GPT-5.1 「马甲」泄露!现在免费就能用,年底 AI 一大波更新要来了

GPT-5.1 「马甲」泄露!现在免费就能用,年底 AI 一大波更新要来了

GPT-5.1 「马甲」泄露!现在免费就能用,年底 AI 一大波更新要来了

Gemini 3 还没影子,GPT 5.1 已经在路上。7 号深夜,OpenRouter 平台上线了一个全新的隐名模型。已经有眼尖动作快的网友尝鲜体验,并且认为这就是披着马甲的 GPT 5.1,暂名:Polaris Alpha。

来自主题: AI资讯
7309 点击    2025-11-10 16:31
ChatGPT 写了 147 遍都是废话,直到我吐槽了它一句

ChatGPT 写了 147 遍都是废话,直到我吐槽了它一句

ChatGPT 写了 147 遍都是废话,直到我吐槽了它一句

半夜 3 点,你跟 AI 苦战许久,横跳在 ChatGPT、Claude、Gemini 等各个平台,辗转反侧。

来自主题: AI资讯
6788 点击    2025-11-10 10:28
小成本DeepSeek和Kimi,正攻破奥特曼的「算力护城河」

小成本DeepSeek和Kimi,正攻破奥特曼的「算力护城河」

小成本DeepSeek和Kimi,正攻破奥特曼的「算力护城河」

2025年前盛行的闭源+重资本范式正被DeepSeek-R1与月之暗面Kimi K2 Thinking改写,二者以数百万美元成本、开源权重,凭MoE与MuonClip等优化,在SWE-Bench与BrowseComp等基准追平或超越GPT-5,并以更低API价格与本地部署撬动市场预期,促使行业从砸钱堆料转向以架构创新与稳定训练为核心的高效路线。

来自主题: AI资讯
9402 点击    2025-11-10 09:19
马斯克Grok 4深夜大升级:200万逆天上下文、五倍GPT-5「脑容量」!

马斯克Grok 4深夜大升级:200万逆天上下文、五倍GPT-5「脑容量」!

马斯克Grok 4深夜大升级:200万逆天上下文、五倍GPT-5「脑容量」!

太快了!一天之内Grok连迎两大更新——Grok 4 Fast与Grok Imagine都进行了大升级。Grok 4 Fast把上下文窗口提高到2M,并把完成率拉到94.1%(推理)与97.9%(非推理)。这意味着,你不必再把一本书或一整个代码库切碎喂给模型,它可以一次吞下,然后稳定地给出结果。

来自主题: AI资讯
8725 点击    2025-11-09 15:42
仅0.2B就比GPT-4.1强?加州大学新指标:组合推理基准首次超越人类

仅0.2B就比GPT-4.1强?加州大学新指标:组合推理基准首次超越人类

仅0.2B就比GPT-4.1强?加州大学新指标:组合推理基准首次超越人类

加州大学河滨分校团队发现,AI组合推理表现不佳部分源于评测指标过于苛刻。他们提出新指标GroupMatch和Test-Time Matching算法,挖掘模型潜力,使GPT-4.1在Winoground测试中首次超越人类,0.2B参数的SigLIP-B16在MMVP-VLM基准测试上超越GPT-4.1并刷新最优结果。这表明模型的组合推理能力早已存在,只需合适方法在测试阶段解锁。

来自主题: AI技术研报
7021 点击    2025-11-09 15:33
离GPT-5最近的一次!中国1万亿参数开源巨兽突然爆火

离GPT-5最近的一次!中国1万亿参数开源巨兽突然爆火

离GPT-5最近的一次!中国1万亿参数开源巨兽突然爆火

昨天,月之暗面发布全新模型Kimi K2 Thinking,一上线就挤爆了服务器。思考,是它的核心卖点,自称是开源的「思考Agent模型」。在Tau2 Bench Telecom基准测试中,K2 Thinking位列第一。

来自主题: AI资讯
8904 点击    2025-11-08 15:49
AI科学家登场!12小时抵人类科学家半年工作量,已有7项大成果

AI科学家登场!12小时抵人类科学家半年工作量,已有7项大成果

AI科学家登场!12小时抵人类科学家半年工作量,已有7项大成果

奥特曼称GPT-6或让「AI创造新科学」成真。与此呼应,类「AI科学家」Kosmos登场:12小时读1500篇文献、跑4.2万行代码,生成可溯源报告,并在材料等方向提出新发现。它凭持续记忆自主规划,正由工具迈向合作者;但受数据来源与复现性制约,约20%结论仍需人类裁判。人机协作或将重塑科研,科研范式加速演进,前景可期。

来自主题: AI技术研报
9791 点击    2025-11-07 10:54