AI资讯新闻榜单内容搜索-Openai

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Openai
EvaLearn:AI下半场的全新评测范式!

EvaLearn:AI下半场的全新评测范式!

EvaLearn:AI下半场的全新评测范式!

在三个月前,OpenAI 研究员 Shunyu Yao 发表了一篇关于 AI 的下半场的博客引起了广泛讨论。他在博客中指出,AI 研究正在从 “能不能做” 转向 “学得是否有效”,传统的基准测试已经难以衡量 AI 的实际效用,他指出现有的评估方式中,模型被要求独立完成每个任务,然后取平均得分。这种方式忽略了任务之间的连贯性,无法评估模型长期适应能力和更类人的动态学习能力。

来自主题: AI技术研报
6203 点击    2025-07-29 10:54
被 OpenAI 点名后,智谱刚刚发布最新旗舰模型 GLM-4.5:国产最全能,一句话造出搜索引擎

被 OpenAI 点名后,智谱刚刚发布最新旗舰模型 GLM-4.5:国产最全能,一句话造出搜索引擎

被 OpenAI 点名后,智谱刚刚发布最新旗舰模型 GLM-4.5:国产最全能,一句话造出搜索引擎

就在刚刚,智谱正式发布最新旗舰模型 GLM-4.5。按照智谱官方说法,这是一款专为 Agent 应用打造的基础模型。延续一贯的开源原则,目前这款模型已经在 Hugging Face 与 ModelScope 平台同步开源,模型权重遵循 MIT License。

来自主题: AI资讯
7948 点击    2025-07-29 09:07
GPT-5「全家桶」爆出本周上线!惊艳首测秒出网页,编程彻底起飞

GPT-5「全家桶」爆出本周上线!惊艳首测秒出网页,编程彻底起飞

GPT-5「全家桶」爆出本周上线!惊艳首测秒出网页,编程彻底起飞

GPT-5发布节点又要提前了!在LMArena上,已悄然上线了「超大杯」GPT-5-pro,内部代号zenith。一些抽卡成功的网友,开启了惊艳实测。

来自主题: AI资讯
7223 点击    2025-07-28 14:55
GenFlow 2.0 要来了,这可能是一个和所有Agent都不同的产品|WAIC2025

GenFlow 2.0 要来了,这可能是一个和所有Agent都不同的产品|WAIC2025

GenFlow 2.0 要来了,这可能是一个和所有Agent都不同的产品|WAIC2025

从 OpenAI、字节跳动,到一众创业团队,今年几乎所有 AI 公司都在推进自己的 Agent 战略:有人做工具执行器,有人做工作流代理,有人主打插件调度,有人想做全能副驾……

来自主题: AI资讯
5287 点击    2025-07-28 11:57
首次结合RL与SFT各自优势,动态引导模型实现推理⾼效训练

首次结合RL与SFT各自优势,动态引导模型实现推理⾼效训练

首次结合RL与SFT各自优势,动态引导模型实现推理⾼效训练

新一代大型推理模型,如 OpenAI-o3、DeepSeek-R1 和 Kimi-1.5,在复杂推理方面取得了显著进展。该方向核心是一种名为 ZERO-RL 的训练方法,即采用可验证奖励强化学习(RLVR)逐步提升大模型在强推理场景 (math, coding) 的 pass@1 能力。

来自主题: AI技术研报
5182 点击    2025-07-28 10:36
AI会谄媚用户的原因,竟然是不够“普信”

AI会谄媚用户的原因,竟然是不够“普信”

AI会谄媚用户的原因,竟然是不够“普信”

目前将AI当作能力更强的信息提供者,才是个最好的选择。 AI正在变得越来越有“人味”,偷懒、撒谎、谄媚等现象的出现使得让AI不再只是冷冰冰的机器。如果说OpenAI o3等模型篡改代码拒绝关机指令是“求生本能”在作祟,那么AI又为何会化身“赛博舔狗”,选择近乎无底线地迎合用户呢?

来自主题: AI资讯
5350 点击    2025-07-28 10:35
GPT-5实锤,悄悄上线代号「龙虾」!版本号曝光,实测编程惊人能改屎山代码

GPT-5实锤,悄悄上线代号「龙虾」!版本号曝光,实测编程惊人能改屎山代码

GPT-5实锤,悄悄上线代号「龙虾」!版本号曝光,实测编程惊人能改屎山代码

就在刚刚,GPT-5悄悄身披马甲出道了?一个代号为「Lobster(龙虾)」的神秘模型在WebDev Arena横空出世,轻松吊打Grok-4,网友纷纷猜测:这就是GPT-5本尊!更有提前试用者曝出:GPT-5编程能力惊人,甚至能改屎山代码。

来自主题: AI资讯
7617 点击    2025-07-27 20:13
对话Genspark、Lovart、Simular.AI创始人:OpenAI入场是大利好,ARR绝非唯一重要的事|硅谷活动

对话Genspark、Lovart、Simular.AI创始人:OpenAI入场是大利好,ARR绝非唯一重要的事|硅谷活动

对话Genspark、Lovart、Simular.AI创始人:OpenAI入场是大利好,ARR绝非唯一重要的事|硅谷活动

2025年7月17日,在GenAI Assembling 第五期硅谷Meetup上,最近火热的明星AI Agent 公司Genspark、Lovart、和Simular.ai的创始人,以及新一代基础设施公司SambaNova的Agent技术负责人,一起讨论了他们在今天AI Agent发展第一线所观察和感受到的一切。

来自主题: AI资讯
5486 点击    2025-07-27 12:34