AI资讯新闻榜单内容搜索-GPT

具身智能的「GPT时刻」？高德连发两个全面SOTA的ABot具身基座模型

过去几年，大模型把自然语言处理彻底重塑了。GPT 出来之前，NLP 领域的状态是：每个任务一套模型，每个场景一批数据，每个公司一条流水线，互不通用，边界清晰。GPT 之后，这套逻辑被一个预训练底座 + 任务微调的范式整个替换掉了。

来自主题: AI技术研报

6316 点击 2026-02-13 12:02

决定了：过年攻略全都不过脑子，让AI去想

春节还没到，「过年的气氛」已经渗入科技圈每个人的毛孔。单说 AI 大模型这一块，刚刚发布的有 kimi 2.5 和 Step 3.5 Flash，即将发布的据说还有 DeepSeek V4，GPT-5.3、Claude Sonnet 5、Qwen 3.5，GLM-5，说不定一觉醒来，现有的技术就要被颠覆。

来自主题: AI技术研报

6342 点击 2026-02-12 15:32

ICLR 2026 oral | AI代码真能进生产环境？SwingArena：从「写对代码Commit」到「通过CI审查」

过去一年，大模型写代码的能力几乎以肉眼可见的速度提升。从简单脚本到完整功能模块，GPT、Claude、DeepSeek 等模型已经能够在几秒钟内生成看起来相当 “专业” 的代码。

来自主题: AI技术研报

7826 点击 2026-02-12 14:56

比肩OpenAI Simple Codex，中国团队Feeling AI闯入Terminal-Bench全球第二！

就在这个被 Anthropic 和 OpenAI 视为衡量 Agent 真实工程能力全球权威基准 Terminal-Bench 2.0 榜单上，中国团队 Feeling AI 凭借 CodeBrain-1，搭载最新 GPT-5.3-Codex 底座模型，一举冲到 72.9%(70.3%) 并跻身全球排行榜第二，成为榜单前 10 中唯一的中国团队。

来自主题: AI资讯

10989 点击 2026-02-10 18:51