AI资讯新闻榜单内容搜索-Al

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Al
ICLR 2026 Oral | DPO「只看总分不看细节」?TI-DPO用Token重要性重塑大模型对齐

ICLR 2026 Oral | DPO「只看总分不看细节」?TI-DPO用Token重要性重塑大模型对齐

ICLR 2026 Oral | DPO「只看总分不看细节」?TI-DPO用Token重要性重塑大模型对齐

在当今的大模型后训练(Post-training)阶段,DPO(直接偏好优化) 凭借其无需训练独立 Reward Model 的优雅设计和高效性,成功取代 PPO 成为业界的 「版本之子」,被广泛应用于 Llama-3、Mistral 等顶流开源模型的对齐中。

来自主题: AI技术研报
6655 点击    2026-02-11 13:58
破案了,Pony Alpha中国制造,小龙逆袭AI Coding

破案了,Pony Alpha中国制造,小龙逆袭AI Coding

破案了,Pony Alpha中国制造,小龙逆袭AI Coding

这两天,一款名为Pony Alpha的模型,凭借在Coding能力上的出色表现,一时间成为了AI圈内最火爆的名字。

来自主题: AI资讯
8745 点击    2026-02-11 12:33
比肩OpenAI Simple Codex,中国团队Feeling AI闯入Terminal-Bench全球第二!

比肩OpenAI Simple Codex,中国团队Feeling AI闯入Terminal-Bench全球第二!

比肩OpenAI Simple Codex,中国团队Feeling AI闯入Terminal-Bench全球第二!

就在这个被 Anthropic 和 OpenAI 视为衡量 Agent 真实工程能力全球权威基准 Terminal-Bench 2.0 榜单上,中国团队 Feeling AI 凭借 CodeBrain-1,搭载最新 GPT-5.3-Codex 底座模型,一举冲到 72.9%(70.3%) 并跻身全球排行榜第二,成为榜单前 10 中唯一的中国团队。

来自主题: AI资讯
10095 点击    2026-02-10 18:51
GLM-5架构曝光,智谱两日涨60%:采用DeepSeek同款稀疏注意力

GLM-5架构曝光,智谱两日涨60%:采用DeepSeek同款稀疏注意力

GLM-5架构曝光,智谱两日涨60%:采用DeepSeek同款稀疏注意力

不管Pony Alpha是不是智谱的,下一代旗舰大模型GLM-5都要来了。GLM-5采用了DeepSeek-V3/V3.2架构,包括稀疏注意力机制(DSA)和多Token预测(MTP),总参数量745B,是上一代GLM-4.7的2倍。

来自主题: AI资讯
8642 点击    2026-02-10 16:27
神秘模型「Pony Alpha」火了,被曝是GLM-5

神秘模型「Pony Alpha」火了,被曝是GLM-5

神秘模型「Pony Alpha」火了,被曝是GLM-5

马年未至,春节档新模型已经蓄势待发。

来自主题: AI资讯
6774 点击    2026-02-09 15:01
Sam Altman:Codex两小时改变我的习惯,AI的上限是"完整AI公司"

Sam Altman:Codex两小时改变我的习惯,AI的上限是"完整AI公司"

Sam Altman:Codex两小时改变我的习惯,AI的上限是"完整AI公司"

"我最初装上Codex时说,绝不会让它完全控制我的电脑。这句话大概坚持了两小时。"OpenAI CEO Sam Altman在Cisco AI Summit上坦承,自己现在用两台笔记本电脑工作——一台

来自主题: AI资讯
7795 点击    2026-02-09 14:37
速递|从LLM到LTM:Fundamental以“数据基础模型”切入,A轮融资2.55亿美元

速递|从LLM到LTM:Fundamental以“数据基础模型”切入,A轮融资2.55亿美元

速递|从LLM到LTM:Fundamental以“数据基础模型”切入,A轮融资2.55亿美元

大规模表格模型(LTM)而非大规模语言模型(LLM)的 Fundamental 公司 Nexus 模型,在多个重要方面突破了当代人工智能实践。该模型具有确定性——即每次被询问相同问题时都会给出相同答案——且不依赖定义当代大多数人工智能实验室模型的 Transformer 架构 。

来自主题: AI资讯
9160 点击    2026-02-09 11:22
试了试新模型Pony Alpha,感觉似乎不够惊艳?!

试了试新模型Pony Alpha,感觉似乎不够惊艳?!

试了试新模型Pony Alpha,感觉似乎不够惊艳?!

这周真的特别期待,应该可以看到各路厂商神仙打架。这股战火,从周末就开始了。 除了字节发布的Seedance2.0以外,还有个神秘的模型Pony Alpha 也上线到OpenRouter了,已经看到很多网友们纷纷猜测到底是谁家的模型。

来自主题: AI产品测评
7827 点击    2026-02-09 11:12
Waymo联手DeepMind打造世界模型:基于Genie 3,让自动驾驶「脑补」罕见场景

Waymo联手DeepMind打造世界模型:基于Genie 3,让自动驾驶「脑补」罕见场景

Waymo联手DeepMind打造世界模型:基于Genie 3,让自动驾驶「脑补」罕见场景

刚刚,Alphabet 旗下的自动驾驶汽车公司 Waymo,推出了最新世界模型 Waymo World Model,其基于 DeepMind 的 Genie 3 构建,在大规模、超真实自动驾驶仿真方面树立了全新的行业标杆。

来自主题: AI资讯
8898 点击    2026-02-08 12:09