Claude降智实锤了!还变相涨价,Opus跌下神坛
Claude降智实锤了!还变相涨价,Opus跌下神坛Claude性能降智,已经成了重度用户们绕不开的槽点。而且发现这一点的,还是AMD高级总监Stella Laurenzo。在翻烂了近7000份会话日志后直言,Stella发现现在的Claude在处理复杂任务时已经变傻了。
搜索
Claude性能降智,已经成了重度用户们绕不开的槽点。而且发现这一点的,还是AMD高级总监Stella Laurenzo。在翻烂了近7000份会话日志后直言,Stella发现现在的Claude在处理复杂任务时已经变傻了。
你的电脑长出了第二个光标了!OpenAI重磅更新Codex,AI能在后台自己开模拟器、修Bug,完全不耽误你前台工作。一代「赛博牛马」正式觉醒。
视频世界模型跑久了容易“散架”——要么人不动了,要么场景崩了。
大模型写代码这件事,越来越像「既能写片段,又离真实工程差一截」。
有这样一种 “模型玄学”:明明是同一个 Prompt,仅仅换一种说法,模型的回答可能就天差地别。
这两天,一款名为Elephant(大象)的匿名模型,在OpenRouter上悄然亮相。上线不到48小时,这一模型已经冲到OpenRouter热榜(Trending)第一,目前调用量超过1850亿个token。
谷歌悄悄加了一个Agent新入口:Gemini开始长出「手脚」,不再只负责回答问题,还准备下场替你干活了。
AI 公司对更多数据的贪婪需求推高了从事该行业不起眼工作的初创公司的销售额:这些公司与律师、博士学位持有者和医生签约 ,由他们对 AI 模型生成的答案进行评分。
当强化学习后训练的大规模 rollout 已经被证明能够提升图像生成模型的偏好对齐能力,推理负担就成了制约训练速度的核心瓶颈。来自 NVIDIA、港大和 MIT 的团队提出的 Sol-RL,通过「FP4 先探索、BF16 再训练」的后训练框架,将达到等效 reward 水平的收敛速度最高提升到 4.64x,在训练速度与对齐效果之间给出了一条更具工程可行性的解法。
最新研究提出合成数据的全新分类框架,突破「生成模型=合成数据」的传统认知,涵盖反演、仿真与数据增强等方法,并按应用层次划分为数据中心AI、模型中心AI、可信AI和具身AI。