
大模型竞赛转向:决胜关键为何是“后训练”?
大模型竞赛转向:决胜关键为何是“后训练”?随着基础大模型在通用能力上的边际效益逐渐递减、大模型技术红利向产业端渗透,AI的技术范式也开始从原来的注重“预训练”向注重“后训练”转移。后训练(Post-training),正从过去锦上添花的“调优”环节,演变为决定模型最终价值的“主战场”。
随着基础大模型在通用能力上的边际效益逐渐递减、大模型技术红利向产业端渗透,AI的技术范式也开始从原来的注重“预训练”向注重“后训练”转移。后训练(Post-training),正从过去锦上添花的“调优”环节,演变为决定模型最终价值的“主战场”。
尽管多模态大模型在数学、科学等结构化任务中取得了长足进步,但在需要灵活解读视觉信息的通用场景下,其性能提升瓶颈依然显著。
程序员最有价值的技能已经不再是编写代码了,而是精确地向 AI 传达意图。一份完善的规范才是包含完整意图的真正「源代码」。
OpenAI通用推理模型在国际奥数竞赛中达到金牌水平,解出5题得分35/42。模型通过新技术实现长时间复杂推理和自然语言证明,非专用系统。标志AI在创造性思考和科学研究的重大突破,为解决千年难题铺路。GPT-5即将发布但暂缺此能力。
「硅谷最贵华人」庞若鸣昔日老将Mark Lee与Tom Gunter加入Meta!扎克伯格亲自挂帅,誓补AI人才与算力短板。苹果深陷人事动荡。AI战局愈演愈烈,硅谷风云再起。
成立仅8个月已成为最新独角兽,估值飙升至18亿美元。 目前已拥有超230万免费活跃用户、18万付费订阅者,付费用户首月留存率甚至已超ChatGPT。
在爆火仅四个月后,Manus AI 突然几乎全面撤出中国市场,不仅清空全部社交账号内容,而且国行版本的 Manus 也疑似暂停推进。
几千人盲投,Kimi K2超越DeepSeek拿下全球开源第一!
在没有标准答案的开放式对话中,RL该怎么做?多轮对话是大模型最典型的开放任务:高频、多轮、强情境依赖,且“好回复”因人而异。
在全球这场10万亿美元的AI技术革命中,新加坡正在成为关键节点。“在新加坡,有参加不完的AI 聚会。”Linkda创始人黄琳在新加坡创业10多年,近两年服务了数百家出海新加坡的中国企业,其中1/3是AI初创公司。