AI资讯新闻榜单内容搜索-Q-Star

LLM的范式转移：RL带来新的 Scaling Law

从几周前 Sam Altman 在 X 上发布草莓照片开始，整个行业都在期待 OpenAI 发布新模型。根据 The information 的报道，Strawberry 就是之前的 Q-star，其合成数据的方法会大幅提升 LLM 的智能推理能力，尤其体现在数学解题、解字谜、代码生成等复杂推理任务。这个方法也会用在 GPT 系列的提升上，帮助 OpenAI 新一代 Orion。

来自主题: AI资讯

9712 点击 2024-08-31 11:19

神秘的Q-Star项目，人工智能再次突破引发恐慌？

也许，解雇 Sam 是对的？前天我们发布了关于OpenAI宫斗大戏的事件经过，虽然事件以Sam重归CEO告一段落，但是董事会为何突然罢免Sam依然是一片疑团。

来自主题: AI资讯

8299 点击 2023-11-26 21:04