CMU清华教LLM练成数学高手,LeanSTaR训练模型边思考边证明,登顶新SOTA
CMU清华教LLM练成数学高手,LeanSTaR训练模型边思考边证明,登顶新SOTALLM数学水平不及小学生怎么办?CMU清华团队提出了Lean-STaR训练框架,在语言模型进行推理的每一步中都植入CoT,提升了模型的定理证明能力,成为miniF2F上的新SOTA。
LLM数学水平不及小学生怎么办?CMU清华团队提出了Lean-STaR训练框架,在语言模型进行推理的每一步中都植入CoT,提升了模型的定理证明能力,成为miniF2F上的新SOTA。
RLHF到底是不是强化学习?最近,AI大佬圈因为这个讨论炸锅了。和LeCun同为质疑派的Karpathy表示:比起那种让AlphaGo在围棋中击败人类的强化学习,RLHF还差得远呢。
前段时间冲上热搜的问题「9.11比9.9大吗?」,让几乎所有LLM集体翻车。看似热度已过,但AI界大佬Andrej Karpathy却从中看出了当前大模型技术的本质缺陷,以及未来的潜在改进方向。
RLHF 与 RL 到底能不能归属为一类,看来大家还是有不一样的看法。
深度学习三巨头之一Yoshua Bengio的下一步动向公开了,关于AI安全——
Gary Marcus再写长文整顿AI巨头圈:我们最该害怕的奥特曼是山姆·奥特曼。
为什么说AI搜索不只是搜索?
智谱AI把自研打造的大模型给开源了。
经历过「千模大战」的喧嚣,一年半之后,生成式 AI 的应用层创新终于步入爆发期。
这起另类的收购,似乎更像是AI泡沫开始出现的征兆。