清华、智谱团队:探索 RLHF 的 scaling laws
清华、智谱团队:探索 RLHF 的 scaling laws目前关于 RLHF 的 scaling(扩展)潜力研究仍然相对缺乏,尤其是在模型大小、数据组成和推理预算等关键因素上的影响尚未被系统性探索。 针对这一问题,来自清华大学与智谱的研究团队对 RLHF 在 LLM 中的 scaling 性能进行了全面研究,并提出了优化策略。
搜索
目前关于 RLHF 的 scaling(扩展)潜力研究仍然相对缺乏,尤其是在模型大小、数据组成和推理预算等关键因素上的影响尚未被系统性探索。 针对这一问题,来自清华大学与智谱的研究团队对 RLHF 在 LLM 中的 scaling 性能进行了全面研究,并提出了优化策略。
最新消息,AI 大模型独角兽阶跃星辰已于近日完成 B 轮融资,总融资金额达数亿美元。投资方包括上海国有资本、腾讯投资、五源资本、启明创投等。
2024年,大模型进展不断。从年初的Sora到最新的o3,更新更好的模型不断被推出,“内卷”到底有没有发生?
老iPhone又能再战一年。
OpenAI 代号为 Orion 的新 AI 项目遇到了一个又一个问题。
在大语言模型(LLM)的发展历程中,思维链(Chain of Thought,CoT)推理无疑是一个重要的里程碑。
OpenAI在LangSmith用户群中继续稳居最常使用的大语言模型供应商宝座,其使用率是排名第二的Ollama的六倍以上。开源模型的采用率有了显著增长,特别是Ollama和Groq两家公司,它们支持用户运行开源模型,并在今年成功跻身行业前五。
12 月 22 日消息,据《南华早报》今日报道,香港中文大学(CUHK)的研究人员开发了一种新的基础人工智能模型,能够帮助解决眼科临床任务,特别是在疾病筛查和诊断方面。随着生成式 AI 在医学领域的应用逐步增多,这一技术有望带来更广泛的影响。
扩散模型在可控图像生成方面取得了空前进展,包括图像修补 ,图像着色和图像编辑。基于扩散模型的生成方案可以显著降低劳动力成本,尤其是在基于参考图像序列着色任务上,它可用于漫画创作,动画制作和黑白电影着色。
李飞飞、谢赛宁团队又有重磅发现了:多模态LLM能够记住和回忆空间,甚至内部已经形成了局部世界模型,表现了空间意识!李飞飞兴奋表示,在2025年,空间智能的界限很可能会再次突破。