AI资讯新闻榜单内容搜索-RL

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: RL
微调都不要了?3个样本、1个提示搞定LLM对齐,提示工程师:全都回来了

微调都不要了?3个样本、1个提示搞定LLM对齐,提示工程师:全都回来了

微调都不要了?3个样本、1个提示搞定LLM对齐,提示工程师:全都回来了

大模型的效果好不好,有时候对齐调优很关键。但近来很多研究开始探索无微调的方法,艾伦人工智能研究所和华盛顿大学的研究者用「免调优」对齐新方法超越了使用监督调优(SFT)和人类反馈强化学习(RLHF)的 LLM 性能。

来自主题: AI资讯
5849 点击    2023-12-06 15:17
梅拉妮·米歇尔Science刊文:AI能否自主学习世界模型?

梅拉妮·米歇尔Science刊文:AI能否自主学习世界模型?

梅拉妮·米歇尔Science刊文:AI能否自主学习世界模型?

现代认知科学认为,人类会在头脑中构建关于周围真实世界的抽象模型——世界模型(world model)。获取“世界模型”的问题一直是人工智能研究的焦点。OpenAI 联合创始人兼首席科学家 Ilya Sutskever 认为, ChatGPT 已经学到了关于真实世界的复杂抽象模型。

来自主题: AI技术研报
4063 点击    2023-11-19 22:56
一文盘点2023人工智能进展,不止大模型而已

一文盘点2023人工智能进展,不止大模型而已

一文盘点2023人工智能进展,不止大模型而已

RLHF今年虽然爆火,但实打实用到的模型并不多,现在还出现了替代方案,有望从开源界“出圈”;大模型透明度越来越低,透明度最高的是Llama 2,但得分也仅有54;

来自主题: AI资讯
5261 点击    2023-11-16 23:35
AI已经帮助天文学家进行令人难以置信的发现

AI已经帮助天文学家进行令人难以置信的发现

AI已经帮助天文学家进行令人难以置信的发现

2023 年世界太空周(World Space Week 2023)即将到来,在太空时代庆祝其 66 周年之际,太空网(Space.com)将关注人工智能(AI)的现状及其对天文学和太空探索的影响

来自主题: AI资讯
2661 点击    2023-10-08 15:21
红杉资本:AI的第二段进程

红杉资本:AI的第二段进程

红杉资本:AI的第二段进程

最近,红杉资本发布了关于 AI 的第二篇预测文章《Generative AI Act Two》。这是即上一篇预测文章《Generative AI:A Creative New World》发布一年后,又一重量级的迭代型预测。

来自主题: AI资讯
7027 点击    2023-09-22 18:15
2型糖尿病患者血糖如何精准调控?中山医院利用AI系统突破,成果刊顶级期刊

2型糖尿病患者血糖如何精准调控?中山医院利用AI系统突破,成果刊顶级期刊

2型糖尿病患者血糖如何精准调控?中山医院利用AI系统突破,成果刊顶级期刊

近日,复旦大学附属中山医院内分泌科李小英、陈颖团队联合北京邮电大学王光宇教授团队首次提出采用基于强化学习算法的AI系统“RL-DITR”制定胰岛素决策策略。

来自主题: AI资讯
3173 点击    2023-09-17 22:59