AI资讯新闻榜单内容搜索-强化学习

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 强化学习
Gemini多模态时代开启!DeepMind CEO揭秘超进化体融进AlphaGo,明年面世

Gemini多模态时代开启!DeepMind CEO揭秘超进化体融进AlphaGo,明年面世

Gemini多模态时代开启!DeepMind CEO揭秘超进化体融进AlphaGo,明年面世

谷歌带着Gemini真的来了,多模态能力震惊全网。下一代模型将融合AlphaGo深度强化学习技术,2024年面世。真正可以叫板GPT-4的模型,当属谷歌Gemini。

来自主题: AI资讯
4068 点击    2023-12-09 15:46
微调都不要了?3个样本、1个提示搞定LLM对齐,提示工程师:全都回来了

微调都不要了?3个样本、1个提示搞定LLM对齐,提示工程师:全都回来了

微调都不要了?3个样本、1个提示搞定LLM对齐,提示工程师:全都回来了

大模型的效果好不好,有时候对齐调优很关键。但近来很多研究开始探索无微调的方法,艾伦人工智能研究所和华盛顿大学的研究者用「免调优」对齐新方法超越了使用监督调优(SFT)和人类反馈强化学习(RLHF)的 LLM 性能。

来自主题: AI资讯
5909 点击    2023-12-06 15:17
清华AI模型登Nature子刊:玩转城市空间规划,快人类3000倍

清华AI模型登Nature子刊:玩转城市空间规划,快人类3000倍

清华AI模型登Nature子刊:玩转城市空间规划,快人类3000倍

来自清华大学的研究团队提出了一个深度强化学习算法的模型。基于 15 分钟城市概念,该模型可以进行复杂的城市空间规划。

来自主题: AI技术研报
3905 点击    2023-09-18 00:29
2型糖尿病患者血糖如何精准调控?中山医院利用AI系统突破,成果刊顶级期刊

2型糖尿病患者血糖如何精准调控?中山医院利用AI系统突破,成果刊顶级期刊

2型糖尿病患者血糖如何精准调控?中山医院利用AI系统突破,成果刊顶级期刊

近日,复旦大学附属中山医院内分泌科李小英、陈颖团队联合北京邮电大学王光宇教授团队首次提出采用基于强化学习算法的AI系统“RL-DITR”制定胰岛素决策策略。

来自主题: AI资讯
3252 点击    2023-09-17 22:59