AI资讯新闻榜单内容搜索-RL

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: RL
这就是OpenAI神秘的Q*?斯坦福:语言模型就是Q函数

这就是OpenAI神秘的Q*?斯坦福:语言模型就是Q函数

这就是OpenAI神秘的Q*?斯坦福:语言模型就是Q函数

在对齐大型语言模型(LLM)与人类意图方面,最常用的方法必然是根据人类反馈的强化学习(RLHF)

来自主题: AI资讯
3950 点击    2024-04-24 10:59
联想陈振宽:异构智算 释放AI基础设施新动能

联想陈振宽:异构智算 释放AI基础设施新动能

联想陈振宽:异构智算 释放AI基础设施新动能

4月18日,以“AI for All,让世界充满AI”为主题的联想创新科技大会(2024 Lenovo Tech World)在上海举办。

来自主题: AI资讯
6991 点击    2024-04-24 10:33
现在购买AI PC的人,是先驱还是韭菜?

现在购买AI PC的人,是先驱还是韭菜?

现在购买AI PC的人,是先驱还是韭菜?

在联想Tech World 2024之前,几乎所有人都预测到,联想的所有主要内容都将围绕着AIPC。毕竟,这是本月初的联想誓师大会上,杨元庆亲自所说。事实上从Intel、AMD到新入局的高通,整个PC行业玩家似乎都把AI当成救命稻草。

来自主题: AI资讯
9308 点击    2024-04-20 12:20
全球AI顶会NeurlPS开始收高中生论文了

全球AI顶会NeurlPS开始收高中生论文了

全球AI顶会NeurlPS开始收高中生论文了

培养 AI 人才,要从娃娃抓起,这句话似乎越来越不像开玩笑了。 本周五,顶级学术会议 NeurIPS 开设高中生论文 Track 的消息引爆了人工智能社区

来自主题: AI资讯
6842 点击    2024-04-14 14:46
抱抱脸Open了OpenAI的秘密武器,网易参与复现

抱抱脸Open了OpenAI的秘密武器,网易参与复现

抱抱脸Open了OpenAI的秘密武器,网易参与复现

OpenAI的秘密武器、ChatGPT背后功臣RLHF,被开源了。来自Hugging Face、加拿大蒙特利尔Mila研究所、网易伏羲AI Lab的研究人员从零开始复现了OpenAI的RLHF pipeline,罗列了25个关键实施细节。

来自主题: AI技术研报
4850 点击    2024-04-08 09:55
刚刚,Sora官方发布首支MV

刚刚,Sora官方发布首支MV

刚刚,Sora官方发布首支MV

AIGC,算是狠狠地震荡了一把音乐圈。就在刚刚,OpenAI官方账号发布的一支由Sora制作的MV(Music Video)——《Worldweight》,引发了不少网友们的围观。

来自主题: AI技术研报
8171 点击    2024-04-03 13:52
AI+下一代精准肿瘤学研究|Aignostics与拜耳共同创建新型靶点识别平台

AI+下一代精准肿瘤学研究|Aignostics与拜耳共同创建新型靶点识别平台

AI+下一代精准肿瘤学研究|Aignostics与拜耳共同创建新型靶点识别平台

2024年3月14日,拜耳与德国Aignostics GmbH宣布将就几项应用于精准肿瘤药物研发的人工智能方法展开战略合作。Aignostics是世界一流医院柏林夏里特大学(Charité-Universitätsmedizin Berlin)的衍生公司,也是利用计算病理学将复杂的生物医学数据转化为生物学见解的全球领先企业。

来自主题: AI资讯
5843 点击    2024-03-28 12:59
ICLR 2024 | RLHF有了通用平台和基准,天大开源,专攻现实决策场景

ICLR 2024 | RLHF有了通用平台和基准,天大开源,专攻现实决策场景

ICLR 2024 | RLHF有了通用平台和基准,天大开源,专攻现实决策场景

RLHF 通过学习人类偏好,能够在难以手工设计奖励函数的复杂决策任务中学习到正确的奖励引导,得到了很高的关注,在不同环境中选择合适的人类反馈类型和不同的学习方法至关重要

来自主题: AI技术研报
8496 点击    2024-03-28 09:59