AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
ICLR 2024 | RLHF有了通用平台和基准,天大开源,专攻现实决策场景

ICLR 2024 | RLHF有了通用平台和基准,天大开源,专攻现实决策场景

ICLR 2024 | RLHF有了通用平台和基准,天大开源,专攻现实决策场景

RLHF 通过学习人类偏好,能够在难以手工设计奖励函数的复杂决策任务中学习到正确的奖励引导,得到了很高的关注,在不同环境中选择合适的人类反馈类型和不同的学习方法至关重要

来自主题: AI技术研报
9917 点击    2024-03-28 09:59
详解Latte:去年底上线的全球首个开源文生视频DiT

详解Latte:去年底上线的全球首个开源文生视频DiT

详解Latte:去年底上线的全球首个开源文生视频DiT

随着 Sora 的成功发布,视频 DiT 模型得到了大量的关注和讨论。设计稳定的超大规模神经网络一直是视觉生成领域的研究重点。DiT [1] 的成功为图像生成的规模化提供了可能性。

来自主题: AI资讯
4408 点击    2024-03-27 17:56
来自科技进步一等奖的肯定:腾讯破解万亿参数大模型训练难题

来自科技进步一等奖的肯定:腾讯破解万亿参数大模型训练难题

来自科技进步一等奖的肯定:腾讯破解万亿参数大模型训练难题

中国电子学会 2023 科学技术奖授奖名单公布,这次,我们发现了一个熟悉的身影 —— 腾讯 Angel 机器学习平台。

来自主题: AI资讯
4125 点击    2024-03-27 13:15
智能体DS-Agent基于案例推理,让GPT-4数据科学任务接近100%

智能体DS-Agent基于案例推理,让GPT-4数据科学任务接近100%

智能体DS-Agent基于案例推理,让GPT-4数据科学任务接近100%

基于案例的推理助力大模型智能体挑战自动化数据科学任务,吉大、上交和汪军团队发布专注于数据科学的智能体构建框架 DS-Agent。

来自主题: AI资讯
7438 点击    2024-03-27 11:12
模型合并就进化,直接拿下SOTA!Transformer作者创业新成果火了

模型合并就进化,直接拿下SOTA!Transformer作者创业新成果火了

模型合并就进化,直接拿下SOTA!Transformer作者创业新成果火了

把Huggingface上的现成模型拿来“攒一攒”—— 直接就能组合出新的强大模型?!日本大模型公司sakana.ai脑洞大开(正是“Transformer八子”之一所创办的公司),想出了这么一个进化合并模型的妙招。

来自主题: AI资讯
8130 点击    2024-03-25 18:33
离职谷歌的Transformer作者创业,连发3个模型(附技术报告)

离职谷歌的Transformer作者创业,连发3个模型(附技术报告)

离职谷歌的Transformer作者创业,连发3个模型(附技术报告)

去年 8 月,两位著名的前谷歌研究人员 David Ha、Llion Jones 宣布创立一家人工智能公司 Sakana AI,总部位于日本东京。

来自主题: AI资讯
7319 点击    2024-03-25 17:12
讨论下一个token预测时,我们可能正在走进陷阱

讨论下一个token预测时,我们可能正在走进陷阱

讨论下一个token预测时,我们可能正在走进陷阱

自香农在《通信的数学原理》一书中提出「下一个 token 预测任务」之后,这一概念逐渐成为现代语言模型的核心部分。最近,围绕下一个 token 预测的讨论日趋激烈。

来自主题: AI资讯
7311 点击    2024-03-25 17:05
剑桥团队开源:赋能多模态大模型RAG应用,首个预训练通用多模态后期交互知识检索器

剑桥团队开源:赋能多模态大模型RAG应用,首个预训练通用多模态后期交互知识检索器

剑桥团队开源:赋能多模态大模型RAG应用,首个预训练通用多模态后期交互知识检索器

PreFLMR模型是一个通用的预训练多模态知识检索器,可用于搭建多模态RAG应用。模型基于发表于 NeurIPS 2023 的 Fine-grained Late-interaction Multi-modal Retriever (FLMR) 并进行了模型改进和 M2KR 上的大规模预训练。

来自主题: AI资讯
11990 点击    2024-03-25 17:01
CVPR 2024 | 零样本6D物体姿态估计框架SAM-6D,向具身智能更进一步

CVPR 2024 | 零样本6D物体姿态估计框架SAM-6D,向具身智能更进一步

CVPR 2024 | 零样本6D物体姿态估计框架SAM-6D,向具身智能更进一步

物体姿态估计在许多现实世界应用中起到至关重要的作用,例如具身智能、机器人灵巧操作和增强现实等。

来自主题: AI资讯
3122 点击    2024-03-24 21:49
复刻Sora的通用视频生成能力,开源多智能体框架Mora来了

复刻Sora的通用视频生成能力,开源多智能体框架Mora来了

复刻Sora的通用视频生成能力,开源多智能体框架Mora来了

自理海大学、微软研究院的研究者提出了一种多智能体框架 Mora,该框架整合了几种先进的视觉 AI 智能体,以复制 Sora 所展示的通用视频生成能力。

来自主题: AI技术研报
5646 点击    2024-03-23 21:22