AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
北大对齐团队独家解读:OpenAI o1开启「后训练」时代强化学习新范式

北大对齐团队独家解读:OpenAI o1开启「后训练」时代强化学习新范式

北大对齐团队独家解读:OpenAI o1开启「后训练」时代强化学习新范式

OpenAI o1 在数学、代码、长程规划等问题取得显著的进步。一部分业内人士分析其原因是由于构建足够庞大的逻辑数据集 <问题,明确的正确答案> ,再加上类似 AlphaGo 中 MCTS 和 RL 的方法直接搜索,只要提供足够的计算量用于搜索,总可以搜到最后的正确路径。然而,这样只是建立起问题和答案之间的更好的联系,如何泛化到更复杂的问题场景,技术远不止这么简单。

来自主题: AI技术研报
6815 点击    2024-09-15 14:41
华为诺亚联合中科大发布工具调用模型ToolACE,效果持平GPT-4获开源第一

华为诺亚联合中科大发布工具调用模型ToolACE,效果持平GPT-4获开源第一

华为诺亚联合中科大发布工具调用模型ToolACE,效果持平GPT-4获开源第一

大语言模型(如 GPT-4)具备强大的语言处理能力,但其独立运作时仍存在局限性,如无法进行复杂计算,获取不到实时信息,难以提供专业定制化功能等。而大语言模型的工具调用能力使其不仅限于文字处理,更能提供全面、实时、精确的服务,极大地扩展了其应用范围和实际价值。

来自主题: AI技术研报
7699 点击    2024-09-15 14:32
南加大提出全新「通用时间序列」基础模型TimeDiT!基于扩散模型创新物理约束机制

南加大提出全新「通用时间序列」基础模型TimeDiT!基于扩散模型创新物理约束机制

南加大提出全新「通用时间序列」基础模型TimeDiT!基于扩散模型创新物理约束机制

随着近年来在文本和视频数据上构建基础模型的进展,学术界对时间序列的基础模型也表现出浓厚的兴趣。 时间序列分析在许多关键领域中具有重要性,能够影响从科学研究到经济决策的广泛应用。

来自主题: AI资讯
4628 点击    2024-09-14 16:21
首次!用合成人脸数据集训练的识别模型,性能高于真实数据集

首次!用合成人脸数据集训练的识别模型,性能高于真实数据集

首次!用合成人脸数据集训练的识别模型,性能高于真实数据集

一个高质量的人脸识别训练集要求身份 (ID) 有高的分离度(Inter-class separability)和类内的变化度(Intra-class variation)。

来自主题: AI技术研报
6354 点击    2024-09-14 16:11
边缘智能的新时代:端侧大模型的研究进展综述

边缘智能的新时代:端侧大模型的研究进展综述

边缘智能的新时代:端侧大模型的研究进展综述

Jiajun Xu : Meta AI科学家,专注大模型和智能眼镜开发。南加州大学博士,Linkedin Top AI Voice,畅销书作家。他的AI科普绘本AI for Babies (“宝宝的人工智能”系列,双语版刚在国内出版) 畅销硅谷,曾获得亚马逊儿童软件、编程新书榜榜首。

来自主题: AI技术研报
5279 点击    2024-09-13 10:29
面向软件工程的AI智能体最新进展,复旦、南洋理工、UIUC联合发布全面综述

面向软件工程的AI智能体最新进展,复旦、南洋理工、UIUC联合发布全面综述

面向软件工程的AI智能体最新进展,复旦、南洋理工、UIUC联合发布全面综述

本篇综述的作者包括来自复旦大学 CodeWisdom 团队的研究生刘俊伟、王恺欣、陈逸轩和彭鑫教授、娄一翎青年副研究员,以及南洋理工大学的陈震鹏研究员和伊利诺伊大学厄巴纳 - 香槟分校(UIUC)的张令明教授。

来自主题: AI技术研报
5290 点击    2024-09-13 10:26
蚂蚁自研知识增强大模型服务框架KAG,可显著提升知识推理准确率

蚂蚁自研知识增强大模型服务框架KAG,可显著提升知识推理准确率

蚂蚁自研知识增强大模型服务框架KAG,可显著提升知识推理准确率

近日,在 2024 Inclusion・外滩大会 “超越平面思维,图计算让 AI 洞悉复杂世界” 见解论坛上,蚂蚁集团知识图谱负责人梁磊分享了 “构建知识增强的专业智能体” 相关工作,并带来了知识图谱与大模型结合最新研发成果 —— 知识增强大模型服务框架 KAG。

来自主题: AI资讯
4874 点击    2024-09-12 14:33
LLM对齐综述|迈向可扩展的大模型自动对齐,中科院软件所&阿里千问发布

LLM对齐综述|迈向可扩展的大模型自动对齐,中科院软件所&阿里千问发布

LLM对齐综述|迈向可扩展的大模型自动对齐,中科院软件所&阿里千问发布

近年来,大模型的高速发展极大地改变了人工智能的格局。对齐(Alignment) 是使大模型的行为符合人类意图和价值观,引导大模型按照人类的需求和期望进化的核心步骤,因此受到学术界和产业界的高度关注。

来自主题: AI资讯
8360 点击    2024-09-12 10:10
JHU上交等提出首个可渲染X光3DGS!推理速度73倍NeRF,性能提升6.5dB | ECCV 2024

JHU上交等提出首个可渲染X光3DGS!推理速度73倍NeRF,性能提升6.5dB | ECCV 2024

JHU上交等提出首个可渲染X光3DGS!推理速度73倍NeRF,性能提升6.5dB | ECCV 2024

X-Gaussian是一种新型的3D Gaussian Splatting框架,专为X光新视角合成而设计,以减少医疗成像中的X光辐射剂量,通过高效的渲染技术,能够在保持图像质量的同时显著减少训练时间和提升推理速度。

来自主题: AI技术研报
8724 点击    2024-09-11 17:42