AI资讯新闻榜单内容搜索-模型训练

让模型预见分布漂移：动态系统颠覆性设计引领时域泛化新革命｜NeurIPS 2024

研究人员提出了一种方法，能够在领域数据分布持续变化的动态环境中，基于随机时刻观测的数据分布，在任意时刻生成适用的神经网络，实现前所未有的泛化能力。

来自主题: AI技术研报

9178 点击 2024-12-02 15:25

图结构转文本序列，大模型直接读懂！图推理性能大涨

大语言模型直接理解复杂图结构的新方法来了：

来自主题: AI技术研报

8423 点击 2024-12-02 14:57

微软：两个AI相互纠错，数学再涨5分

提升LLM数学能力的新方法来了——

来自主题: AI技术研报

6811 点击 2024-12-02 14:51

NeurIPS 2024｜杜克大学&谷歌提出SLED解码框架，无需外部数据与额外训练，有效缓解大语言模型幻觉，提高事实准确性

大语言模型（LLM）在各种任务上展示了卓越的性能。然而，受到幻觉（hallucination）的影响，LLM 生成的内容有时会出现错误或与事实不符，这限制了其在实际应用中的可靠性。

来自主题: AI技术研报

10358 点击 2024-12-02 14:27

NeurIPS 2024 | 数学推理场景下，首个分布外检测研究成果来了

本文将介绍数学推理场景下的首个分布外检测研究成果。

来自主题: AI技术研报

4115 点击 2024-12-02 14:14

DeepMind用语言游戏让大模型学AlphaGo自我博弈，数据限制不存在了

自我博弈，很神奇吧？

来自主题: AI技术研报

5364 点击 2024-12-02 14:01

美欧亚三洲开发者联手，全球首个组团训练的大模型来了，全流程开源

Prime Intellect 宣布通过去中心化方式训练完成了一个 10B 模型。30 号，他们开源了一切，包括基础模型、检查点、后训练模型、数据、PRIME 训练框架和技术报告。据了解，这应该是有史以来首个以去中心化形式训练得到的 10B 大模型。

来自主题: AI资讯

9192 点击 2024-12-02 12:35

关于计算机视觉中的自回归模型，这篇综述一网打尽了

随着计算机视觉领域的不断发展，自回归模型作为一种强大的生成模型，在图像生成、视频生成、3D 生成和多模态生成等任务中展现出了巨大的潜力。然而，由于该领域的快速发展，及时、全面地了解自回归模型的研究现状和进展变得至关重要。本文旨在对视觉领域中的自回归模型进行全面综述，为研究人员提供一个清晰的参考框架。

来自主题: AI技术研报

8940 点击 2024-12-01 14:21

Andrej Karpathy：神奇大模型不存在的，只是对人类标注的拙劣模仿

本周五，知名 AI 领域学者，OpenAI 创始成员、特斯拉前 AI 高级总监 Andrej Karpathy 发表观点：「人们对『向人工智能询问某件事』的解释过于夸张」，引发网友热议。

来自主题: AI资讯

6907 点击 2024-12-01 14:17

无需Transformer，简单滤波器即可提高时间序列预测精度 | NeurIPS 2024

无需Transformer，简单滤波器即可提高时间序列预测精度。由国家信息中心、牛津大学、北京理工大学、同济大学、中国科学技术大学等机构的团队提出了一个FilterNet。目前已被NeurlPS 2024接收。

来自主题: AI技术研报

7851 点击 2024-12-01 14:12