AI资讯新闻榜单内容搜索-模型训练

浅谈领域模型训练

这篇文章对如何进行领域模型训练进行一个简单的探讨，主要内容是对 post-pretrain 阶段进行分析，后续的 Alignment 阶段就先不提了，注意好老生常谈的“数据质量”和“数据多样性”即可。

来自主题: AI技术研报

9801 点击 2024-08-24 10:54

如何让等变神经网络可解释性更强？试试将它分解成「简单表示」

神经网络是一种灵活且强大的函数近似方法。而许多应用都需要学习一个相对于某种对称性不变或等变的函数。图像识别便是一个典型示例 —— 当图像发生平移时，情况不会发生变化。等变神经网络（equivariant neural network）可为学习这些不变或等变函数提供一个灵活的框架。

来自主题: AI技术研报

8534 点击 2024-08-23 18:10

总说具身智能的数据太贵，鹏城实验室开源百万规模标准化数据集

今年以来，具身智能正在成为学术界和产业界的热门领域，相关的产品和成果层出不穷。

来自主题: AI技术研报

9824 点击 2024-08-23 18:04

用AI自动设计智能体，数学提分25.9%，远超手工设计

AI，智能体，ADAS，元智能体搜索，模型训练

来自主题: AI技术研报

6693 点击 2024-08-23 17:39

“从头开始训练模型，几乎没有意义”

构建支持和增强人类能力的AI工具，而不是试图完全取代人类。

来自主题: AI资讯

7283 点击 2024-08-23 09:44

搜索图片有新招了！北大袁粒课题组提出图像检索新方法，输入草图or艺术or低分辨率 | ECCV 2024

从一大堆图片中精准找图，有新招了！论文已经中了ECCV 2024。

来自主题: AI技术研报

6697 点击 2024-08-22 16:49

多亏Transformer，Mamba更强了！仅用1%计算量达新SOTA

Attention is all you need.

来自主题: AI技术研报

9639 点击 2024-08-22 16:44

Emory提出最新PolygonGNN框架：可捕捉通用多边形内外的空间关系 | KDD 2024

PolygonGNN是一种新型框架，用于学习包括单一和多重多边形在内的多边形几何体的表征，它通过异质可见图来捕捉多边形内外的空间关系，并利用图神经网络有效处理这些关系，以提高计算效率和泛化能力。该框架在五个数据集上表现出色，证明了其在捕捉多边形几何体有用表征方面的有效性。

来自主题: AI技术研报

5637 点击 2024-08-21 18:27

支持1024帧、准确率近100％，英伟达「LongVILA」开始发力长视频

现在，长上下文视觉语言模型（VLM）有了新的全栈解决方案 ——LongVILA，它集系统、模型训练与数据集开发于一体。

来自主题: AI技术研报

9605 点击 2024-08-21 14:20

Beidi Chen陈贝迪独家 | 高效长序列生成之路：CPU & GPU —— 算法、系统与硬件的 co-design

本期我们邀请到了纽约大学计算机科学院博士童晟邦带来【多模态大模型：视觉为中心的探索】的主题分享。

来自主题: AI技术研报

11086 点击 2024-08-21 10:39

AI资讯新闻榜单内容搜索-模型训练

浅谈领域模型训练

如何让等变神经网络可解释性更强？试试将它分解成「简单表示」

总说具身智能的数据太贵，鹏城实验室开源百万规模标准化数据集

用AI自动设计智能体，数学提分25.9%，远超手工设计

“从头开始训练模型，几乎没有意义”

搜索图片有新招了！北大袁粒课题组提出图像检索新方法，输入草图or艺术or低分辨率 | ECCV 2024

多亏Transformer，Mamba更强了！仅用1%计算量达新SOTA

Emory提出最新PolygonGNN框架：可捕捉通用多边形内外的空间关系 | KDD 2024

支持1024帧、准确率近100％，英伟达「LongVILA」开始发力长视频

Beidi Chen陈贝迪 独家 | 高效长序列生成之路：CPU & GPU —— 算法、系统与硬件的 co-design

Beidi Chen陈贝迪独家 | 高效长序列生成之路：CPU & GPU —— 算法、系统与硬件的 co-design