AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
浅谈领域模型训练

浅谈领域模型训练

浅谈领域模型训练

这篇文章对如何进行领域模型训练进行一个简单的探讨,主要内容是对 post-pretrain 阶段进行分析,后续的 Alignment 阶段就先不提了,注意好老生常谈的“数据质量”和“数据多样性”即可。

来自主题: AI技术研报
9801 点击    2024-08-24 10:54
如何让等变神经网络可解释性更强?试试将它分解成「简单表示」

如何让等变神经网络可解释性更强?试试将它分解成「简单表示」

如何让等变神经网络可解释性更强?试试将它分解成「简单表示」

神经网络是一种灵活且强大的函数近似方法。而许多应用都需要学习一个相对于某种对称性不变或等变的函数。图像识别便是一个典型示例 —— 当图像发生平移时,情况不会发生变化。等变神经网络(equivariant neural network)可为学习这些不变或等变函数提供一个灵活的框架。

来自主题: AI技术研报
8534 点击    2024-08-23 18:10
“从头开始训练模型,几乎没有意义”

“从头开始训练模型,几乎没有意义”

“从头开始训练模型,几乎没有意义”

构建支持和增强人类能力的AI工具,而不是试图完全取代人类。

来自主题: AI资讯
7283 点击    2024-08-23 09:44
Emory提出最新PolygonGNN框架:可捕捉通用多边形内外的空间关系 | KDD 2024

Emory提出最新PolygonGNN框架:可捕捉通用多边形内外的空间关系 | KDD 2024

Emory提出最新PolygonGNN框架:可捕捉通用多边形内外的空间关系 | KDD 2024

PolygonGNN是一种新型框架,用于学习包括单一和多重多边形在内的多边形几何体的表征,它通过异质可见图来捕捉多边形内外的空间关系,并利用图神经网络有效处理这些关系,以提高计算效率和泛化能力。该框架在五个数据集上表现出色,证明了其在捕捉多边形几何体有用表征方面的有效性。

来自主题: AI技术研报
5637 点击    2024-08-21 18:27
支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频

支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频

支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频

现在,长上下文视觉语言模型(VLM)有了新的全栈解决方案 ——LongVILA,它集系统、模型训练与数据集开发于一体。

来自主题: AI技术研报
9605 点击    2024-08-21 14:20