AI资讯新闻榜单内容搜索-数据

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 数据
LLM蒸馏到GNN,性能提升6.2%!Emory提出大模型蒸馏到文本图|CIKM 2024

LLM蒸馏到GNN,性能提升6.2%!Emory提出大模型蒸馏到文本图|CIKM 2024

LLM蒸馏到GNN,性能提升6.2%!Emory提出大模型蒸馏到文本图|CIKM 2024

Emory大学的研究团队提出了一种创新的方法,将大语言模型(LLM)在文本图(Text-Attributed Graph, 缩写为TAG)学习中的强大能力蒸馏到本地模型中,以应对文本图学习中的数据稀缺、隐私保护和成本问题。通过训练一个解释器模型来理解LLM的推理过程,并对学生模型进行对齐优化,在多个数据集上实现了显著的性能提升,平均提高了6.2%。

来自主题: AI技术研报
10266 点击    2024-08-23 16:35
「C位观察」数据流动的艺术:构建AI时代的高速通信网络

「C位观察」数据流动的艺术:构建AI时代的高速通信网络

「C位观察」数据流动的艺术:构建AI时代的高速通信网络

为了实现算力层面的提升和追赶,国内有大量的厂商和从业者在各个产业链环节努力。但面对中短期内架构、制程、产能、出口禁令等多方面的制约,我们认为从芯片层面实现单点的突破依旧是非常困难且不足的。

来自主题: AI技术研报
6474 点击    2024-08-23 15:10
Emory提出最新PolygonGNN框架:可捕捉通用多边形内外的空间关系 | KDD 2024

Emory提出最新PolygonGNN框架:可捕捉通用多边形内外的空间关系 | KDD 2024

Emory提出最新PolygonGNN框架:可捕捉通用多边形内外的空间关系 | KDD 2024

PolygonGNN是一种新型框架,用于学习包括单一和多重多边形在内的多边形几何体的表征,它通过异质可见图来捕捉多边形内外的空间关系,并利用图神经网络有效处理这些关系,以提高计算效率和泛化能力。该框架在五个数据集上表现出色,证明了其在捕捉多边形几何体有用表征方面的有效性。

来自主题: AI技术研报
5472 点击    2024-08-21 18:27
支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频

支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频

支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频

现在,长上下文视觉语言模型(VLM)有了新的全栈解决方案 ——LongVILA,它集系统、模型训练与数据集开发于一体。

来自主题: AI技术研报
9505 点击    2024-08-21 14:20
清华联合智谱AI重磅发布:中文10000字长文写作模型和提示词技术,或将改变行业

清华联合智谱AI重磅发布:中文10000字长文写作模型和提示词技术,或将改变行业

清华联合智谱AI重磅发布:中文10000字长文写作模型和提示词技术,或将改变行业

虽然大语言模型(LLM)的能力不断突破,但在长文生成方面却一直存在瓶颈。近日,清华大学和智谱AI联合发布的最新研究成果,为解决这一难题提供了创新方案。这项名为"LongWriter"的技术,成功将AI模型的长文生成能力从约2000字提升至10000字以上,同时保持了高质量输出。这一成果通过创新的数据构建方法、模型训练策略和评估基准,为AI长文创作开辟了新天地。

来自主题: AI资讯
6473 点击    2024-08-20 15:05
浅谈Llama3.1,从结构、训练过程、影响到数据合成

浅谈Llama3.1,从结构、训练过程、影响到数据合成

浅谈Llama3.1,从结构、训练过程、影响到数据合成

Llama3.1系列模型的开源,真让大模型格局大震,指标上堪比最好的闭源模型比如GPT 4o和Claude3.5,让开源追赶闭源成为现实。

来自主题: AI技术研报
10105 点击    2024-08-20 14:39