AI资讯新闻榜单内容搜索-训练

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 训练

明确了：文本数据中加点代码，训练出的大模型更强、更通用

明确了：文本数据中加点代码，训练出的大模型更强、更通用

明确了：文本数据中加点代码，训练出的大模型更强、更通用

代码知识原来这么重要。

来自主题: AI技术研报

11733 点击 2024-08-23 17:18

LLM蒸馏到GNN，性能提升6.2%！Emory提出大模型蒸馏到文本图｜CIKM 2024

LLM蒸馏到GNN，性能提升6.2%！Emory提出大模型蒸馏到文本图｜CIKM 2024

LLM蒸馏到GNN，性能提升6.2%！Emory提出大模型蒸馏到文本图｜CIKM 2024

Emory大学的研究团队提出了一种创新的方法，将大语言模型（LLM）在文本图（Text-Attributed Graph, 缩写为TAG）学习中的强大能力蒸馏到本地模型中，以应对文本图学习中的数据稀缺、隐私保护和成本问题。通过训练一个解释器模型来理解LLM的推理过程，并对学生模型进行对齐优化，在多个数据集上实现了显著的性能提升，平均提高了6.2%。

来自主题: AI技术研报

12467 点击 2024-08-23 16:35

“从头开始训练模型，几乎没有意义”

“从头开始训练模型，几乎没有意义”

“从头开始训练模型，几乎没有意义”

构建支持和增强人类能力的AI工具，而不是试图完全取代人类。

来自主题: AI资讯

8268 点击 2024-08-23 09:44

搜索图片有新招了！北大袁粒课题组提出图像检索新方法，输入草图or艺术or低分辨率 | ECCV 2024

搜索图片有新招了！北大袁粒课题组提出图像检索新方法，输入草图or艺术or低分辨率 | ECCV 2024

搜索图片有新招了！北大袁粒课题组提出图像检索新方法，输入草图or艺术or低分辨率 | ECCV 2024

从一大堆图片中精准找图，有新招了！论文已经中了ECCV 2024。

来自主题: AI技术研报

7901 点击 2024-08-22 16:49

多亏Transformer，Mamba更强了！仅用1%计算量达新SOTA

多亏Transformer，Mamba更强了！仅用1%计算量达新SOTA

多亏Transformer，Mamba更强了！仅用1%计算量达新SOTA

Attention is all you need.

来自主题: AI技术研报

11471 点击 2024-08-22 16:44

Emory提出最新PolygonGNN框架：可捕捉通用多边形内外的空间关系 | KDD 2024

Emory提出最新PolygonGNN框架：可捕捉通用多边形内外的空间关系 | KDD 2024

Emory提出最新PolygonGNN框架：可捕捉通用多边形内外的空间关系 | KDD 2024

PolygonGNN是一种新型框架，用于学习包括单一和多重多边形在内的多边形几何体的表征，它通过异质可见图来捕捉多边形内外的空间关系，并利用图神经网络有效处理这些关系，以提高计算效率和泛化能力。该框架在五个数据集上表现出色，证明了其在捕捉多边形几何体有用表征方面的有效性。

来自主题: AI技术研报

7512 点击 2024-08-21 18:27

支持1024帧、准确率近100％，英伟达「LongVILA」开始发力长视频

支持1024帧、准确率近100％，英伟达「LongVILA」开始发力长视频

支持1024帧、准确率近100％，英伟达「LongVILA」开始发力长视频

现在，长上下文视觉语言模型（VLM）有了新的全栈解决方案 ——LongVILA，它集系统、模型训练与数据集开发于一体。

来自主题: AI技术研报

10815 点击 2024-08-21 14:20

腾讯混元大模型负责人王迪：揭秘万亿 MoE 系统工程之道｜智者访谈

腾讯混元大模型负责人王迪：揭秘万亿 MoE 系统工程之道｜智者访谈

腾讯混元大模型负责人王迪：揭秘万亿 MoE 系统工程之道｜智者访谈

人工智能正经历一场由大模型引发的革命。这些拥有数十亿甚至万亿参数的庞然大物，正在重塑我们对 AI 能力的认知，也构筑起充满挑战与机遇的技术迷宫——从计算集群高速互联网络的搭建，到训练过程中模型稳定性和鲁棒性的提升，再到探索更快更优的压缩与加速方法，每一步都是对创新者的考验。

来自主题: AI资讯

12514 点击 2024-08-21 14:13

不花一分钱！GPT-4o微调限时免费开放，每日附赠百万训练token

不花一分钱！GPT-4o微调限时免费开放，每日附赠百万训练token

不花一分钱！GPT-4o微调限时免费开放，每日附赠百万训练token

一觉醒来，OpenAI又上新功能了：

来自主题: AI资讯

10152 点击 2024-08-21 13:56

Beidi Chen陈贝迪独家 | 高效长序列生成之路：CPU & GPU —— 算法、系统与硬件的 co-design

Beidi Chen陈贝迪独家 | 高效长序列生成之路：CPU & GPU —— 算法、系统与硬件的 co-design

Beidi Chen陈贝迪独家 | 高效长序列生成之路：CPU & GPU —— 算法、系统与硬件的 co-design

本期我们邀请到了纽约大学计算机科学院博士童晟邦带来【多模态大模型：视觉为中心的探索】的主题分享。

来自主题: AI技术研报

13054 点击 2024-08-21 10:39

上一页当前第405页,共488页下一页