AI资讯新闻榜单内容搜索-数据

明确了：文本数据中加点代码，训练出的大模型更强、更通用

代码知识原来这么重要。

来自主题: AI技术研报

10303 点击 2024-08-23 17:18

LLM蒸馏到GNN，性能提升6.2%！Emory提出大模型蒸馏到文本图｜CIKM 2024

Emory大学的研究团队提出了一种创新的方法，将大语言模型（LLM）在文本图（Text-Attributed Graph, 缩写为TAG）学习中的强大能力蒸馏到本地模型中，以应对文本图学习中的数据稀缺、隐私保护和成本问题。通过训练一个解释器模型来理解LLM的推理过程，并对学生模型进行对齐优化，在多个数据集上实现了显著的性能提升，平均提高了6.2%。

来自主题: AI技术研报

10266 点击 2024-08-23 16:35

一键下载Meta最大视频分割数据集，含50.9K真实世界视频，覆盖47个国家

一键下载最大的视频分割数据集

来自主题: AI资讯

7066 点击 2024-08-23 15:15

「C位观察」数据流动的艺术：构建AI时代的高速通信网络

为了实现算力层面的提升和追赶，国内有大量的厂商和从业者在各个产业链环节努力。但面对中短期内架构、制程、产能、出口禁令等多方面的制约，我们认为从芯片层面实现单点的突破依旧是非常困难且不足的。

来自主题: AI技术研报

6474 点击 2024-08-23 15:10

“AI图算工具链”切入垂类工业设计，「中鱼互动」“鲲特”扫描仪迭代再升级

沉淀高质量数据，赋能更多细分行业。

来自主题: AI资讯

5336 点击 2024-08-23 09:38

OpenAI发布新功能，允许企业基于自家数据定制最强AI模型

OpenAI推出GPT-4o模型微调功能。

来自主题: AI资讯

6634 点击 2024-08-22 09:11

Emory提出最新PolygonGNN框架：可捕捉通用多边形内外的空间关系 | KDD 2024

PolygonGNN是一种新型框架，用于学习包括单一和多重多边形在内的多边形几何体的表征，它通过异质可见图来捕捉多边形内外的空间关系，并利用图神经网络有效处理这些关系，以提高计算效率和泛化能力。该框架在五个数据集上表现出色，证明了其在捕捉多边形几何体有用表征方面的有效性。

来自主题: AI技术研报

5472 点击 2024-08-21 18:27

支持1024帧、准确率近100％，英伟达「LongVILA」开始发力长视频

现在，长上下文视觉语言模型（VLM）有了新的全栈解决方案 ——LongVILA，它集系统、模型训练与数据集开发于一体。

来自主题: AI技术研报

9505 点击 2024-08-21 14:20

清华联合智谱AI重磅发布：中文10000字长文写作模型和提示词技术，或将改变行业

虽然大语言模型(LLM)的能力不断突破，但在长文生成方面却一直存在瓶颈。近日，清华大学和智谱AI联合发布的最新研究成果，为解决这一难题提供了创新方案。这项名为"LongWriter"的技术，成功将AI模型的长文生成能力从约2000字提升至10000字以上，同时保持了高质量输出。这一成果通过创新的数据构建方法、模型训练策略和评估基准，为AI长文创作开辟了新天地。

来自主题: AI资讯

6473 点击 2024-08-20 15:05

浅谈Llama3.1，从结构、训练过程、影响到数据合成

Llama3.1系列模型的开源，真让大模型格局大震，指标上堪比最好的闭源模型比如GPT 4o和Claude3.5，让开源追赶闭源成为现实。

来自主题: AI技术研报

10105 点击 2024-08-20 14:39