AI资讯新闻榜单内容搜索-模型训练

Emory提出最新PolygonGNN框架：可捕捉通用多边形内外的空间关系 | KDD 2024

PolygonGNN是一种新型框架，用于学习包括单一和多重多边形在内的多边形几何体的表征，它通过异质可见图来捕捉多边形内外的空间关系，并利用图神经网络有效处理这些关系，以提高计算效率和泛化能力。该框架在五个数据集上表现出色，证明了其在捕捉多边形几何体有用表征方面的有效性。

来自主题: AI技术研报

7453 点击 2024-08-21 18:27

支持1024帧、准确率近100％，英伟达「LongVILA」开始发力长视频

现在，长上下文视觉语言模型（VLM）有了新的全栈解决方案 ——LongVILA，它集系统、模型训练与数据集开发于一体。

来自主题: AI技术研报

10775 点击 2024-08-21 14:20

Beidi Chen陈贝迪独家 | 高效长序列生成之路：CPU & GPU —— 算法、系统与硬件的 co-design

本期我们邀请到了纽约大学计算机科学院博士童晟邦带来【多模态大模型：视觉为中心的探索】的主题分享。

来自主题: AI技术研报

12971 点击 2024-08-21 10:39

清华联合智谱AI重磅发布：中文10000字长文写作模型和提示词技术，或将改变行业

虽然大语言模型(LLM)的能力不断突破，但在长文生成方面却一直存在瓶颈。近日，清华大学和智谱AI联合发布的最新研究成果，为解决这一难题提供了创新方案。这项名为"LongWriter"的技术，成功将AI模型的长文生成能力从约2000字提升至10000字以上，同时保持了高质量输出。这一成果通过创新的数据构建方法、模型训练策略和评估基准，为AI长文创作开辟了新天地。

来自主题: AI资讯

9169 点击 2024-08-20 15:05

AI设计自己，代码造物主已来！UBC华人一作首提ADAS，数学能力暴涨25.9%

AI掌握自我设计的权力，将会怎样？最近，来自UBC等机构研究人员提出了「智能体自动化设计」系统，让元智能体使用搜索算法，自动构建强大的同类。

来自主题: AI技术研报

11231 点击 2024-08-20 14:47

浙大李玺团队：指代表达理解新方法，ScanFormer粗到细迭代消除视觉冗余

作为基础的视觉语言任务，指代表达理解（referring expression comprehension, REC）根据自然语言描述来定位图中被指代的目标。REC 模型通常由三部分组成：视觉编码器、文本编码器和跨模态交互，分别用于提取视觉特征、文本特征和跨模态特征特征交互与增强。

来自主题: AI技术研报

7293 点击 2024-08-20 14:36

这世界究竟怎么了？硅谷大佬公开支持AI公司“偷”数据

“乱世”其实早已到来，只不过这次是公开承认了这个现实。

来自主题: AI资讯

6931 点击 2024-08-20 09:56

小模型站起来了，浏览器里跑出SOTA，抱抱脸：快逃，合成数据不是未来

浏览器里直接能跑的SOTA小模型来了，分别在2亿、5亿和20亿级别获胜，抱抱脸出品。

来自主题: AI资讯

7051 点击 2024-08-19 16:41

LLM数学性能暴涨168%，微软14人团队力作！合成数据2.0秘诀曝光，智能体生成教学

合成数据2.0秘诀曝光了！来自微软的研究人员们提出了智能体框架AgentInstruct，能够自动创建大量、多样化的合成数据。经过合成数据微调后的模型Orca-3，在多项基准上刷新了SOTA。

来自主题: AI技术研报

10853 点击 2024-08-19 14:52

大模型终端部署新趋势：硬件直接支持混合矩阵乘法

在人工智能领域，模型参数的增多往往意味着性能的提升。但随着模型规模的扩大，其对终端设备的算力与内存需求也日益增加。低比特量化技术，由于可以大幅降低存储和计算成本并提升推理效率，已成为实现大模型在资源受限设备上高效运行的关键技术之一。然而，如果硬件设备不支持低比特量化后的数据模式，那么低比特量化的优势将无法发挥。

来自主题: AI资讯

5325 点击 2024-08-19 14:49

AI资讯新闻榜单内容搜索-模型训练

Emory提出最新PolygonGNN框架：可捕捉通用多边形内外的空间关系 | KDD 2024

支持1024帧、准确率近100％，英伟达「LongVILA」开始发力长视频

Beidi Chen陈贝迪 独家 | 高效长序列生成之路：CPU & GPU —— 算法、系统与硬件的 co-design

清华联合智谱AI重磅发布：中文10000字长文写作模型和提示词技术，或将改变行业

AI设计自己，代码造物主已来！UBC华人一作首提ADAS，数学能力暴涨25.9%

浙大李玺团队：指代表达理解新方法，ScanFormer粗到细迭代消除视觉冗余

这世界究竟怎么了？硅谷大佬公开支持AI公司“偷”数据

小模型站起来了，浏览器里跑出SOTA，抱抱脸：快逃，合成数据不是未来

LLM数学性能暴涨168%，微软14人团队力作！合成数据2.0秘诀曝光，智能体生成教学

大模型终端部署新趋势：硬件直接支持混合矩阵乘法

Beidi Chen陈贝迪独家 | 高效长序列生成之路：CPU & GPU —— 算法、系统与硬件的 co-design