AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
用神经架构搜索给LLM瘦身,模型变小,准确度有时反而更高

用神经架构搜索给LLM瘦身,模型变小,准确度有时反而更高

用神经架构搜索给LLM瘦身,模型变小,准确度有时反而更高

大型语言模型(LLM)的一个主要特点是「大」,也因此其训练和部署成本都相当高,如何在保证 LLM 准确度的同时让其变小就成了非常重要且有价值的研究课题。

来自主题: AI技术研报
8993 点击    2024-06-11 10:06
CVPR 2024|让图像扩散模型生成高质量360度场景,只需要一个语言模型

CVPR 2024|让图像扩散模型生成高质量360度场景,只需要一个语言模型

CVPR 2024|让图像扩散模型生成高质量360度场景,只需要一个语言模型

360 度场景生成是计算机视觉的重要任务,主流方法主要可分为两类,一类利用图像扩散模型分别生成 360 度场景的多个视角。由于图像扩散模型缺乏场景全局结构的先验知识,这类方法无法有效生成多样的 360 度视角,导致场景内主要的目标被多次重复生成,如图 1 的床和雕塑。

来自主题: AI技术研报
8977 点击    2024-06-11 10:02
i人小助手:Meta推出多模态对话图,帮你轻松识别社交状态

i人小助手:Meta推出多模态对话图,帮你轻松识别社交状态

i人小助手:Meta推出多模态对话图,帮你轻松识别社交状态

近年来兴起的第一人称视角视频研究为理解人类社交行为提供了无法取代的直观视角,然而,绝大多数的既往工作都侧重于分析与摄像机佩戴者相关的行为,并未关注处于社交场景中其他社交对象的状态。

来自主题: AI技术研报
8612 点击    2024-06-10 15:02
偏微分方程有了基础模型:样本需求数量级减少,14项任务表现最佳

偏微分方程有了基础模型:样本需求数量级减少,14项任务表现最佳

偏微分方程有了基础模型:样本需求数量级减少,14项任务表现最佳

偏微分方程(PDEs)被称为物理学的语言,因为它们可以在广泛的时间 - 空间尺度上对各种各样的物理现象进行数学建模。常用的有限差分、有限元等数值方法通常用于近似或模拟偏微分方程。

来自主题: AI技术研报
8687 点击    2024-06-10 14:59
谷歌开源TimesFM:1000亿个时间点训练,入选ICML 2024

谷歌开源TimesFM:1000亿个时间点训练,入选ICML 2024

谷歌开源TimesFM:1000亿个时间点训练,入选ICML 2024

在大语言模型突飞猛进的同时,谷歌的研究团队在时序预测方面也取得了突破性的成果——今年2月发表的模型TimesFM,而且放出了模型的代码和权重,让更多开发者体验这种「开箱即用」的零样本预测能力。

来自主题: AI资讯
8933 点击    2024-06-10 14:40
「汪汪」to Vector!密歇根博士生用AI解码狗的声音 | LREC 2024

「汪汪」to Vector!密歇根博士生用AI解码狗的声音 | LREC 2024

「汪汪」to Vector!密歇根博士生用AI解码狗的声音 | LREC 2024

近日,来自密歇根大学的研究人员,开发了一款人工智能工具,可以区分不同含义的狗叫声,并识别狗的年龄、性别和品种。

来自主题: AI资讯
8676 点击    2024-06-10 14:35
FineWeb技术报告出炉!揭秘HuggingFace规模最大、质量最高预训练数据集

FineWeb技术报告出炉!揭秘HuggingFace规模最大、质量最高预训练数据集

FineWeb技术报告出炉!揭秘HuggingFace规模最大、质量最高预训练数据集

从大规模网络爬取、精细过滤到去重技术,通过FineWeb的技术报告探索如何打造高质量数据集,为大型语言模型(LLM)预训练提供更优质的性能。

来自主题: AI资讯
9216 点击    2024-06-09 18:06