AI资讯新闻榜单内容搜索-训练

ICML 2024 Oral｜外部引导的深度聚类新范式

怎样才能将可爱又迷人的柯基与柴犬的图像进行区分？

来自主题: AI技术研报

9397 点击 2024-06-07 10:56

这个团队做了OpenAI没Open的技术，开源OpenRLHF让对齐大模型超简单

随着大型语言模型（LLM）规模不断增大，其性能也在不断提升。尽管如此，LLM 依然面临着一个关键难题：与人类的价值和意图对齐。在解决这一难题方面，一种强大的技术是根据人类反馈的强化学习（RLHF）。

来自主题: AI技术研报

11020 点击 2024-06-07 10:36

首次证实白盒Transformer可扩展性！马毅教授CRATE-α：鲸吞14亿数据，性能稳步提升

CRATE-α是一种新型Transformer架构变体，通过设计改进提升了模型的可扩展性、性能和可解释性，CRATE-α-Base在ImageNet分类任务上的性能显著超过了之前最好的CRATE-B模型，其性能会随着模型和数据集规模扩大而继续提升。

来自主题: AI技术研报

10567 点击 2024-06-06 15:48

天大、南大发布LPSNet：无透镜成像下的人体三维姿态与形状估计 | CVPR 2024

天津大学与南京大学联合团队在CVPR 2024上发表了LPSNet项目，提出了一种端到端的无透镜成像下的3D人体姿态和形状估计框架，通过多尺度无透镜特征解码器和双头辅助监督机制，直接从编码后的无透镜成像数据中提取特征并提高姿态估计的准确度。

来自主题: AI技术研报

9830 点击 2024-06-06 11:29

1毛钱1百万token，写2遍红楼梦！国产大模型下一步还想卷什么？

大模型价格战，这匹国产黑马又破纪录了！最低的GLM-4 Flash版本，百万token价格已经低至0.1元，可以说是击穿地心。MaaS 2.0大升级，让企业训练私有模型的成本无限降低。

来自主题: AI资讯

10800 点击 2024-06-06 11:09

KAN会引起大模型的范式转变吗？

本文介绍了KAN网络算法的原理和优势，探讨了其在深度学习领域可能引发的范式转变。 • ⚡ KAN网络将可学习的激活函数从神经元移到了神经网络的边上，表现出更高的准确性和更少的参数量 • ???? KAN在数学和物理领域的实验中展现了卓越性能，提供了一种新的科学发现的路径 • ???? KAN具有更快的神经缩放定律和可解释性，为AI领域带来了新的探索可能性

来自主题: AI技术研报

11548 点击 2024-06-05 23:28

CLIP当RNN用入选CVPR：无需训练即可分割无数概念｜牛津大学&谷歌研究院

循环调用CLIP，无需额外训练就有效分割无数概念。包括电影动漫人物，地标，品牌，和普通类别在内的任意短语。

来自主题: AI技术研报

10264 点击 2024-06-05 23:22

腾讯混元、北大发现Scaling law「浪涌现象」，解决学习率调参难题

过去十年间，基于随机梯度下降（SGD）的深度学习模型在许多领域都取得了极大的成功。与此同时各式各样的 SGD 替代品也如雨后春笋般涌现。在这些众多替代品中，Adam 及其变种最受追捧。无论是 SGD，还是 Adam，亦或是其他优化器，最核心的超参数非 Learning rate 莫属。因此如何调整好 Leanring rate 是炼丹师们从一开始就必学的技能。

来自主题: AI技术研报

9155 点击 2024-06-05 22:57

硅谷团队抄袭清华系大模型？面壁智能李大海独家回应：套壳现象难规避

抄袭框架和预训练数据的情况，是更狭义的套壳。

来自主题: AI资讯

10783 点击 2024-06-05 09:56

AI训练数据的版权保护:公地的悲剧还是合作的繁荣?

就算是 OpenAI 在舆论场也无法逃过版权保护的呼声。

来自主题: AI技术研报

10017 点击 2024-06-04 18:04