AI资讯新闻榜单内容搜索-模型训练

Llama3-8B秒杀700亿巨兽？北大博士生等全新「BoT」框架推理暴涨70倍，24点图形推理一步成神

24点游戏、几何图形、一步将死问题，这些推理密集型任务，难倒了一片大模型，怎么破？北大、UC伯克利、斯坦福研究者最近提出了一种全新的BoT方法，用思维模板大幅增强了推理性能。而Llama3-8B在BoT的加持下，竟多次超越Llama3-70B！

来自主题: AI技术研报

8940 点击 2024-06-08 20:15

量化大模型退化严重？ETH北航字节推出LoRA新范式 | ICML 2024

大模型应用开卷，连一向保守的苹果，都已释放出发展端侧大模型的信号。

来自主题: AI技术研报

9688 点击 2024-06-08 16:13

轻松构建聊天机器人、准确性新SOTA，RAG有了更强大的AI检索器

检索增强生成 (RAG) 是将检索模型与生成模型结合起来，以提高生成内容的质量和相关性的一种有效的方法。RAG 的核心思想是利用大量文档或知识库来获取相关信息。各种工具支持 RAG，包括 Langchain 和 LlamaIndex。

来自主题: AI技术研报

9900 点击 2024-06-08 15:45

ACL 2024 | 让纯LLM实现类人的符号逻辑推理能力，开源框架SymbCoT来了

不使用外部工具也能让大语言模型（LLMs）实现严谨可信的推理，新国立提出 SymbCoT 推理框架：结合符号化逻辑（Symbolic Logical）表达式与思维链，极大提升推理质量，鲁棒性与可信度。

来自主题: AI技术研报

9406 点击 2024-06-07 14:39

ICML 2024 Oral｜外部引导的深度聚类新范式

怎样才能将可爱又迷人的柯基与柴犬的图像进行区分？

来自主题: AI技术研报

8520 点击 2024-06-07 10:56

这个团队做了OpenAI没Open的技术，开源OpenRLHF让对齐大模型超简单

随着大型语言模型（LLM）规模不断增大，其性能也在不断提升。尽管如此，LLM 依然面临着一个关键难题：与人类的价值和意图对齐。在解决这一难题方面，一种强大的技术是根据人类反馈的强化学习（RLHF）。

来自主题: AI技术研报

9591 点击 2024-06-07 10:36

首次证实白盒Transformer可扩展性！马毅教授CRATE-α：鲸吞14亿数据，性能稳步提升

CRATE-α是一种新型Transformer架构变体，通过设计改进提升了模型的可扩展性、性能和可解释性，CRATE-α-Base在ImageNet分类任务上的性能显著超过了之前最好的CRATE-B模型，其性能会随着模型和数据集规模扩大而继续提升。

来自主题: AI技术研报

8916 点击 2024-06-06 15:48

天大、南大发布LPSNet：无透镜成像下的人体三维姿态与形状估计 | CVPR 2024

天津大学与南京大学联合团队在CVPR 2024上发表了LPSNet项目，提出了一种端到端的无透镜成像下的3D人体姿态和形状估计框架，通过多尺度无透镜特征解码器和双头辅助监督机制，直接从编码后的无透镜成像数据中提取特征并提高姿态估计的准确度。

来自主题: AI技术研报

8873 点击 2024-06-06 11:29

KAN会引起大模型的范式转变吗？

本文介绍了KAN网络算法的原理和优势，探讨了其在深度学习领域可能引发的范式转变。 • ⚡ KAN网络将可学习的激活函数从神经元移到了神经网络的边上，表现出更高的准确性和更少的参数量 • ???? KAN在数学和物理领域的实验中展现了卓越性能，提供了一种新的科学发现的路径 • ???? KAN具有更快的神经缩放定律和可解释性，为AI领域带来了新的探索可能性

来自主题: AI技术研报

9462 点击 2024-06-05 23:28

CLIP当RNN用入选CVPR：无需训练即可分割无数概念｜牛津大学&谷歌研究院

循环调用CLIP，无需额外训练就有效分割无数概念。包括电影动漫人物，地标，品牌，和普通类别在内的任意短语。

来自主题: AI技术研报

8809 点击 2024-06-05 23:22