AI资讯新闻榜单内容搜索-LLM

从RLHF到DPO再到TDPO，大模型对齐算法已经是「token-level」

在人工智能领域的发展过程中，对大语言模型（LLM）的控制与指导始终是核心挑战之一，旨在确保这些模型既强大又安全地服务于人类社会。早期的努力集中于通过人类反馈的强化学习方法（RLHF）来管理这些模型，成效显著，标志着向更加人性化 AI 迈出的关键一步。

来自主题: AI技术研报

6165 点击 2024-06-23 19:39

《Python 机器学习》作者新作：从头开始构建大型语言模型，代码已开源

自 ChatGPT 发布以来，大型语言模型（LLM）已经成为推动人工智能发展的关键技术。

来自主题: AI技术研报

11501 点击 2024-06-22 23:02

墙裂推荐！Karpathy大模型培训课LLM101n上线了，非常基础

让我们训练一个 Storyteller。

来自主题: AI资讯

10512 点击 2024-06-22 22:55

Is Scaling All You Need? LLM收益递减，AI小厂难活命

在GPT-4发布后14.5个月里，LLM领域似乎已经没什么进步了？近日，马库斯的一句话引发了全网论战。大模型烧钱却不赚钱，搞AI的公司表示：难办！

来自主题: AI资讯

7625 点击 2024-06-21 14:14

GPT-4o攻破ARC-AGI无法被挑战的神话！71%准确率成新SOTA

号称不可能轻易被击败的AGI基准ARC-AGI被GPT-4o撼动，GPT-4o以在公共测试集50%、在训练集71%的准确率成为了新的SOTA！

来自主题: AI资讯

8694 点击 2024-06-21 13:59

AI教父Hinton：我支持超级AI取代人类！

「AI教父」Geoffrey Hinton在最近的采访中表达了自己对AI智能的理解——LLM并不是简单的统计模型，已经具备了理解能力。与此同时，网友翻出了去年12月的「过期」视频，惊奇地发现Hinton早就「叛变」了，竟然对超级AI取代人类的未来表示支持。

来自主题: AI资讯

9466 点击 2024-06-20 11:16

商汤披露：50篇论文入选CVPR 2024

CVPR正在进行中，中国科研力量再次成为场内外焦点之一。

来自主题: AI技术研报

11982 点击 2024-06-20 09:58

大模型压缩量化方案怎么选？无问芯穹Qllm-Eval量化方案全面评估：多模型、多参数、多维度

基于 Transformer架构的大型语言模型在各种基准测试中展现出优异性能，但数百亿、千亿乃至万亿量级的参数规模会带来高昂的服务成本。例如GPT-3有1750亿参数，采用FP16存储，模型大小约为350GB，而即使是英伟达最新的B200 GPU 内存也只有192GB ，更不用说其他GPU和边缘设备。

来自主题: AI技术研报

11127 点击 2024-06-19 23:30

清华等高校推出首个开源大模型水印工具包MarkLLM，支持近10种最新水印算法

本⽂介绍由清华等⾼校联合推出的⾸个开源的⼤模型⽔印⼯具包 MarkLLM。MarkLLM 提供了统⼀的⼤模型⽔印算法实现框架、直观的⽔印算法机制可视化⽅案以及系统性的评估模块，旨在⽀持研究⼈员⽅便地实验、理解和评估最新的⽔印技术进展。通过 MarkLLM，作者期望在给研究者提供便利的同时加深公众对⼤模型⽔印技术的认知，推动该领域的共识形成，进⽽促进相关研究的发展和推⼴应⽤。

来自主题: AI技术研报

10100 点击 2024-06-19 23:19

LLM最全「怪癖」首曝光！马里兰OpenAI等30+学者祭出75页提示报告

大语言模型提示中，竟有不少「怪癖」：重复某些内容，准确性就大大提高；人名变匿名，准确性就大大下降。最近，马里兰OpenAI等机构的30多位研究者，首次对LLM的提示技术进行了大规模系统研究，并发布75页详尽报告。

来自主题: AI技术研报

9030 点击 2024-06-17 21:41