AI资讯新闻榜单内容搜索-模型

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 模型

ICML 2024 Oral | DPO是否比PPO更适合LLM，清华吴翼团队最新揭秘

ICML 2024 Oral | DPO是否比PPO更适合LLM，清华吴翼团队最新揭秘

ICML 2024 Oral | DPO是否比PPO更适合LLM，清华吴翼团队最新揭秘

如何让大模型更好的遵从人类指令和意图？如何让大模型有更好的推理能力？如何让大模型避免幻觉？能否解决这些问题，是让大模型真正广泛可用，甚至实现超级智能（Super Intelligence）最为关键的技术挑战。这些最困难的挑战也是吴翼团队长期以来的研究重点，大模型对齐技术（Alignment）所要攻克的难题。

来自主题: AI资讯

12453 点击 2024-07-21 17:10

高于临床测试3倍准确率！剑桥大学开发AI模型，提前6年预测阿尔茨海默症

高于临床测试3倍准确率！剑桥大学开发AI模型，提前6年预测阿尔茨海默症

高于临床测试3倍准确率！剑桥大学开发AI模型，提前6年预测阿尔茨海默症

剑桥大学研究利用人工智能建立机器学习模型精准预测阿尔茨海默症发展，准确率远超临床测试结果，为阿尔兹海默症早期干预开辟新路径。

来自主题: AI资讯

11475 点击 2024-07-21 17:01

前谷歌科学家Yi Tay「LLM演义」系列博客第一弹：BERT为何匿迹江湖？

前谷歌科学家Yi Tay「LLM演义」系列博客第一弹：BERT为何匿迹江湖？

前谷歌科学家Yi Tay「LLM演义」系列博客第一弹：BERT为何匿迹江湖？

前谷歌科学家Yi Tay重磅推出「LLM时代的模型架构」系列博客，首篇博文的话题关于：基于encoder-only架构的BERT是如何被基于encoder-decoder架构的T5所取代的，分析了BERT灭绝的始末以及不同架构模型的优缺点，以史为鉴，对于未来的创新具有重要意义。

来自主题: AI技术研报

11447 点击 2024-07-21 16:58

斯坦福博士图解AlphaFold 3：超多细节+可视化还原ML工程师眼中的AF3

斯坦福博士图解AlphaFold 3：超多细节+可视化还原ML工程师眼中的AF3

斯坦福博士图解AlphaFold 3：超多细节+可视化还原ML工程师眼中的AF3

AlphaFold 3的论文太晦涩？没关系，斯坦福大学的两位博士生「图解」AlphaFold 3 ，将模型架构可视化，同时不遗漏任何一个细节。

来自主题: AI技术研报

10807 点击 2024-07-21 16:53

OpenAI掀小模型血战！苹果DCLM强势登场，碾压Mistral 7B全开源

OpenAI掀小模型血战！苹果DCLM强势登场，碾压Mistral 7B全开源

OpenAI掀小模型血战！苹果DCLM强势登场，碾压Mistral 7B全开源

小模型时代来了？OpenAI带着GPT-4o mini首次入局小模型战场，Mistral AI、HuggingFace本周接连发布了小模型。如今，苹果也发布了70亿参数小模型DCLM，性能碾压Mistral-7B。

来自主题: AI技术研报

10756 点击 2024-07-21 16:46

KDD 2024｜港大黄超团队深度解析大模型在图机器学习领域的「未知边界」

KDD 2024｜港大黄超团队深度解析大模型在图机器学习领域的「未知边界」

KDD 2024｜港大黄超团队深度解析大模型在图机器学习领域的「未知边界」

在信息爆炸的当今时代，我们如何从浩如烟海的数据中探寻深层次的联系呢？

来自主题: AI技术研报

11193 点击 2024-07-21 14:21

权重、代码、数据集全开源，性能超越Mistral-7B，苹果小模型来了

权重、代码、数据集全开源，性能超越Mistral-7B，苹果小模型来了

权重、代码、数据集全开源，性能超越Mistral-7B，苹果小模型来了

小模型成趋势？

来自主题: AI技术研报

11701 点击 2024-07-21 14:19

专访诺奖得主：大模型是记忆还是理解？

专访诺奖得主：大模型是记忆还是理解？

专访诺奖得主：大模型是记忆还是理解？

机器之心独家专访 2011 年诺贝尔经济学奖得主托马斯·萨金特教授

来自主题: AI资讯

9865 点击 2024-07-21 14:13

使用视觉语言模型进行 PDF 检索 [译]

使用视觉语言模型进行 PDF 检索 [译]

使用视觉语言模型进行 PDF 检索 [译]

近年来，随着大语言模型 (LLM) 的发展，构建检索增强生成 (RAG) 解决方案成为了一个热门话题。RAG 将 LLM 的强大功能与检索模型结合，应用于专有知识数据库。然而，对于开发人员来说，一个主要挑战是将各种文档格式（如 PDF、HTML 等）转换为可供文本模型处理的格式。

来自主题: AI技术研报

10976 点击 2024-07-21 14:12

LoRA综述来了! 浙大《大语言模型的LoRA研究》综述

LoRA综述来了! 浙大《大语言模型的LoRA研究》综述

LoRA综述来了! 浙大《大语言模型的LoRA研究》综述

低秩适应（Low-Rank Adaptation，LoRA）通过可插拔的低秩矩阵更新密集神经网络层，是当前参数高效微调范式中表现最佳的方法之一。此外，它在跨任务泛化和隐私保护方面具有显著优势。

来自主题: AI技术研报

12793 点击 2024-07-21 14:02

上一页当前第884页,共1150页下一页