AI资讯新闻榜单内容搜索-预训练

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 预训练

NeurIPS 2024｜SparseLLM：突破性全局剪枝技术，大语言模型稀疏化革命

NeurIPS 2024｜SparseLLM：突破性全局剪枝技术，大语言模型稀疏化革命

NeurIPS 2024｜SparseLLM：突破性全局剪枝技术，大语言模型稀疏化革命

该研究主要探讨了大语言模型的全局剪枝方法，旨在提高预训练语言模型的效率。该成果的发表为大模型的剪枝与优化研究提供了新的视角，并在相关领域具有重要的应用潜力。

来自主题: AI技术研报

6325 点击 2024-10-10 17:17

综合RLHF、DPO、KTO优势，统一对齐框架UNA来了

综合RLHF、DPO、KTO优势，统一对齐框架UNA来了

综合RLHF、DPO、KTO优势，统一对齐框架UNA来了

随着大规模语言模型的快速发展，如 GPT、Claude 等，LLM 通过预训练海量的文本数据展现了惊人的语言生成能力。然而，即便如此，LLM 仍然存在生成不当或偏离预期的结果。这种现象在推理过程中尤为突出，常常导致不准确、不符合语境或不合伦理的回答。为了解决这一问题，学术界和工业界提出了一系列对齐（Alignment）技术，旨在优化模型的输出，使其更加符合人类的价值观和期望。

来自主题: AI技术研报

9917 点击 2024-10-10 12:21

何恺明新作出炉！异构预训练Transformer颠覆本体视觉学习范式，AI性能暴涨超20%

何恺明新作出炉！异构预训练Transformer颠覆本体视觉学习范式，AI性能暴涨超20%

何恺明新作出炉！异构预训练Transformer颠覆本体视觉学习范式，AI性能暴涨超20%

通用机器人模型，目前最大的障碍便是「异构性」。

来自主题: AI资讯

6026 点击 2024-10-06 16:26

迈向多语言医疗大模型：大规模预训练语料、开源模型与全面基准测试

迈向多语言医疗大模型：大规模预训练语料、开源模型与全面基准测试

迈向多语言医疗大模型：大规模预训练语料、开源模型与全面基准测试

在医疗领域中，大语言模型已经有了广泛的研究。然而，这些进展主要依赖于英语的基座模型，并受制于缺乏多语言医疗专业数据的限制，导致当前的医疗大模型在处理非英语问题时效果不佳。

来自主题: AI技术研报

9990 点击 2024-09-29 22:38

预训练的 Scaling Law 正在走入死胡同，o1 让更多创业公司重新复活

预训练的 Scaling Law 正在走入死胡同，o1 让更多创业公司重新复活

预训练的 Scaling Law 正在走入死胡同，o1 让更多创业公司重新复活

GPT-4o 读万卷书，「o1」行万里路。

来自主题: AI资讯

7281 点击 2024-09-24 09:49

类人神经网络再进一步！DeepMind最新50页论文提出AligNet框架：用层次化视觉概念「对齐」人类

类人神经网络再进一步！DeepMind最新50页论文提出AligNet框架：用层次化视觉概念「对齐」人类

类人神经网络再进一步！DeepMind最新50页论文提出AligNet框架：用层次化视觉概念「对齐」人类

DeepMind最近的研究提出了一种新框架AligNet，通过模拟人类判断来训练教师模型，并将类人结构迁移到预训练的视觉基础模型中，从而提高模型在多种任务上的表现，增强了模型的泛化性和鲁棒性，为实现更类人的人工智能系统铺平了道路。

来自主题: AI技术研报

11469 点击 2024-09-22 15:00

突破传统：AI如何应对心电图中的长尾挑战？

突破传统：AI如何应对心电图中的长尾挑战？

突破传统：AI如何应对心电图中的长尾挑战？

近日，上海交通大学、上海人工智能实验室和上海交通大学附属瑞金医院联合团队发布基于异常检测预训练的心电长尾诊断模型。

来自主题: AI技术研报

8691 点击 2024-09-07 17:35

2024年中国AI基础数据服务研究报告

2024年中国AI基础数据服务研究报告

2024年中国AI基础数据服务研究报告

近年来，Transformer等预训练大模型在语言理解及生成等领域表现出色，大模型背后的Scaling Law（规模定律）进一步揭示了模型性能与数据量、算力之间的关系，强化了数据在提升AI表现中的关键作用。

来自主题: AI资讯

7517 点击 2024-09-03 10:04

MoE再下一城！港大提出AnyGraph：首次开启「图大模型」Scaling Law之路

MoE再下一城！港大提出AnyGraph：首次开启「图大模型」Scaling Law之路

MoE再下一城！港大提出AnyGraph：首次开启「图大模型」Scaling Law之路

AnyGraph聚焦于解决图数据的核心难题，跨越多种场景、特征和数据集进行预训练。其采用混合专家模型和特征统一方法处理结构和特征异质性，通过轻量化路由机制和高效设计提升快速适应能力，且在泛化能力上符合Scaling Law。

来自主题: AI技术研报

10063 点击 2024-09-02 16:35

从头设计抗体，腾讯、北大团队预训练大语言模型登Nature子刊

从头设计抗体，腾讯、北大团队预训练大语言模型登Nature子刊

从头设计抗体，腾讯、北大团队预训练大语言模型登Nature子刊

AI 技术在辅助抗体设计方面取得了巨大进步。然而，抗体设计仍然严重依赖于从血清中分离抗原特异性抗体，这是一个资源密集且耗时的过程。

来自主题: AI资讯

9078 点击 2024-08-18 17:31

上一页当前第17页,共22页下一页