AI资讯新闻榜单内容搜索-开源模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 开源模型
开源模型进展盘点:最新Mixtral、Llama 3、Phi-3、OpenELM到底有多好?

开源模型进展盘点:最新Mixtral、Llama 3、Phi-3、OpenELM到底有多好?

开源模型进展盘点:最新Mixtral、Llama 3、Phi-3、OpenELM到底有多好?

深度学习领域知名研究者、Lightning AI 的首席人工智能教育者 Sebastian Raschka 对 AI 大模型有着深刻的洞察,也会经常把一些观察的结果写成博客。在一篇 5 月中发布的博客中,他盘点分析了 4 月份发布的四个主要新模型:Mixtral、Meta AI 的 Llama 3、微软的 Phi-3 和苹果的 OpenELM。

来自主题: AI技术研报
8934 点击    2024-06-02 14:42
全面超越DPO:陈丹琦团队提出简单偏好优化SimPO,还炼出最强8B开源模型

全面超越DPO:陈丹琦团队提出简单偏好优化SimPO,还炼出最强8B开源模型

全面超越DPO:陈丹琦团队提出简单偏好优化SimPO,还炼出最强8B开源模型

为了将大型语言模型(LLM)与人类的价值和意图对齐,学习人类反馈至关重要,这能确保它们是有用的、诚实的和无害的。在对齐 LLM 方面,一种有效的方法是根据人类反馈的强化学习(RLHF)。尽管经典 RLHF 方法的结果很出色,但其多阶段的过程依然带来了一些优化难题,其中涉及到训练一个奖励模型,然后优化一个策略模型来最大化该奖励。

来自主题: AI技术研报
9710 点击    2024-05-26 13:45
“国外一开源,国内就创新”!面对中美大模型差异,我们该突破还是继续模仿?

“国外一开源,国内就创新”!面对中美大模型差异,我们该突破还是继续模仿?

“国外一开源,国内就创新”!面对中美大模型差异,我们该突破还是继续模仿?

本文基于数势科技创始人&CEO黎科峰博士,百川智能联合创始人焦可,腾讯研究院副院长刘琼,蓝驰创投投资合伙人、TGO鲲鹏会学员石建平以及实在智能联合创始人、CMO张俊九等五位行业大咖在InfoQ主办的QCon全球软件开发大会的圆桌讨论整理。

来自主题: AI技术研报
8584 点击    2024-05-13 09:43
“美国最该尴尬的,是今天中国开源模型们重大的贡献”

“美国最该尴尬的,是今天中国开源模型们重大的贡献”

“美国最该尴尬的,是今天中国开源模型们重大的贡献”

最近在许多美国开发者的口中,一个开源模型经常被提及,它的发音听起来是“困”。乍一听到总让人一头雾水。哪个开发者天天用中文说困啊。

来自主题: AI资讯
6208 点击    2024-05-11 16:33
AI创业现在需要的是哪一类人?

AI创业现在需要的是哪一类人?

AI创业现在需要的是哪一类人?

AI创业现在需要的是哪一类人?黄云刚就AI技术开放的门槛、创业者的技术要求和市场趋势进行了深入的探讨。“大模型的开源和Database时代的开源不是一个概念。”源码资本管理合伙人黄云刚说。

来自主题: AI资讯
2850 点击    2024-05-09 10:37
开源15T tokens!HuggingFace放出规模最大、质量最高预训练数据集

开源15T tokens!HuggingFace放出规模最大、质量最高预训练数据集

开源15T tokens!HuggingFace放出规模最大、质量最高预训练数据集

Meta最近开源的Llama 3模型再次证明了「数据」是提升性能的关键,但现状是,开源的大模型有一堆,可开源的大规模数据却没多少,而收集、清洗数据又是一项极其费时费力的工作,也导致了大模型预训练技术仍然掌握在少数高端机构的手中。

来自主题: AI技术研报
5161 点击    2024-05-05 19:51
Llama 3细节公布!AI产品总监站台讲解:Llama系列超庞大生态系统

Llama 3细节公布!AI产品总监站台讲解:Llama系列超庞大生态系统

Llama 3细节公布!AI产品总监站台讲解:Llama系列超庞大生态系统

Llama 3的开源,再次掀起了一场大模型的热战,各家争相测评、对比模型的能力,也有团队在进行微调,开发衍生模型。

来自主题: AI技术研报
4204 点击    2024-05-01 20:59
「用 AI 训 AI」这事靠谱吗?

「用 AI 训 AI」这事靠谱吗?

「用 AI 训 AI」这事靠谱吗?

在大语言模型领域,微调是改进模型的重要步骤。伴随开源模型数量日益增多,针对LLM的微调方法同样在推陈出新。

来自主题: AI技术研报
9118 点击    2024-05-01 19:31