AI资讯新闻榜单内容搜索-开源模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 开源模型
开源15T tokens!HuggingFace放出规模最大、质量最高预训练数据集

开源15T tokens!HuggingFace放出规模最大、质量最高预训练数据集

开源15T tokens!HuggingFace放出规模最大、质量最高预训练数据集

Meta最近开源的Llama 3模型再次证明了「数据」是提升性能的关键,但现状是,开源的大模型有一堆,可开源的大规模数据却没多少,而收集、清洗数据又是一项极其费时费力的工作,也导致了大模型预训练技术仍然掌握在少数高端机构的手中。

来自主题: AI技术研报
6144 点击    2024-05-05 19:51
Llama 3细节公布!AI产品总监站台讲解:Llama系列超庞大生态系统

Llama 3细节公布!AI产品总监站台讲解:Llama系列超庞大生态系统

Llama 3细节公布!AI产品总监站台讲解:Llama系列超庞大生态系统

Llama 3的开源,再次掀起了一场大模型的热战,各家争相测评、对比模型的能力,也有团队在进行微调,开发衍生模型。

来自主题: AI技术研报
5283 点击    2024-05-01 20:59
「用 AI 训 AI」这事靠谱吗?

「用 AI 训 AI」这事靠谱吗?

「用 AI 训 AI」这事靠谱吗?

在大语言模型领域,微调是改进模型的重要步骤。伴随开源模型数量日益增多,针对LLM的微调方法同样在推陈出新。

来自主题: AI技术研报
9846 点击    2024-05-01 19:31
仅需Llama3 1/17的训练成本,Snowflake开源128x3B MoE模型

仅需Llama3 1/17的训练成本,Snowflake开源128x3B MoE模型

仅需Llama3 1/17的训练成本,Snowflake开源128x3B MoE模型

Snowflake 发布高「企业智能」模型 Arctic,专注于企业内部应用。

来自主题: AI技术研报
8434 点击    2024-04-25 19:28
本周(4.15-4.21)AI界发生了什么?

本周(4.15-4.21)AI界发生了什么?

本周(4.15-4.21)AI界发生了什么?

李彦宏说开源模型将越来越落后,然后Llama 3发布了。

来自主题: AI资讯
9928 点击    2024-04-24 10:31
发布几小时,微软秒删媲美GPT-4开源大模型!竟因忘记投毒测试

发布几小时,微软秒删媲美GPT-4开源大模型!竟因忘记投毒测试

发布几小时,微软秒删媲美GPT-4开源大模型!竟因忘记投毒测试

上周,微软空降了一个堪称GPT-4级别的开源模型WizardLM-2。 却没想到发布几小时之后,立马被删除了。

来自主题: AI资讯
8140 点击    2024-04-23 14:51
国内百模谁第一?清华14大LLM最新评测报告出炉,GLM-4、文心4.0站在第一梯队

国内百模谁第一?清华14大LLM最新评测报告出炉,GLM-4、文心4.0站在第一梯队

国内百模谁第一?清华14大LLM最新评测报告出炉,GLM-4、文心4.0站在第一梯队

在2023年的「百模大战」中,众多实践者推出了各类模型,这些模型有的是原创的,有的是针对开源模型进行微调的;有些是通用的,有些则是行业特定的。如何能合理地评价这些模型的能力,成为关键问题

来自主题: AI资讯
6858 点击    2024-04-19 21:21