AI资讯新闻榜单内容搜索-开源模型

长上下文能力只是吹牛？最强GPT-4o正确率仅55.8%，开源模型不如瞎蒙

当今的LLM已经号称能够支持百万级别的上下文长度，这对于模型的能力来说，意义重大。但近日的两项独立研究表明，它们可能只是在吹牛，LLM实际上并不能理解这么长的内容。

来自主题: AI资讯

5147 点击 2024-07-23 16:10

Llama 3.1磁力链提前泄露！开源模型王座一夜易主，GPT-4o被超越

Llama 3.1又被提前泄露了！开发者社区再次陷入狂欢：最大模型是405B，8B和70B模型也同时升级，模型大小约820GB。基准测试结果惊人，磁力链全网疯转。

来自主题: AI资讯

4111 点击 2024-07-23 15:48

苹果开源7B大模型，训练过程数据集一口气全给了，网友：开放得不像苹果

苹果最新杀入开源大模型战场，而且比其他公司更开放。推出7B模型，不仅效果与Llama 3 8B相当，而且一次性开源了全部训练过程和资源。大模型，AI，苹果AI，苹果开源模型

来自主题: AI资讯

7680 点击 2024-07-23 00:14

权重、代码、数据集全开源，性能超越Mistral-7B，苹果小模型来了

小模型成趋势？

来自主题: AI技术研报

10050 点击 2024-07-21 14:19

假开源真噱头？Meta再陷「开源」争议，LeCun被炮轰Meta只是开放模型

大模型开源的热潮下，隐藏着诸多问题，从定义的模糊到实际开放内容的局限性，Lecun再陷Meta大模型是否真开源的质疑风波只是冰山一角。

来自主题: AI技术研报

8722 点击 2024-07-19 12:34

ACL 2024 | 对25个开闭源模型数学评测，GPT-3.5-Turbo才勉强及格

大型语言模型（LLMs）在解决问题方面的非凡能力日益显现。最近，一个值得关注的现象是，这些模型在多项数学推理的基准测试中获得了惊人的成绩。以 GPT-4 为例，在高难度小学应用题测试集 GSM8K [1] 中表现优异，准确率高达 90% 以上。同时，许多开源模型也展现出了不俗的实力，准确率超过 80%。

来自主题: AI资讯

7530 点击 2024-07-18 16:57