AI资讯新闻榜单内容搜索-大模型

苹果开源7B大模型，训练过程数据集一口气全给了，网友：开放得不像苹果

苹果最新杀入开源大模型战场，而且比其他公司更开放。推出7B模型，不仅效果与Llama 3 8B相当，而且一次性开源了全部训练过程和资源。大模型，AI，苹果AI，苹果开源模型

来自主题: AI资讯

8418 点击 2024-07-23 00:14

挑战Scaling Law，Meta发布移动端350M小模型MobileLLM，性能比肩7B LLaMA-v2

Scaling Law还没走到尽头，「小模型」逐渐成为科技巨头们的追赶趋势。Meta最近发布的MobileLLM系列，规模甚至降低到了1B以下，两个版本分别只有125M和350M参数，但却实现了比更大规模模型更优的性能。

来自主题: AI技术研报

10508 点击 2024-07-22 15:25

奥运史上AI首秀！谷歌Gemini将亮相巴黎，打造AI观赛新体验

巴黎奥运会期间，谷歌将首次携NBCUniversal，利用Gemini让AI技术走进赛场，为观众带来前所未有的观赛体验。

来自主题: AI资讯

11815 点击 2024-07-22 15:16

大模型时代结束？大佬齐预测：AI模型或需先缩小规模，才能再次扩大规模

小模型强势来袭，「大模型时代」或将落幕？

来自主题: AI资讯

8839 点击 2024-07-22 15:04

ECCV 2024 | 提升GPT-4V、Gemini检测任务性能，你需要这种提示范式

多模态大模型（Multimodal Large Language Models，MLLMs）在不同的任务中表现出了令人印象深刻的能力，尽管如此，这些模型在检测任务中的潜力仍被低估。

来自主题: AI技术研报

11274 点击 2024-07-22 14:58

中科大联合华为诺亚提出Entropy Law，揭秘大模型性能、数据压缩率以及训练损失关系

数据是大语言模型（LLMs）成功的基石，但并非所有数据都有益于模型学习。

来自主题: AI技术研报

10211 点击 2024-07-22 14:55

5年160亿估值，硅谷“企业AI”领头羊怎么做到的？

大模型引发的AI大战持续了两年多之后，现在所有创业团队和投资人都在问的一个问题是——适用于大模型真正的场景有哪些？或者，更重要的是，到底怎么才能获得货真价实的客户和营收？

来自主题: AI资讯

11055 点击 2024-07-22 14:45

不是，我就好奇，为啥 AI 公司都要用「星星」符号？

整得跟共济会似的。

来自主题: AI资讯

6091 点击 2024-07-22 10:38

ECCV 2024 | 让GPT-4图像理解更易出错，全新策略增强VLP模型对抗迁移性

针对视觉-语言预训练（Vision-Language Pretraining, VLP）模型的对抗攻击，现有的研究往往仅关注对抗轨迹中对抗样本周围的多样性，但这些对抗样本高度依赖于代理模型生成，存在代理模型过拟合的风险。

来自主题: AI技术研报

10533 点击 2024-07-21 17:12

ICML 2024 Oral | DPO是否比PPO更适合LLM，清华吴翼团队最新揭秘

如何让大模型更好的遵从人类指令和意图？如何让大模型有更好的推理能力？如何让大模型避免幻觉？能否解决这些问题，是让大模型真正广泛可用，甚至实现超级智能（Super Intelligence）最为关键的技术挑战。这些最困难的挑战也是吴翼团队长期以来的研究重点，大模型对齐技术（Alignment）所要攻克的难题。

来自主题: AI资讯

11656 点击 2024-07-21 17:10