AI资讯新闻榜单内容搜索-开源模型

这才是真・开源模型！公开「后训练」一切，性能超越Llama 3.1 Instruct

开源模型阵营又迎来一员猛将：Tülu 3。它来自艾伦人工智能研究所（Ai2），目前包含 8B 和 70B 两个版本（未来还会有 405B 版本），并且其性能超过了 Llama 3.1 Instruct 的相应版本！长达 73 的技术报告详细介绍了后训练的细节。

来自主题: AI技术研报

11298 点击 2024-11-23 16:04

北大等发布多模态版o1！首个慢思考VLM将开源，视觉推理超越闭源模型

北大等出品，首个多模态版o1开源模型来了—— 代号LLaVA-o1，基于Llama-3.2-Vision模型打造，超越传统思维链提示，实现自主“慢思考”推理。在多模态推理基准测试中，LLaVA-o1超越其基础模型8.9%，并在性能上超越了一众开闭源模型。

来自主题: AI技术研报

6215 点击 2024-11-19 21:01

集成500+多模态现实任务！全新MEGA-Bench评测套件：CoT对开源模型反而有害？

MEGA-Bench是一个包含500多个真实世界任务的多模态评测套件，为全面评估AI模型提供了高效工具。研究人员发现，尽管顶级AI模型在多个任务中表现出色，但在复杂推理和跨模态理解方面仍有提升空间。

来自主题: AI技术研报

7517 点击 2024-11-15 15:37

AI视频中看不用？百度不做视频模型的原因很简单

自打ChatGPT让人工智能这个概念迎来第二春，百度创始人李彦宏也重新活跃了起来，成为了几乎是最爱发声的互联网大佬。在此前先后发表AI终结程序员、开源模型会越来越落后等言论之后，有消息称在最近举行的百度2024年第三季度总监会上他又放话，“百度不碰Sora类的视频生成。”

来自主题: AI资讯

4118 点击 2024-11-06 14:45

对标Hugging Face？GitHub Models新增OpenAI o1/Llama 3.2等，新功能支持模型并排比较

北京时间 10 月 30 日，GitHub Universe 2024 如约而至，而今年正值大会十周年纪念日。本文将从 GitHub 发布的 AI 新进展入手，围绕开源模型、用户数量、盈利模式、发展历程等几个方面，全面梳理 GitHub 与 Hugging Face 两大开源平台的异同。

来自主题: AI资讯

4855 点击 2024-10-30 09:28

开源模型突破原生多模态大模型性能瓶颈，上海AI Lab代季峰团队出品

原生多模态大模型性能瓶颈，迎来新突破！上海AI Lab代季峰老师团队，提出了全新的原生多模态大模型Mono-InternVL。与非原生模型相比，该模型首个单词延迟最多降低67%，在多个评测数据集上均达到了SOTA水准。

来自主题: AI技术研报

5043 点击 2024-10-25 15:37

苹果一篇论文得罪大模型圈？Transformer不会推理，只是高级模式匹配器！所有LLM都判死刑

苹果研究者发现：无论是OpenAI GPT-4o和o1，还是Llama、Phi、Gemma和Mistral等开源模型，都未被发现任何形式推理的证据，而更像是复杂的模式匹配器。无独有偶，一项多位数乘法的研究也被抛出来，越来越多的证据证实：LLM不会推理！

来自主题: AI技术研报

4405 点击 2024-10-19 16:32

迈向多语言医疗大模型：大规模预训练语料、开源模型与全面基准测试

在医疗领域中，大语言模型已经有了广泛的研究。然而，这些进展主要依赖于英语的基座模型，并受制于缺乏多语言医疗专业数据的限制，导致当前的医疗大模型在处理非英语问题时效果不佳。

来自主题: AI技术研报

8860 点击 2024-09-29 22:38

Llama系列上新多模态！3.2版本开源超闭源，还和Arm联手搞了手机优化版

在多模态领域，开源模型也超闭源了！

来自主题: AI资讯

6961 点击 2024-09-27 11:51

英伟达开源NVLM 1.0屠榜多模态！纯文本性能不降反升

NVLM 1.0系列多模态大型语言模型在视觉语言任务上达到了与GPT-4o和其他开源模型相媲美的水平，其在纯文本性能甚至超过了LLM骨干模型，特别是在文本数学和编码基准测试中，平均准确率提高了4.3个百分点。

来自主题: AI技术研报

8685 点击 2024-09-24 12:27

AI资讯新闻榜单内容搜索-开源模型

这才是真・开源模型！公开「后训练」一切，性能超越Llama 3.1 Instruct

北大等发布多模态版o1！首个慢思考VLM将开源，视觉推理超越闭源模型

集成500+多模态现实任务！全新MEGA-Bench评测套件：CoT对开源模型反而有害？

AI视频中看不用？百度不做视频模型的原因很简单

对标Hugging Face？GitHub Models新增OpenAI o1/Llama 3.2等， 新功能支持模型并排比较

开源模型突破原生多模态大模型性能瓶颈，上海AI Lab代季峰团队出品

苹果一篇论文得罪大模型圈？Transformer不会推理，只是高级模式匹配器！所有LLM都判死刑

迈向多语言医疗大模型：大规模预训练语料、开源模型与全面基准测试

Llama系列上新多模态！3.2版本开源超闭源，还和Arm联手搞了手机优化版

英伟达开源NVLM 1.0屠榜多模态！纯文本性能不降反升

对标Hugging Face？GitHub Models新增OpenAI o1/Llama 3.2等，新功能支持模型并排比较