AI资讯新闻榜单内容搜索-开源模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 开源模型
国产模型,打平了Claude Fable 5!已上线OpenRouter

国产模型,打平了Claude Fable 5!已上线OpenRouter

国产模型,打平了Claude Fable 5!已上线OpenRouter

OpenRouter 上线了一个叫 Fusion 的新功能,把同一道题丢给一组模型,再让一个裁判模型把答案揉成一份。结果是,几个便宜的开源模型组起团来,能直接打平 Fable 5,价格只有其一半。

来自主题: AI资讯
9247 点击    2026-06-15 15:13
一夜反转!「杀进第一梯队」的巴西LLM竟「套壳缝合」了国产模型

一夜反转!「杀进第一梯队」的巴西LLM竟「套壳缝合」了国产模型

一夜反转!「杀进第一梯队」的巴西LLM竟「套壳缝合」了国产模型

昨天,AI 圈大都被这一新闻「刷屏」:巴西里约热内卢市政府旗下的一家 IT 公司,平地一声雷地推出一款名为「Rio 3.5」397B 的开源模型,甚至还一路逆袭杀进了全球第一梯队,超越 Qwen 3.7 Plus 等开源模型,在多项基准测试中斩获 SOTA 性能。

来自主题: AI技术研报
6433 点击    2026-06-15 14:50
AI圈懵了:一家巴西市政IT公司开源大模型Rio 3.5 397B杀进了全球第一梯队

AI圈懵了:一家巴西市政IT公司开源大模型Rio 3.5 397B杀进了全球第一梯队

AI圈懵了:一家巴西市政IT公司开源大模型Rio 3.5 397B杀进了全球第一梯队

今天,除了全球(非美)被禁的 Claude Fable 5,AI 社区还被一个开源模型刷屏了。有推特博主发现,一个由巴西里约热内卢市政府旗下 IT 公司开源的模型 Rio 3.5 397B,在多项基准测试中超越了 Qwen 3.7 Plus 等开源模型,而这个模型的基础模型还是 Qwen3.5-397B-A17B。

来自主题: AI资讯
9812 点击    2026-06-14 16:05
速递|致开发者:GLM-5.2全量开放,前沿智能属于所有人

速递|致开发者:GLM-5.2全量开放,前沿智能属于所有人

速递|致开发者:GLM-5.2全量开放,前沿智能属于所有人

GLM-5.2 是智谱迄今能力最强的开源模型,支持真正可用的 1M 上下文,并在长程任务中继续保持领先。它也依旧是我们心中最强的国产 Coding 模型。

来自主题: AI资讯
7954 点击    2026-06-13 20:15
谷歌Gemma4-12B怎么用最好?16G显存轻薄本也能跑起本地多模态SubAgent

谷歌Gemma4-12B怎么用最好?16G显存轻薄本也能跑起本地多模态SubAgent

谷歌Gemma4-12B怎么用最好?16G显存轻薄本也能跑起本地多模态SubAgent

过去一年,开源模型的发布节奏已经快到让人麻木。每次发布,伴随的永远是一组跑分、一张能力雷达图,以及几个“超越某某”的结论。

来自主题: AI技术研报
8106 点击    2026-06-11 10:18
刚刚,Mind Lab开源V1系列模型Preview,749B参数,专为Agent 后训练

刚刚,Mind Lab开源V1系列模型Preview,749B参数,专为Agent 后训练

刚刚,Mind Lab开源V1系列模型Preview,749B参数,专为Agent 后训练

过去一个多月,大模型圈依旧热闹。从 GPT-5.5、DeepSeek V4 到 Claude Opus 4.8,后训练正在成为模型能力提升的关键引擎。

来自主题: AI技术研报
5910 点击    2026-06-08 15:29
AI最大的瓶颈是工程师?Anthropic联创:向AI巨头征税!一年内将出现同等能力的开源模型!硅谷大佬陷入“安全套娃”?

AI最大的瓶颈是工程师?Anthropic联创:向AI巨头征税!一年内将出现同等能力的开源模型!硅谷大佬陷入“安全套娃”?

AI最大的瓶颈是工程师?Anthropic联创:向AI巨头征税!一年内将出现同等能力的开源模型!硅谷大佬陷入“安全套娃”?

“我无法将 AI 的能力与一成不变的经济模式调和!”

来自主题: AI资讯
7602 点击    2026-06-03 09:26
阶跃发布Step 3.7 Flash:一款为「烧钱时代」准备的Agent模型

阶跃发布Step 3.7 Flash:一款为「烧钱时代」准备的Agent模型

阶跃发布Step 3.7 Flash:一款为「烧钱时代」准备的Agent模型

继 Step 3.5 Flash 后,阶跃星辰最近又推出新一代高效率 Flash 开源模型 ——Step 3.7 Flash。该模型最大特点就是多(模)、快(速)、好(用)、省(钱)。总参数 196B,采用稀疏 MoE 架构,推理激活参数仅 11B,配备 1.88B ViT 视觉编码器,推理速度最高 400 TPS,支持 256K 上下文。

来自主题: AI资讯
9328 点击    2026-05-29 17:06
一张4090就能爆改!面壁智能MiniCPM-V 4.6开源,1B多模态卷出新高度

一张4090就能爆改!面壁智能MiniCPM-V 4.6开源,1B多模态卷出新高度

一张4090就能爆改!面壁智能MiniCPM-V 4.6开源,1B多模态卷出新高度

面壁智能正式发布并开源了 MiniCPM-V 系列新一代基础模型——MiniCPM-V 4.6。这款模型的整体参数规模仅约 1B(1.3B),是该系列有史以来参数规模最小的一款。但在多模态综合能力上,它却成功超越了被视为标杆的阿里 Qwen3.5-0.8B 和谷歌 Gemma 4 E2B-it,做到了「尺寸更小、效率更高、性能更好」。

来自主题: AI资讯
9013 点击    2026-05-13 11:57
token级,精准控制生成长度:3B模型击败GPT 5.4、Claude

token级,精准控制生成长度:3B模型击败GPT 5.4、Claude

token级,精准控制生成长度:3B模型击败GPT 5.4、Claude

LenVM将长度建模提升到token级别,开辟可扩展价值预训练的新维度——3B开源模型精确长度控制全面击败GPT-5.4、Claude-Opus-4-6等顶级闭源模型;相同token预算下推理准确率提升10倍(63% vs 6%);沿模型规模、数据量、采样数三轴无饱和scaling的value pretraining

来自主题: AI技术研报
5879 点击    2026-05-08 14:06