AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型
Mamba一作预告新架构!长文论述Transformer≠最终解法

Mamba一作预告新架构!长文论述Transformer≠最终解法

Mamba一作预告新架构!长文论述Transformer≠最终解法

Mamba一作最新大发长文! 主题只有一个,即探讨两种主流序列模型——状态空间模型(SSMs)和Transformer模型的权衡之术。

来自主题: AI技术研报
5853 点击    2025-07-10 10:56
ICCV 2025 | UniOcc: 自动驾驶占用预测与推理统一数据集及基准平台

ICCV 2025 | UniOcc: 自动驾驶占用预测与推理统一数据集及基准平台

ICCV 2025 | UniOcc: 自动驾驶占用预测与推理统一数据集及基准平台

来自加州大学河滨分校(UC Riverside)、密歇根大学(University of Michigan)、威斯康星大学麦迪逊分校(University of Wisconsin–Madison)、德州农工大学(Texas A&M University)的团队在 ICCV 2025 发表首个面向自动驾驶语义占用栅格构造或预测任务的统一基准框架 UniOcc。

来自主题: AI技术研报
7282 点击    2025-07-10 10:39
如何教AI学会反思?

如何教AI学会反思?

如何教AI学会反思?

论文提出一种AI自我反思方法:通过反思错误原因、重试任务、奖励成功反思来优化训练。

来自主题: AI技术研报
8254 点击    2025-07-10 10:34
华为盘古之殇最新进展:华为吹哨人再发讨贼檄文

华为盘古之殇最新进展:华为吹哨人再发讨贼檄文

华为盘古之殇最新进展:华为吹哨人再发讨贼檄文

我们先给不知道剧情的朋友回归一下事件事件线:2025年6月30日,华为宣布开源盘古7B稠密和72B混合专家模型。然而发布会后,网络上出现华为盘古大模型抄袭的言论。7月5日,诺亚方舟实验室发布《关于盘古大模型开源代码相关讨论的声明》。本以为官方已经出来站台,这件事到此为止。

来自主题: AI资讯
9982 点击    2025-07-10 09:21
昆仑万维开源最强多模态推理模型!性能逼近人类专家,还超了OpenAI、Anthropic

昆仑万维开源最强多模态推理模型!性能逼近人类专家,还超了OpenAI、Anthropic

昆仑万维开源最强多模态推理模型!性能逼近人类专家,还超了OpenAI、Anthropic

今日,昆仑万维重磅开源多模态推理模型Skywork-R1V 3.0,这是其迄今最强多模态推理模型,参数规模为38B,在多个多模态推理基准测试中取得了开源最佳(SOTA)性能。

来自主题: AI资讯
8959 点击    2025-07-09 21:42
2025上半年大模型使用量观察:Gemini系列占一半市场份额,DeepSeek V3用户留存极高

2025上半年大模型使用量观察:Gemini系列占一半市场份额,DeepSeek V3用户留存极高

2025上半年大模型使用量观察:Gemini系列占一半市场份额,DeepSeek V3用户留存极高

2025 年已经过半, 文本生成大模型是否已经进入下半场了? OpenAI 完全不重视 API 市场? Grok3 根本没人用? 「大模型战」未来的走向如何?

来自主题: AI资讯
7655 点击    2025-07-09 15:30
破解「个性化学习」长尾难题,巧用神经坍缩理论 | ICML 2025

破解「个性化学习」长尾难题,巧用神经坍缩理论 | ICML 2025

破解「个性化学习」长尾难题,巧用神经坍缩理论 | ICML 2025

NCAL是一种新的个性化学习方法,它通过优化文本嵌入的分布来解决教育数据中常见的长尾分布问题,从而提高模型对少数类别的处理能力。

来自主题: AI技术研报
8366 点击    2025-07-09 15:00
大模型刷数学题竟有害?CMU评估20+模型指出训练陷阱

大模型刷数学题竟有害?CMU评估20+模型指出训练陷阱

大模型刷数学题竟有害?CMU评估20+模型指出训练陷阱

学好数理化,走遍天下都不怕! 这一点这在大语言模型身上也不例外。

来自主题: AI技术研报
7223 点击    2025-07-09 14:54