AI资讯新闻榜单内容搜索-模型训练

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 模型训练

Transformer终结者！谷歌DeepMind全新MoR架构问世，新一代魔王来了

Transformer终结者！谷歌DeepMind全新MoR架构问世，新一代魔王来了

Transformer终结者！谷歌DeepMind全新MoR架构问世，新一代魔王来了

Transformer杀手来了？KAIST、谷歌DeepMind等机构刚刚发布的MoR架构，推理速度翻倍、内存减半，直接重塑了LLM的性能边界，全面碾压了传统的Transformer。网友们直呼炸裂：又一个改变游戏规则的炸弹来了。

来自主题: AI技术研报

9094 点击 2025-07-17 17:00

全球首个亚洲人脸超大规模数据集发布：让AI终于“认识”亚洲面孔

全球首个亚洲人脸超大规模数据集发布：让AI终于“认识”亚洲面孔

全球首个亚洲人脸超大规模数据集发布：让AI终于“认识”亚洲面孔

近日，ICCV 2025（国际计算机视觉大会）公布论文录用结果，理想汽车共有 8 篇论文入选，其中 3 篇来自基座模型团队。

来自主题: AI技术研报

8569 点击 2025-07-17 12:12

面对无解问题大模型竟会崩溃？港中文&华为联合提出首个大模型推理可靠性评估基准

面对无解问题大模型竟会崩溃？港中文&华为联合提出首个大模型推理可靠性评估基准

面对无解问题大模型竟会崩溃？港中文&华为联合提出首个大模型推理可靠性评估基准

今年初以 DeepSeek-r1 为代表的大模型在推理任务上展现强大的性能，引起广泛的热度。然而在面对一些无法回答或本身无解的问题时，这些模型竟试图去虚构不存在的信息去推理解答，生成了大量的事实错误、无意义思考过程和虚构答案，也被称为模型「幻觉」问题，如下图（a）所示，造成严重资源浪费且会误导用户，严重损害了模型的可靠性（Reliability）。

来自主题: AI技术研报

8534 点击 2025-07-17 11:24

舍弃自回归，离散扩散语言模型如何演化？NUS综述解构技术图谱与应用前沿

舍弃自回归，离散扩散语言模型如何演化？NUS综述解构技术图谱与应用前沿

舍弃自回归，离散扩散语言模型如何演化？NUS综述解构技术图谱与应用前沿

本文主要介绍 xML 团队的论文：Discrete Diffusion in Large Language and Multimodal Models: A Survey。

来自主题: AI技术研报

10581 点击 2025-07-17 10:42

看遍奥斯卡后，VLM达到电影摄影理解新SOTA｜上海AI Lab开源

看遍奥斯卡后，VLM达到电影摄影理解新SOTA｜上海AI Lab开源

看遍奥斯卡后，VLM达到电影摄影理解新SOTA｜上海AI Lab开源

当前最强大的视觉语言模型（VLMs）虽然能“看图识物”，但在理解电影方面还不够“聪明”。

来自主题: AI技术研报

9562 点击 2025-07-17 10:19

7个月翻一番！AI agent能力飙升，METR报告揭示指数级进化规律

7个月翻一番！AI agent能力飙升，METR报告揭示指数级进化规律

7个月翻一番！AI agent能力飙升，METR报告揭示指数级进化规律

Agent能力每7个月翻一番！

来自主题: AI技术研报

8322 点击 2025-07-17 10:14

完全透明开源的共情语音大模型，三阶段训练，四大模块实现端到端对话 | 紫东太初联合长城汽车开源OpenS2S

完全透明开源的共情语音大模型，三阶段训练，四大模块实现端到端对话 | 紫东太初联合长城汽车开源OpenS2S

完全透明开源的共情语音大模型，三阶段训练，四大模块实现端到端对话 | 紫东太初联合长城汽车开源OpenS2S

GPT-4o、Gemini这些顶级语音模型虽然展现了惊人的共情对话能力，但它们的技术体系完全闭源。

来自主题: AI技术研报

8990 点击 2025-07-16 16:30

重塑记忆架构：LLM正在安装「操作系统」

重塑记忆架构：LLM正在安装「操作系统」

重塑记忆架构：LLM正在安装「操作系统」

超长上下文窗口的大模型也会经常「失忆」，「记忆」也是需要管理的。

来自主题: AI技术研报

8819 点击 2025-07-16 16:26

AI圈水太深：OpenAI保密、Meta作弊！国产MoE却异军突起

AI圈水太深：OpenAI保密、Meta作弊！国产MoE却异军突起

AI圈水太深：OpenAI保密、Meta作弊！国产MoE却异军突起

从GPT-2到Llama 4，大模型这几年到底「胖」了多少？从百亿级密集参数到稀疏MoE架构，从闭源霸权到开源反击，Meta、OpenAI、Mistral、DeepSeek……群雄割据，谁能称王？

来自主题: AI技术研报

8382 点击 2025-07-16 16:18

OpenAI谷歌Anthropic罕见联手发研究！Ilya/Hinton/Bengio带头支持，共推CoT监测方案

OpenAI谷歌Anthropic罕见联手发研究！Ilya/Hinton/Bengio带头支持，共推CoT监测方案

OpenAI谷歌Anthropic罕见联手发研究！Ilya/Hinton/Bengio带头支持，共推CoT监测方案

难得难得，几大AI巨头不竞争了不抢人了，改联合一起发研究了。

来自主题: AI技术研报

7755 点击 2025-07-16 15:48

上一页当前第128页,共343页下一页