AI资讯新闻榜单内容搜索-训练

一群年轻人，正在训练AI宠物的灵魂

人需要的不是功能，而是情感连接。

来自主题: AI资讯

10337 点击 2025-12-03 11:33

句子级溯源+生成式归因，C²-Cite重塑大模型可信度

在人工智能快速发展的今天,大语言模型已经深入到我们工作和生活的方方面面。然而,如何让AI生成的内容更加可信、可追溯, 一直是学术界和工业界关注的焦点问题。想象一下,当你向ChatGPT提问时,它不仅给出答案,还能像学术论文一样标注每句话的信息来源——这就是"溯源大语言模型"要解决的核心问题。

来自主题: AI技术研报

6634 点击 2025-12-03 10:44

Struct Array 如何让多向量检索返回完整实体？知识库、电商、视频通用|Milvus Week

本文为Milvus Week系列第二篇，该系列旨在分享Zilliz、Milvus在系统性能、索引算法和云原生架构上的创新与实践，以下是DAY2内容划重点： Struct Array + MAX_SIM ，能够让数据库看懂 “多向量组成一个实体” 的逻辑，进而原生返回业务要的完整结果

来自主题: AI技术研报

10046 点击 2025-12-03 10:43

迎接「万物皆可RAG」时代：最新综述展示50多种多模态组合的巨大待探索空间

大模型最广泛的应用如 ChatGPT、Deepseek、千问、豆包、Gemini 等通常会连接互联网进行检索增强生成（RAG）来产生用户问题的答案。随着多模态大模型（MLLMs）的崛起，大模型的主流技术之一 RAG 迅速向多模态发展，形成多模态检索增强生成（MM-RAG）这个新兴领域。ChatGPT、千问、豆包、Gemini 都开始允许用户提供文字、图片等多种模态的输入。

来自主题: AI技术研报

7526 点击 2025-12-03 09:54

解读CUDA

“既然我可以直接使用 PyTorch，为什么还要费心使用 CUDA 呢?”

来自主题: AI技术研报

10140 点击 2025-12-03 09:51

奥特曼怕了！GPT-5.5「大蒜」决战谷歌，红色警报紧急拉响

三年河东三年河西，曾经逼疯谷歌的奥特曼，如今也被谷歌逼得拉响了「红色警报」，AI王座之下已是刀光剑影。更劲爆的是，最强「Garlic」在预训练取得重大突破，正面硬刚Gemini 3.

来自主题: AI资讯

7988 点击 2025-12-03 09:48

世界模型和具身大脑最新突破：90%生成数据，VLA性能暴涨300%｜开源

VLA模型性能暴涨300%，背后训练数据还首次实现90%由世界模型生成。

来自主题: AI技术研报

9693 点击 2025-12-02 17:02

无需标注图像，VLM也能「自我进化」！RL自我进化框架VisPlay突破视觉推理难题

在 Vision-Language Model 领域，提升其复杂推理能力通常依赖于耗费巨大的人工标注数据或启发式奖励。这不仅成本高昂，且难以规模化。

来自主题: AI技术研报

9766 点击 2025-12-02 15:22

全面战胜ReAct！斯坦福全新智能体推理框架，性能提升112.5%

斯坦福和MIT的研究团队推出了一种新的AI智能体推理框架ReCAP，在长上下文任务中全面超越了现有的主流框架ReAct，性能提升显著。ReCAP通过独特的递归树结构和三大机制，解决了大语言模型在复杂任务中常见的目标漂移、上下文断层和成本爆炸等问题。

来自主题: AI技术研报

10711 点击 2025-12-02 15:20

架构解耦是统一多模态模型所必须的吗？全新AIA损失：No

近一年以来，统一理解与生成模型发展十分迅速，该任务的主要挑战在于视觉理解和生成任务本身在网络层间会产生冲突。早期的完全统一模型（如 Emu3）与单任务的方法差距巨大，Janus-Pro、BAGEL 通过一步一步解耦模型架构，极大地减小了与单任务模型的性能差距，后续方法甚至通过直接拼接现有理解和生成模型以达到极致的性能。

来自主题: AI技术研报

9085 点击 2025-12-02 15:17