AI资讯新闻榜单内容搜索-LLMs

无直接数据可用，AI怎么学会「干活」？微软团队揭秘AI从语言到行动的进化之路

该技术报告的主要作者 Lu Wang, Fangkai Yang, Chaoyun Zhang, Shilin He, Pu Zhao, Si Qin 等均来自 Data, Knowledge, and Intelligence (DKI) 团队，为微软 TaskWeaver, WizardLLM, Windows GUI Agent UFO 的核心开发者。

来自主题: AI技术研报

8391 点击 2025-01-21 22:16

「完美的搜索引擎」是否存在？这家公司向谷歌发起挑战

大型语言模型（LLMs）能够解决研究生水平的数学问题，但今天的搜索引擎却无法准确理解一个简单的三词短语。

来自主题: AI资讯

7990 点击 2025-01-18 15:04

如何高效桥接视觉和语言，字节&中大提出全新多模态大模型连接器ParGo

在多模态大语言模型（MLLMs）的发展中，视觉 - 语言连接器作为将视觉特征映射到 LLM 语言空间的关键组件，起到了桥梁作用。

来自主题: AI技术研报

8447 点击 2025-01-12 10:22

RAG作为AI大模型应用落地的必需品，Html RAG、Multimodal RAG 和 Agentic RAG的区别是啥？

检索-增强生成 (RAG) 是一个永不过时的话题，并在不断扩展以增强LLMs 的功能。对于那些不太熟悉RAG 的人来说：这种方法利用外部知识来增强模型的能力，从外部资源中检索您实际需要的信息。

来自主题: AI技术研报

7763 点击 2025-01-10 11:01

DeepMind重磅，用PC-SUBQ提示策略让LLM从相关性推断因果关系

在人工智能领域，大语言模型（LLMs）展现出了令人惊叹的能力，但在因果推理这一人类智能的核心能力上仍面临重大挑战。特别是在从相关性信息推断因果关系这一任务上，现有的大语言模型表现出明显的不足。

来自主题: AI技术研报

4820 点击 2025-01-06 13:39

小身板大能量：树莓派玩转 Phi-2、Mistral 和 LLaVA 等AI大模型~

你是否想过在自己的设备上运行自己的大型语言模型（LLMs）或视觉语言模型（VLMs）？你可能有过这样的想法，但是一想到要从头开始设置、管理环境、下载正确的模型权重，以及你的设备是否能处理这些模型的不确定性，你可能就犹豫了。

来自主题: AI技术研报

10708 点击 2024-12-30 16:53

Deepmind 重磅开源：消除幻觉，让 LLMs 学会规则库和多步推理

大模型的的发布固然令人欣喜，但是各类测评也是忙坏了众多 AI 工作者。大模型推理的幻觉问题向来是 AI 测评的重灾区，诸如 9.9>9.11 的经典幻觉问题，各大厂家恨不得直接把问题用 if-else 写进来。

来自主题: AI技术研报

9412 点击 2024-12-30 10:39

中国信通院联合淘天集团发布全球首个中文安全领域事实性基准评测集，仅三个大模型达及格线

在当今迅速发展的人工智能时代，大语言模型（LLMs）在各种应用中发挥着至关重要的作用。然而，随着其应用的广泛化，模型的安全性问题也引起了广泛关注。

来自主题: AI资讯

10099 点击 2024-12-27 10:08

2025 AI Agent剑指何方？两份前沿报告描绘全景地图

2024年，AI Agent称得上最火热的概念。一方面，大模型赛道降温，并呈现出赢家通吃的局面；另一方面，AI Agent则是大模型应用落地的最佳形式，其能够解决LLMs在具体应用场景中的局限性。

来自主题: AI技术研报

9237 点击 2024-12-26 09:15

哪家AI能成卧底之王？淘天技术团队发布多智能体博弈游戏平台WiS

近年来，基于大型语言模型（LLMs）的多智能体系统（MAS）已成为人工智能领域的研究热点。

来自主题: AI技术研报

8155 点击 2024-12-25 14:06