AI资讯新闻榜单内容搜索-RAG

LLM进入「拖拽时代」！只靠Prompt，几秒定制一个大模型，效率飙升12000倍

最近，来自NUS、UT Austin等机构的研究人员创新性地提出了一种「拖拽式大语言模型」（DnD），它可以基于提示词快速生成模型参数，无需微调就能适应任务。不仅效率最高提升12000倍，而且具备出色的零样本泛化能力。

来自主题: AI技术研报

7387 点击 2025-06-24 14:26

舍弃CUDA编程！CMU等用几十行代码将LLM编译成巨型内核，推理延迟可降6.7倍

在 AI 领域，英伟达开发的 CUDA 是驱动大语言模型（LLM）训练和推理的核心计算引擎。

来自主题: AI资讯

6348 点击 2025-06-22 12:07

只改2行代码，RAG效率暴涨30%！多种任务适用，可扩展至百亿级数据规模应用

只需修改两行代码，RAG向量检索效率暴涨30%！

来自主题: AI技术研报

5476 点击 2025-06-21 17:48

深度｜吴恩达：语音是一种更自然、更轻量的输入方式，尤其适合Agentic应用；未来最关键的技能，是能准确告诉计算机你想要什么

我们常把LangGraph、RAG、memory、evals等工具比作乐高积木，经验丰富的人知道如何搭配使用，就能迅速解决问题

来自主题: AI资讯

6498 点击 2025-06-17 10:24

搜索智能体RAG落地不佳？UIUC开源s3，仅需2.4k样本，训练快效果好

当前，Agentic RAG（Retrieval-Augmented Generation）正逐步成为大型语言模型访问外部知识的关键路径。但在真实实践中，搜索智能体的强化学习训练并未展现出预期的稳定优势。一方面，部分方法优化的目标与真实下游需求存在偏离，另一方面，搜索器与生成器间的耦合也影响了泛化与部署效率。

来自主题: AI技术研报

6609 点击 2025-06-17 09:46