AI资讯新闻榜单内容搜索-大语言模型

提速79%！上交大新方法优化企业级AI流程调度 | IEEE ICDCS’ 25

复合LLM应用 (compound LLM applications) 是一种结合大语言模型（LLM）与外部工具、API、或其他LLM的高效多阶段工作流应用。

来自主题: AI技术研报

9093 点击 2025-07-25 09:51

ICML 2025 | 大模型能在信息不完备的情况下问出正确的问题吗？

大语言模型（Large Language Model, LLM）在复杂推理任务中表现卓越。借助链式思维（Chain-of-Thought, CoT），LLM 能够将复杂问题分解为简单步骤，充分探索解题思路并得出正确答案。LLM 已在多个基准上展现出优异的推理能力，尤其是数学推理和代码生成。

来自主题: AI技术研报

6659 点击 2025-07-24 15:10

四款扩散大语言模型全部破防？上交&上海AI Lab发现致命安全缺陷

扩散语言模型（Diffusion-based LLMs，简称 dLLMs）以其并行解码、双向上下文建模、灵活插入masked token进行解码的特性，成为一个重要的发展方向。

来自主题: AI技术研报

9489 点击 2025-07-23 15:04

ICML2025｜清华医工平台提出大模型「全周期」医学能力评测框架MultiCogEval

大语言模型（Large Language Models，LLMs）技术的迅猛发展，正在深刻重塑医疗行业。医疗领域正成为这一前沿技术的 “新战场” 之一。大模型具备强大的文本理解与生成能力，能够快速读取医学文献、解读病历记录，甚至基于患者表述生成初步诊断建议，有效辅助医生提升诊断的准确性与效率。

来自主题: AI技术研报

7311 点击 2025-07-23 13:25

多模态大模型存在「内心预警」，无需训练，就能识别越狱攻击

多模态大模型崛起，安全问题紧随其后近年来，大语言模型（LLMs）的突破式进展，催生了视觉语言大模型（LVLMs）的快速兴起，代表作如 GPT-4V、LLaVA 等。

来自主题: AI技术研报

10080 点击 2025-07-22 09:55

ACM MM 2025 | EventVAD：7B参数免训练，视频异常检测新SOTA

现有视频异常检测（Video Anomaly Detection, VAD）方法中，有监督方法依赖大量领域内训练数据，对未见过的异常场景泛化能力薄弱；而无需训练的方法虽借助大语言模型（LLMs）的世界知识实现检测，但存在细粒度视觉时序定位不足、事件理解不连贯、模型参数冗余等问题。

来自主题: AI技术研报

7549 点击 2025-07-21 10:28

大模型转行土木工程！首个「打灰人」评估基准：检验读、改工程图纸能力

首个工程自动化任务评估基准DrafterBench，可用于测试大语言模型在土木工程图纸修改任务中的表现。通过模拟真实工程命令，全面考察模型的结构化数据理解、工具调用、指令跟随和批判性推理能力，研究结果发现当前主流大模型虽有一定能力，但整体水平仍不足以满足工程一线需求。

来自主题: AI技术研报

6690 点击 2025-07-18 12:58

00后融资420万美金，用数学天才的方法解决AI最头疼的"找错信息"问题

你有没有发现，即使是最先进的AI系统，在面对复杂问题时仍然会给出令人沮丧的错误答案？问题往往不在于大语言模型本身，而在于它们根本找不到正确的信息。

来自主题: AI资讯

9182 点击 2025-07-17 11:08

首次综述「边-云协同计算」，分布式智能与模型优化的最新进展

边缘-云协同计算通过整合边缘节点和云端资源，解决了传统云计算的延迟和带宽问题，推动了分布式智能和模型优化的发展。最新综述论文系统梳理了ECCC的架构设计、模型优化、资源管理、隐私安全和实际应用，提出了统一的分布式智能与模型优化框架，为未来研究提供了方向，包括大语言模型部署、6G整合和量子计算等前沿技术。

来自主题: AI技术研报

9096 点击 2025-07-15 11:43

智能之镜：NeuroAI如何反映大脑与人工智能的未来

在大语言模型能力如此强大的背景下，AI与神经科学之间的联系变得前所未有地重要，催生了一个新兴领域：NeuroAI。它关注两个角度的问题：

来自主题: AI技术研报

8969 点击 2025-07-15 10:32