AI资讯新闻榜单内容搜索-LLM

医疗AI迎来大考！南洋理工发布首个LLM电子病历处理评测 | AAAI'26

南洋理工大学研究人员构建了EHRStruct基准，用于评测LLM处理结构化电子病历的能力。该基准涵盖11项核心任务，包含2200个样本，按临床场景、认知层级和功能类别组织。研究发现通用大模型优于医学专用模型，数据驱动任务表现更强，输入格式和微调方式对性能有显著影响。

来自主题: AI技术研报

10311 点击 2025-12-16 16:27

AI模型价格下降1000倍，为什么我们支出的成本没有随之降低？

2025年12月12日，波士顿大学的 Andrey Fradkin 团队发布了一项令业界瞩目的研究《The Emerging Market for Intelligence: Pricing, Supply, and Demand for LLMs》（智能的新兴市场：LLM的定价、供给与需求）。

来自主题: AI技术研报

8583 点击 2025-12-16 09:58

AAAI 2026｜视频大语言模型到底可不可信？23款主流模型全面测评来了

近年来，视频大语言模型在理解动态视觉信息方面展现出强大能力，成为处理真实世界多模态数据的重要基础模型。然而，它们在真实性、安全性、公平性、鲁棒性和隐私保护等方面仍面临严峻挑战。

来自主题: AI技术研报

6248 点击 2025-12-16 09:19

高精度知识库≠Milvus+llm！这份PaddleOCR+混合检索+Rerank技巧请收好

在大型语言模型（LLM）的应用落地中，RAG（检索增强生成）是解决模型幻觉和知识时效性的关键技术。

来自主题: AI技术研报

10008 点击 2025-12-16 09:18

AAAI 2026 Oral | 拒绝「一刀切」！AdaMCoT：让大模型学会「看题下菜碟」，动态选择最佳思考语言

多语言大模型（MLLM）在面对多语言任务时，往往面临一个选择难题：是用原来的语言直接回答，还是翻译成高资源语言去推理？

来自主题: AI技术研报

10167 点击 2025-12-15 09:53

告别「盲目自信」，CCD：扩散语言模型推理新SOTA

扩散语言模型（Diffusion Language Models）以其独特的 “全局规划” 与并行解码能力广为人知，成为 LLM 领域的全新范式之一。然而在 Any-order 解码模式下，其通常面临

来自主题: AI技术研报

7669 点击 2025-12-13 10:59

a16z 提出 AI 产品的「水晶鞋效应」：第一批用户反而是最忠诚的

前几天，AI 推理服务供应商 OpenRouter 发布了一份报告《State of AI》，基于平台上 60 多家提供商的 300 多个模型，100 万亿个 token 的交互数据，对 LLM 的实际应用情况进行了分析。报告中，提到了一个「灰姑娘水晶鞋效应」，特别有意思。研究者在分析用户留用数据时发现一个现象：AI 模型发布第一个月进来的用户，往往比后来进来的用户留存率更高。

来自主题: AI技术研报

7994 点击 2025-12-12 16:15

全球首个太空AI诞生，H100在轨炼出！马斯克爆赞

见证历史！今天，首个由H100太空GPU训出LLM诞生了，它基于Karpathy nano-GPT训练。不仅如此，谷歌Gemma也在太空成功运行，向世界发出首句问候：地球人，你好。

来自主题: AI资讯

9965 点击 2025-12-11 16:27

Khosla 继 OpenAI 后的最大赌注，General Intuition 凭 38 亿个游戏高光片段做世界模型

今年 10 月，专注构建世界模型的 General Intuition 完成了高达 1.34 亿美元的种子轮融资。这笔融资由硅谷传奇投资人 Vinod Khosla 领投，这是他自 2019 年首次投资 OpenAI 以来开出的最大单笔种子轮投资，也标志着他在 LLM 之后对下一代智能范式做出的一次重大下注。

来自主题: AI资讯

9281 点击 2025-12-11 10:59

扩散语言模型推理太慢？北大团队提出ODB-dLLM框架，破解计算访存双重瓶颈

基于扩散的大语言模型 (dLLM) 凭借全局解码和双向注意力机制解锁了原生的并行解码和受控生成的潜力，最近吸引了广泛的关注。例如 Fast-dLLM 的现有推理框架通过分块半自回归解码进一步实现了 dLLM 对 KV cache 的支持，挑战了传统自回归 LLMs 的统治地位。

来自主题: AI技术研报

6394 点击 2025-12-11 10:42