AI资讯新闻榜单内容搜索-大模型

整合武田等16家药企数据！AI制药平台「首次」商业化，华为、Owkin押注联邦学习！

近日，日本AI制药公司Elix与AI生命科学合作组织Life Intelligence Consortium（简称“LINC”）宣布，在全球首次实现了 AI 药物发现平台的商业化。

来自主题: AI资讯

9291 点击 2025-07-18 13:34

大模型转行土木工程！首个「打灰人」评估基准：检验读、改工程图纸能力

首个工程自动化任务评估基准DrafterBench，可用于测试大语言模型在土木工程图纸修改任务中的表现。通过模拟真实工程命令，全面考察模型的结构化数据理解、工具调用、指令跟随和批判性推理能力，研究结果发现当前主流大模型虽有一定能力，但整体水平仍不足以满足工程一线需求。

来自主题: AI技术研报

7179 点击 2025-07-18 12:58

那些率先实现了 AI 落地的公司，做对了什么？

AI 商业化落地，技术固然重要，生态也举足轻重。

来自主题: AI资讯

8096 点击 2025-07-18 12:21

当 AI 学会“为我代言”：Second Me 如何重新定义数字时代的身份主权

2025 年初，AI 应用领域出现了一个引人注目的转折点 —— 个人 AI 分身从实验室走向大规模应用。与以往的虚拟助手或聊天机器人不同，大家对新一代数字分身的预期是开始承担实质性的社交和工作职能：代替本人参加次要会议、维护社交关系、甚至进行创意协作。

来自主题: AI资讯

7376 点击 2025-07-18 12:10

Contextual AI：从幻觉到可信，钻研RAG架构解决企业级AI应用落地最大痛点

RAG（检索增强生成）作为解决大模型"幻觉"和知识时效性问题的关键技术，已成为企业AI应用的主流架构。Contextual AI由RAG技术的创始研究者组建，致力于开发能应对复杂知识密集型任务的专业智能体。

来自主题: AI资讯

10843 点击 2025-07-17 16:09

面对无解问题大模型竟会崩溃？港中文&华为联合提出首个大模型推理可靠性评估基准

今年初以 DeepSeek-r1 为代表的大模型在推理任务上展现强大的性能，引起广泛的热度。然而在面对一些无法回答或本身无解的问题时，这些模型竟试图去虚构不存在的信息去推理解答，生成了大量的事实错误、无意义思考过程和虚构答案，也被称为模型「幻觉」问题，如下图（a）所示，造成严重资源浪费且会误导用户，严重损害了模型的可靠性（Reliability）。

来自主题: AI技术研报

9545 点击 2025-07-17 11:24