AI资讯新闻榜单内容搜索-大模

谷歌传奇“院士”：Gemini核心秘方不会公开！大模型推理还有很大降本空间！AGI太远，我更喜欢3~5年的研究，登月计划：医疗

“与AGI太过遥远的炒作相比，我非常喜欢这种 3 到 5 年的时间窗口。”“AI 现在最大的问题，已经不是不够聪明，而是太难真正落地。”这些非常务实的观点，并不是出自AI怀疑论者。相反，它出自硅谷圈内那位“工程与学术”的双修神话：

来自主题: AI资讯

9977 点击 2025-12-16 17:18

南洋理工大学研究人员构建了EHRStruct基准，用于评测LLM处理结构化电子病历的能力。该基准涵盖11项核心任务，包含2200个样本，按临床场景、认知层级和功能类别组织。研究发现通用大模型优于医学专用模型，数据驱动任务表现更强，输入格式和微调方式对性能有显著影响。

来自主题: AI技术研报

10665 点击 2025-12-16 16:27

「奔向AGI」栏目聚焦AI大模型、AI agent、AI应用、芯片、机器人等前沿、热门的AI技术和商业创新。作者丨冯汝梅编辑丨关雎人工智能赛道又一个惊人融资事件诞生。 2025年12月8日，由前

来自主题: AI资讯

10116 点击 2025-12-16 11:06

「发现式智能」理念落地，天桥脑科学研究院尖峰智能实验室启航！当马斯克还在开颅切脑，国内这家世界最大私人脑科学研究机构开启「脑机共生」新时代。

来自主题: AI资讯

9271 点击 2025-12-15 16:18

北大团队发布化学大模型基准SUPERChem，这是一个多模态、高难度的化学推理基准。它针对现有化学评测的不足，系统构建了评估大语言模型化学推理能力的新体系。

来自主题: AI技术研报

10054 点击 2025-12-15 15:16

破解AI胡说八道的关键，居然是给大模型砍断99.9%的连接线？

来自主题: AI技术研报

10040 点击 2025-12-15 12:20

6位前DeepMind成员以元系统重塑大模型调用方式，该系统推出的Gemini 3 Pro优化技术在ARC-AGI-2上以54%的成绩夺得榜首，而成本仅为此前最优方法的一半。

来自主题: AI技术研报

8814 点击 2025-12-15 11:31

多语言大模型（MLLM）在面对多语言任务时，往往面临一个选择难题：是用原来的语言直接回答，还是翻译成高资源语言去推理？

来自主题: AI技术研报

10568 点击 2025-12-15 09:53

近日，浙江大学副教授胡星和团队开发出一款名为 CatCoder 的 AI 框架，它能够读懂一个完整的软件项目，生成准确、可用的代码。在 Java 任务上，它在代码编译通过率和测试通过率上，比业内表现突出的代表之一 RepoCoder 最高提升了 14.44% 和 17.35%。

来自主题: AI资讯

8872 点击 2025-12-14 10:50

经常用 AI 的人都知道，大模型在与用户对话前，都会先阅读一段「系统提示词」，这个步骤不会对用户显示，而是模型的自动操作。这些提示词规定了模型的行为准则，很常见，不过在 Claude 的提示词中，竟要求模型参考「欧陆哲学（Continental Philosophy）」。

来自主题: AI资讯

8609 点击 2025-12-14 10:48