AI资讯新闻榜单内容搜索-模型

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 模型

AI竟会看Prompt下菜！Vibe coding普通人vs程序员，剑桥最新报告

AI竟会看Prompt下菜！Vibe coding普通人vs程序员，剑桥最新报告

AI竟会看Prompt下菜！Vibe coding普通人vs程序员，剑桥最新报告

您有没有发现一个奇怪的现象：同样是Vibe coding，有些人轻松拿到完整的Flask应用，有些人却只得到几行if-else语句？剑桥大学计算机科学与技术系的研究者们最近发布了一项研究，用科学的方法证实了我们的直觉——AI确实会"看人下菜碟"。

来自主题: AI技术研报

9057 点击 2025-06-17 10:08

从"工具人"到"数字队友"：AI协作革命的最后一公里

从"工具人"到"数字队友"：AI协作革命的最后一公里

从"工具人"到"数字队友"：AI协作革命的最后一公里

从数字工具到数字队友的进化之路神译局是36氪旗下编译团队，关注科技、商业、职场、生活等领域，重点介绍国外的新技术、新观点、新风向。

来自主题: AI资讯

9838 点击 2025-06-17 10:05

搜索智能体RAG落地不佳？UIUC开源s3，仅需2.4k样本，训练快效果好

搜索智能体RAG落地不佳？UIUC开源s3，仅需2.4k样本，训练快效果好

搜索智能体RAG落地不佳？UIUC开源s3，仅需2.4k样本，训练快效果好

当前，Agentic RAG（Retrieval-Augmented Generation）正逐步成为大型语言模型访问外部知识的关键路径。但在真实实践中，搜索智能体的强化学习训练并未展现出预期的稳定优势。一方面，部分方法优化的目标与真实下游需求存在偏离，另一方面，搜索器与生成器间的耦合也影响了泛化与部署效率。

来自主题: AI技术研报

8972 点击 2025-06-17 09:46

o3-pro通关“推箱子”，人类怀旧小游戏成了大模型新Benchmark

o3-pro通关“推箱子”，人类怀旧小游戏成了大模型新Benchmark

o3-pro通关“推箱子”，人类怀旧小游戏成了大模型新Benchmark

推箱子、俄罗斯方块……这些人类的经典怀旧小游戏，也成大模型benchmark了。 o3-pro刚刚也挑战了这两款游戏，而且表现还都不错，直接突破了benchmark上限

来自主题: AI技术研报

10722 点击 2025-06-16 17:26

仅凭一篇博客，他成功入职OpenAI！核心技术或用于GPT-5训练

仅凭一篇博客，他成功入职OpenAI！核心技术或用于GPT-5训练

仅凭一篇博客，他成功入职OpenAI！核心技术或用于GPT-5训练

未中顶会，没有发表arXiv，一篇博客却成为OpenAI速通票。天才科学家Keller Jordan仅凭Muon优化器博客加入OpenAI。甚至，它可能被用于训练下一代超级模型GPT-5。

来自主题: AI资讯

9423 点击 2025-06-16 17:22

高考数学斩获139分！小米7B模型比肩Qwen3-235B、OpenAI o3

高考数学斩获139分！小米7B模型比肩Qwen3-235B、OpenAI o3

高考数学斩获139分！小米7B模型比肩Qwen3-235B、OpenAI o3

上上周的 2025 高考已经落下了帷幕！在人工智能领域，各家大模型向数学卷发起了挑战。

来自主题: AI技术研报

10525 点击 2025-06-16 17:04

网页智能体新突破！引入协同进化世界模型，腾讯AI Lab提出新框架

网页智能体新突破！引入协同进化世界模型，腾讯AI Lab提出新框架

网页智能体新突破！引入协同进化世界模型，腾讯AI Lab提出新框架

让网页智能体自演进突破性能天花板！

来自主题: AI技术研报

7225 点击 2025-06-16 16:58

CVPR史上首次！中国车厂主讲AI大模型，自动驾驶也玩Scaling Law?

CVPR史上首次！中国车厂主讲AI大模型，自动驾驶也玩Scaling Law?

CVPR史上首次！中国车厂主讲AI大模型，自动驾驶也玩Scaling Law?

不去今年的CVPR不知道，原来中国自动驾驶在AI领域的创新已经这么牛了。作为今年唯一受邀参与CVPR演讲的车企，这家公司在AI顶流圈层上桌吃饭了！

来自主题: AI资讯

10444 点击 2025-06-16 16:52

CVPR 2025 Highlight | 国科大等新方法破译多模态「黑箱」，精准揪出犯错元凶

CVPR 2025 Highlight | 国科大等新方法破译多模态「黑箱」，精准揪出犯错元凶

CVPR 2025 Highlight | 国科大等新方法破译多模态「黑箱」，精准揪出犯错元凶

AI 决策的可靠性与安全性是其实际部署的核心挑战。当前智能体广泛依赖复杂的机器学习模型进行决策，但由于模型缺乏透明性，其决策过程往往难以被理解与验证，尤其在关键场景中，错误决策可能带来严重后果。因此，提升模型的可解释性成为迫切需求。

来自主题: AI技术研报

9540 点击 2025-06-16 16:31

10% KV Cache实现无损数学推理！这个开源方法解决推理大模型「记忆过载」难题

10% KV Cache实现无损数学推理！这个开源方法解决推理大模型「记忆过载」难题

10% KV Cache实现无损数学推理！这个开源方法解决推理大模型「记忆过载」难题

推理大模型虽好，但一个简单的算数问题能推理整整三页，还都是重复的“废话”，找不到重点……

来自主题: AI技术研报

8527 点击 2025-06-16 15:50

上一页当前第380页,共1062页下一页