AI资讯新闻榜单内容搜索-GE

AI医疗战火升级！Agent爆发，大三甲争相引入，医疗系统新一轮变革！

2025年，DeepSeek迅速席卷全国医疗行业。

来自主题: AI资讯

8149 点击 2025-05-31 16:28

Perplexity将Agent接入搜索，一个框解决你所有需求，实现了百度16年前的框计算概念？

人工智能搜索引擎Perplexity重磅发布新产品Perplexity Labs，这是一款面向专业版用户（20美金/月）的智能Agent工具，为用户提供了更强大的生产力解决方案。用户可以在搜索框下方一键切换至"实验室模式"，通过该模式可高效生成：专业分析报告、结构化电子表格、交互式网页应用、数据可视化图表等。

来自主题: AI资讯

9786 点击 2025-05-31 16:05

10个小模型并联跑赢GPT-4.1！无额外训练，方法仅4步

近年来，语言模型技术迅速发展，然而代表性成果如Gemini 2.5Pro和GPT-4.1，逐渐被谷歌、OpenAI等科技巨头所垄断。

来自主题: AI技术研报

9190 点击 2025-05-31 15:35

GPT-4o-Image仅完成28.9%任务！上海AI实验室等发布图像编辑新基准，360道人类专家严选难题

GPT-4o-Image也只能完成28.9%的任务，图像编辑评测新基准来了！360个全部由人类专家仔细思考并校对的高质量测试案例，暴露多模态模型在结合推理能力进行图像编辑时的短板。

来自主题: AI技术研报

11185 点击 2025-05-31 14:37

专治AI生图「人脸崩坏」，8倍速碾压GPT！新版FLUX.1多方位刷新SOTA

FLUX.1 Kontext是一款融合即时文本图像编辑与文本到图像生成的新一代模型，支持文本与图像提示，角色一致性强，速度快达GPT-Image-1的8倍。

来自主题: AI资讯

9740 点击 2025-05-31 14:26

字节开源了一个了不得的模型！

字节跳动开源了一个口碑还不错的模型——BAGEL （ByteDance Agnostic Generation and Empathetic Language model）, 一个统一多模态基础模型。啥叫“统一”？一个模型就能同时理解和生成文本、图像、视频！

来自主题: AI资讯

8820 点击 2025-05-31 13:45

全面评估多模态模型视频OCR能力，Gemini 准确率仅73.7%

多模态大模型（MLLM）在静态图像上已经展现出卓越的 OCR 能力，能准确识别和理解图像中的文字内容。MME-VideoOCR 致力于系统评估并推动MLLM在视频OCR中的感知、理解和推理能力。

来自主题: AI技术研报

8949 点击 2025-05-30 17:30

全球首个AI智能体「自进化」开源框架来了！一次部署，终生可用

多AI智能体系统的复杂构建与优化，长期以来是用智能体解决科研问题和场景落地的瓶颈。来自英国格拉斯哥大学的研究团队发布了全球首个AI智能体自进化开源框架EvoAgentX，通过引入自我进化机制，打破了传统多智能体系统在构建和优化中的限制！

来自主题: AI技术研报

9883 点击 2025-05-30 16:57

首次揭秘：Cursor技术团队内部深度分析如何训练出超越人类的编程AI agent

Cursor放出了一个接近1小时的内部团队讨论视频，深度分析了他们用到的技术和思考，使得我们有机会深入了解了 Cursor 团队内部关于训练超人级编程模型的讨论，他们的观点让我重新思考了 AI 辅助编程的未来。这些来自一线研究者和工程师的见解，揭示了当前 AI 编程领域最前沿的挑战和突破方向。

来自主题: AI资讯

8978 点击 2025-05-30 15:09

大模型智能体如何突破规模化应用瓶颈，核心在于Agentic ROI

上海交通大学联合中科大在本文中指出：现阶段大模型智能体的主要障碍不在于模型能力不足，而在于其「Agentic ROI」尚未达到实用化门槛。研究团队提出 Agentic ROI（Agentic Return on Investment）这一核心指标，用于衡量一个大模型智能体在真实使用场景中所带来的「信息收益」与其「使用成本」之间的比值：

来自主题: AI技术研报

8973 点击 2025-05-30 15:06