AI资讯新闻榜单内容搜索-模型

速递｜Buildots完成4500万美元D轮融资，用AI模型+计算机视觉破解建筑业“信息脱节”难题

在建筑行业中，管理人员很容易与现场实际情况脱节。他们需要同时处理多项任务，包括掌握成本动态、与所有利益相关方沟通，以及评估与承包商账单和绩效等方面相关的风险。

来自主题: AI资讯

9179 点击 2025-05-30 20:11

AI生图大洗牌！流匹配架构颠覆传统，一个模型同时接受文本和图像输入

AI生图新突破！一个模型同时接受文本和图像输入。

来自主题: AI资讯

11305 点击 2025-05-30 19:57

实测！可灵AI季度收入1.5亿，最新版本正式发布：物理真实感大幅提升

提质不加价，可灵新版视频生成模型正式登场！新版本依然是一石激起千层浪，不到24小时就有超过72万次阅读。我们也带来了新鲜实测！

来自主题: AI资讯

11531 点击 2025-05-30 17:43

全面评估多模态模型视频OCR能力，Gemini 准确率仅73.7%

多模态大模型（MLLM）在静态图像上已经展现出卓越的 OCR 能力，能准确识别和理解图像中的文字内容。MME-VideoOCR 致力于系统评估并推动MLLM在视频OCR中的感知、理解和推理能力。

来自主题: AI技术研报

8863 点击 2025-05-30 17:30

机器狗能当羽毛球搭子了！仅靠强化学习从0自学，还涌现出类人回位行为 | Science子刊

来和机器狗一起运动不？你的羽毛球搭子来了！无需人工协助，仅靠强化学习，机器狗子就学会了羽毛球哐哐对打。基于强化学习，研究人员开发了机器狗的全身视觉运动控制策略，同步控制腿部（18个自由度）移动，和手臂挥拍动作。

来自主题: AI技术研报

10535 点击 2025-05-30 17:08

全球首个AI智能体「自进化」开源框架来了！一次部署，终生可用

多AI智能体系统的复杂构建与优化，长期以来是用智能体解决科研问题和场景落地的瓶颈。来自英国格拉斯哥大学的研究团队发布了全球首个AI智能体自进化开源框架EvoAgentX，通过引入自我进化机制，打破了传统多智能体系统在构建和优化中的限制！

来自主题: AI技术研报

9775 点击 2025-05-30 16:57

让AI学着“看菜下碟”！港中大等新框架让推理长度减少90%，准确率反增17%

人类在面对简单提问时常常不假思索直接回答，只有遇到复杂难题才会认真推理。

来自主题: AI技术研报

8999 点击 2025-05-30 16:05

首次揭秘：Cursor技术团队内部深度分析如何训练出超越人类的编程AI agent

Cursor放出了一个接近1小时的内部团队讨论视频，深度分析了他们用到的技术和思考，使得我们有机会深入了解了 Cursor 团队内部关于训练超人级编程模型的讨论，他们的观点让我重新思考了 AI 辅助编程的未来。这些来自一线研究者和工程师的见解，揭示了当前 AI 编程领域最前沿的挑战和突破方向。

来自主题: AI资讯

8924 点击 2025-05-30 15:09

大模型智能体如何突破规模化应用瓶颈，核心在于Agentic ROI

上海交通大学联合中科大在本文中指出：现阶段大模型智能体的主要障碍不在于模型能力不足，而在于其「Agentic ROI」尚未达到实用化门槛。研究团队提出 Agentic ROI（Agentic Return on Investment）这一核心指标，用于衡量一个大模型智能体在真实使用场景中所带来的「信息收益」与其「使用成本」之间的比值：

来自主题: AI技术研报

8898 点击 2025-05-30 15:06

见证历史！DeepSeek跃居全球第二AI实验室，R1登顶开源王座，R2全网催更

昨晚，终于等到了DeepSeek-R1-0528官宣。升级后的模型性能直逼o3和Gemini 2.5 Pro。如今，DeepSeek真正坐实了全球开源王者的称号，并成为了第二大AI实验室。

来自主题: AI资讯

11136 点击 2025-05-30 13:08