AI资讯新闻榜单内容搜索-Oral

多模态检索新突破，用软标签打破传统刚性映射约束，全面超越CLIP｜AAAI 2026 Oral

基于多模态大模型语义理解能力的统一多模态嵌入模型UniME-V2。该方法首先通过全局检索构建潜在困难负例集，随后创新性地引入“MLLM-as-a-Judge”机制：利用MLLM对查询-候选对进行语义对齐评估，生成软语义匹配分数。

来自主题: AI技术研报

5774 点击 2025-10-06 21:53

NeurIPS 2025 Spotlight | FSDrive统一VLA和世界模型，推动自动驾驶迈向视觉推理

面向自动驾驶的多模态大模型在 “推理链” 上多以文字或符号为中介，易造成空间 - 时间关系模糊与细粒度信息丢失。FSDrive（FutureSightDrive）提出 “时空视觉 CoT”（Spatio-Temporal Chain-of-Thought），让模型直接 “以图思考”，用统一的未来图像帧作为中间推理步骤，联合未来场景与感知结果进行可视化推理。

来自主题: AI技术研报

7964 点击 2025-10-06 13:42

Temporal：Nvidia、OpenAI 都在用，为什么 Agent 还需要专门的长程任务工具？

虽然大家都期待未来的 Agent 能够真正端到端完成所有任务，并且在出错时也知道如何重新开始，但目前 AI 还没有达到这种能力。

来自主题: AI资讯

7518 点击 2025-09-05 11:57

AI让客服效率提升300%，这家公司6天完成种子轮到1年拿下B轮背后的秘密

当大多数人还在抱怨传统工单系统的笨重时，一家叫做 Pylon 的公司却在短短18个月内完成了从种子轮到B轮总计5100万美元的融资，估值飙升至8亿美元。更令人震惊的是，他们已经吸引了780多家快速增长的公司，包括 Together AI、Cognition 和 Temporal，其中超过150家公司主动从 Zendesk、Intercom 等老牌平台迁移过来。

来自主题: AI资讯

8527 点击 2025-08-31 13:12