AI资讯新闻榜单内容搜索-CLIP

多模态检索新突破，用软标签打破传统刚性映射约束，全面超越CLIP｜AAAI 2026 Oral

基于多模态大模型语义理解能力的统一多模态嵌入模型UniME-V2。该方法首先通过全局检索构建潜在困难负例集，随后创新性地引入“MLLM-as-a-Judge”机制：利用MLLM对查询-候选对进行语义对齐评估，生成软语义匹配分数。

来自主题: AI技术研报

6476 点击 2025-10-06 21:53

苹果端侧AI两连发！模型体积减半、首字延迟降85倍，iPhone离线秒用

苹果在 Hugging Face上放大招了！这次直接甩出两条多模态主线：FastVLM主打「快」，字幕能做到秒回；MobileCLIP2主打「轻」，在 iPhone 上也能起飞。更妙的是，模型和Demo已经全开放，Safari网页就能体验。大模型，真·跑上手机了。

来自主题: AI资讯

9298 点击 2025-09-08 11:34

苹果最新模型，5年前的iPhone能跑

智东西9月1日消息，苹果又公布了大模型研发新进展！ 8月28日，苹果在arXiv发布新论文，介绍新一代多模态基础模型MobileCLIP2及其背后的多模态强化训练机制，同天在GitHub、Hugging Face上开源了模型的预训练权重和数据生成代码。

来自主题: AI技术研报

8247 点击 2025-09-02 11:04

让强化学习快如闪电：FlashRL一条命令实现极速Rollout，已全部开源

在今年三月份，清华 AIR 和字节联合 SIA Lab 发布了 DAPO，即 Decoupled Clip and Dynamic sAmpling Policy Optimization（解耦剪辑和动态采样策略优化）。

来自主题: AI技术研报

8686 点击 2025-08-13 11:27

OpenAI提出的CLIP，被Meta联合谢赛宁、刘壮，扩展到全球300+语言

在人工智能领域，对比语言 - 图像预训练（CLIP）是一种流行的基础模型，由 OpenAI 提出

来自主题: AI技术研报

8968 点击 2025-07-31 15:56

超CLIP准确率11%！伯克利港大阐明「LLM文本-视觉」对齐深层机制

多模态对齐模型借助对比学习在检索与生成任务中大放异彩。最新趋势是用冻结的大语言模型替换自训文本编码器，从而在长文本与大数据场景中降低算力成本。LIFT首次系统性地剖析了此范式的优势来源、数据适配性、以及关键设计选择，在组合语义理解与长文本任务上观察到大幅提升。

来自主题: AI技术研报

8141 点击 2025-07-03 11:00

一亿美金种子轮，Genesis AI刷新硅谷具身智能融资记录！周衔、许臻佳、李旻辰等华人合伙创业

最近，硅谷的一家新成立的名叫「Genesis AI」的公司吸引了我们的注意，他们在最近的种子轮融资中拿到了 1.05 亿美元。据外媒 TechCrunch 报道，这轮融资由美国顶级风投机构 Khosla Ventures、Eclipse 联合领投。前者是 OpenAI 的最早的机构投资者，后者是特斯拉产业背景团队机器人赛道的专业机构。

来自主题: AI资讯

11609 点击 2025-07-02 09:30