AI资讯新闻榜单内容搜索-CLIP

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: CLIP

OpenAI提出的CLIP，被Meta联合谢赛宁、刘壮，扩展到全球300+语言

OpenAI提出的CLIP，被Meta联合谢赛宁、刘壮，扩展到全球300+语言

OpenAI提出的CLIP，被Meta联合谢赛宁、刘壮，扩展到全球300+语言

在人工智能领域，对比语言 - 图像预训练（CLIP）是一种流行的基础模型，由 OpenAI 提出

来自主题: AI技术研报

8284 点击 2025-07-31 15:56

超CLIP准确率11%！伯克利港大阐明「LLM文本-视觉」对齐深层机制

超CLIP准确率11%！伯克利港大阐明「LLM文本-视觉」对齐深层机制

超CLIP准确率11%！伯克利港大阐明「LLM文本-视觉」对齐深层机制

多模态对齐模型借助对比学习在检索与生成任务中大放异彩。最新趋势是用冻结的大语言模型替换自训文本编码器，从而在长文本与大数据场景中降低算力成本。LIFT首次系统性地剖析了此范式的优势来源、数据适配性、以及关键设计选择，在组合语义理解与长文本任务上观察到大幅提升。

来自主题: AI技术研报

7407 点击 2025-07-03 11:00

一亿美金种子轮，Genesis AI刷新硅谷具身智能融资记录！周衔、许臻佳、李旻辰等华人合伙创业

一亿美金种子轮，Genesis AI刷新硅谷具身智能融资记录！周衔、许臻佳、李旻辰等华人合伙创业

一亿美金种子轮，Genesis AI刷新硅谷具身智能融资记录！周衔、许臻佳、李旻辰等华人合伙创业

最近，硅谷的一家新成立的名叫「Genesis AI」的公司吸引了我们的注意，他们在最近的种子轮融资中拿到了 1.05 亿美元。据外媒 TechCrunch 报道，这轮融资由美国顶级风投机构 Khosla Ventures、Eclipse 联合领投。前者是 OpenAI 的最早的机构投资者，后者是特斯拉产业背景团队机器人赛道的专业机构。

来自主题: AI资讯

10725 点击 2025-07-02 09:30

AI一眼认出95万物种，还能分辨雄雌老幼，2亿生物图像炼成“生命视觉”大模型

AI一眼认出95万物种，还能分辨雄雌老幼，2亿生物图像炼成“生命视觉”大模型

AI一眼认出95万物种，还能分辨雄雌老幼，2亿生物图像炼成“生命视觉”大模型

让AI看懂95万物种，并自己悟出生态关系与个体差异!俄亥俄州立大学研究团队在2亿生物图像数据上训练了BioCLIP 2模型。大规模的训练让BioCLIP 2取得了目前最优的物种识别性能。

来自主题: AI技术研报

6910 点击 2025-06-29 16:59

10行代码，AIME24/25提高15%！揭秘大模型强化学习熵机制

10行代码，AIME24/25提高15%！揭秘大模型强化学习熵机制

10行代码，AIME24/25提高15%！揭秘大模型强化学习熵机制

Nature never undertakes any change unless her interests are served by an increase in entropy. 自然界的任何变化，唯有在熵增符合其利益时方会发生——Max Planck

来自主题: AI技术研报

5897 点击 2025-06-06 12:08

360开源高质量图文对齐数据集！收纳1200万张图像+1000万组细粒度负样本，让模型告别“图文不符”

360开源高质量图文对齐数据集！收纳1200万张图像+1000万组细粒度负样本，让模型告别“图文不符”

360开源高质量图文对齐数据集！收纳1200万张图像+1000万组细粒度负样本，让模型告别“图文不符”

如何让CLIP模型更关注细粒度特征学习，避免“近视”？360人工智能研究团队提出了FG-CLIP，可以明显缓解CLIP的“视觉近视”问题。让模型能更关注于正确的细节描述，而不是更全局但是错误的描述。

来自主题: AI技术研报

9392 点击 2025-06-02 15:17

想去哪就去哪！FindAnything：基于CLIP的开放词汇三维建图，实现真正的“按需探索”

想去哪就去哪！FindAnything：基于CLIP的开放词汇三维建图，实现真正的“按需探索”

想去哪就去哪！FindAnything：基于CLIP的开放词汇三维建图，实现真正的“按需探索”

在复杂、未知的现实环境中，传统导航方法往往依赖闭集语义或事先构建的地图，难以实现真正的“按需探索”。为打破这一瓶颈，本文提出了 FindAnything ——一套融合视觉语言模型的对象为中心、开放词汇三维建图与探索系统。

来自主题: AI技术研报

6672 点击 2025-05-06 10:23

1亿图文对！格灵深瞳开源RealSyn数据集，CLIP多任务性能刷新SOTA

1亿图文对！格灵深瞳开源RealSyn数据集，CLIP多任务性能刷新SOTA

1亿图文对！格灵深瞳开源RealSyn数据集，CLIP多任务性能刷新SOTA

新的亿级大规模图文对数据集来了，CLIP达成新SOTA！

来自主题: AI技术研报

7463 点击 2025-04-29 15:47

全网最全「吉卜力」AI神器总结！只要2分钟，照片秒变吉卜力

全网最全「吉卜力」AI神器总结！只要2分钟，照片秒变吉卜力

全网最全「吉卜力」AI神器总结！只要2分钟，照片秒变吉卜力

不止GPT-4o可以制作吉卜力风格图像！更多工具都可以制作吉卜力风图像。甚至2分钟之内，还能用照片生成吉卜力风格动画：蒙娜丽莎给你说Hello。

来自主题: AI资讯

8265 点击 2025-04-17 16:24

CLIP被淘汰了？LeCun谢赛宁新作，多模态训练无需语言监督更强！

CLIP被淘汰了？LeCun谢赛宁新作，多模态训练无需语言监督更强！

CLIP被淘汰了？LeCun谢赛宁新作，多模态训练无需语言监督更强！

LeCun谢赛宁等研究人员通过新模型Web-SSL验证了SSL在多模态任务中的潜力，证明其在扩展模型和数据规模后，能媲美甚至超越CLIP。这项研究为无语言监督的视觉预训练开辟新方向，并计划开源模型以推动社区探索。

来自主题: AI技术研报

8421 点击 2025-04-07 15:09

上一页当前第2页,共5页下一页