AI资讯新闻榜单内容搜索-CLIP

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
搜索: CLIP
跨模态大升级!少量数据高效微调,LLM教会CLIP玩转复杂文本

跨模态大升级!少量数据高效微调,LLM教会CLIP玩转复杂文本

跨模态大升级!少量数据高效微调,LLM教会CLIP玩转复杂文本

在当今多模态领域,CLIP 模型凭借其卓越的视觉与文本对齐能力,推动了视觉基础模型的发展。CLIP 通过对大规模图文对的对比学习,将视觉与语言信号嵌入到同一特征空间中,受到了广泛应用。

来自主题: AI技术研报
5087 点击    2024-11-27 14:41
一文读懂 CLIP:多模态 AI 的核心原理与应用

一文读懂 CLIP:多模态 AI 的核心原理与应用

一文读懂 CLIP:多模态 AI 的核心原理与应用

「多模态」这个词,相信各位开发者已经比较熟悉了,多模态的含义是让 AI 同时理解包含如图像和文本在内的多种类型的数据。

来自主题: AI资讯
7675 点击    2024-11-15 10:38
OpusClip创始人赵洋:7个月,500万用户,ARR千万美金

OpusClip创始人赵洋:7个月,500万用户,ARR千万美金

OpusClip创始人赵洋:7个月,500万用户,ARR千万美金

7 个月时间,用户量超过 500 万,ARR 收入接近 1000 万美元。 OpusClip 可以说是目前 AI 视频剪辑工具的头号种子

来自主题: AI资讯
3790 点击    2024-11-02 10:38
一张图实现街道级定位,端到端图像地理定位大模型AddressCLIP登ECCV2024

一张图实现街道级定位,端到端图像地理定位大模型AddressCLIP登ECCV2024

一张图实现街道级定位,端到端图像地理定位大模型AddressCLIP登ECCV2024

拔草星人的好消息来啦!中科院自动化所和阿里云一起推出了街景定位大模型,只要一张照片就能实现街道级精度的定位。

来自主题: AI资讯
4010 点击    2024-09-14 15:40
对比学习滥用隐私数据!中科院等发布「多步误差最小化」方法 | ACM MM2024

对比学习滥用隐私数据!中科院等发布「多步误差最小化」方法 | ACM MM2024

对比学习滥用隐私数据!中科院等发布「多步误差最小化」方法 | ACM MM2024

多模态对比学习(如CLIP)通过从互联网上抓取的数百万个图像-字幕对中学习,在零样本分类方面取得了显著进展。 然而,这种依赖带来了隐私风险,因为黑客可能会未经授权地利用图像-文本数据进行模型训练,其中可能包括个人和隐私敏感信息。

来自主题: AI技术研报
6788 点击    2024-08-01 15:32
开发者自述:诞生、爆火、开源、沉寂,一款 AI 相册搜索应用的两年

开发者自述:诞生、爆火、开源、沉寂,一款 AI 相册搜索应用的两年

开发者自述:诞生、爆火、开源、沉寂,一款 AI 相册搜索应用的两年

寻隐(英文名 Queryable)是一款 iOS 上的 AI 照片搜索软件,支持用户使用自然语言搜索本地照片。软件诞生的契机是 OpenAI 发布的 CLIP 模型。

来自主题: AI资讯
9801 点击    2024-07-27 15:35
比LERF提速199倍!清华哈佛发布LangSplat:三维语义高斯泼溅 | CVPR 2024 Highlight

比LERF提速199倍!清华哈佛发布LangSplat:三维语义高斯泼溅 | CVPR 2024 Highlight

比LERF提速199倍!清华哈佛发布LangSplat:三维语义高斯泼溅 | CVPR 2024 Highlight

本文将为大家介绍CVPR 2024 Highlight的论文LangSplat: 3D Language Gaussian Splatting(三维语义高斯泼溅)。LangSplat在开放文本目标定位和语义分割任务上达到SOTA性能。在1440×1080分辨率的图像上,查询速度比之前的SOTA方法LERF快了199倍。代码已开源。

来自主题: AI技术研报
3543 点击    2024-06-28 16:31