AI TNT— 让一部分先用AI实现商业化

一张图实现街道级定位，端到端图像地理定位大模型AddressCLIP登ECCV2024

拔草星人的好消息来啦！中科院自动化所和阿里云一起推出了街景定位大模型，只要一张照片就能实现街道级精度的定位。

来自主题: AI资讯

3388 点击 2024-09-14 15:40

9个人的公司，做文生图，2500万用户，每年净利润200万美元

Flux 带起又一波文生图模型的热潮，NightCafe 是其中的受益者之一。

来自主题: AI商业项目

8851 点击 2024-09-05 09:41

对比学习滥用隐私数据！中科院等发布「多步误差最小化」方法 | ACM MM2024

多模态对比学习（如CLIP）通过从互联网上抓取的数百万个图像-字幕对中学习，在零样本分类方面取得了显著进展。然而，这种依赖带来了隐私风险，因为黑客可能会未经授权地利用图像-文本数据进行模型训练，其中可能包括个人和隐私敏感信息。

来自主题: AI技术研报

6359 点击 2024-08-01 15:32

开发者自述：诞生、爆火、开源、沉寂，一款 AI 相册搜索应用的两年

寻隐（英文名 Queryable）是一款 iOS 上的 AI 照片搜索软件，支持用户使用自然语言搜索本地照片。软件诞生的契机是 OpenAI 发布的 CLIP 模型。

来自主题: AI资讯

9104 点击 2024-07-27 15:35

比LERF提速199倍！清华哈佛发布LangSplat：三维语义高斯泼溅 | CVPR 2024 Highlight

本文将为大家介绍CVPR 2024 Highlight的论文LangSplat: 3D Language Gaussian Splatting（三维语义高斯泼溅）。LangSplat在开放文本目标定位和语义分割任务上达到SOTA性能。在1440×1080分辨率的图像上，查询速度比之前的SOTA方法LERF快了199倍。代码已开源。

来自主题: AI技术研报

3172 点击 2024-06-28 16:31