
360开源高质量图文对齐数据集!收纳1200万张图像+1000万组细粒度负样本,让模型告别“图文不符”
360开源高质量图文对齐数据集!收纳1200万张图像+1000万组细粒度负样本,让模型告别“图文不符”如何让CLIP模型更关注细粒度特征学习,避免“近视”?360人工智能研究团队提出了FG-CLIP,可以明显缓解CLIP的“视觉近视”问题。让模型能更关注于正确的细节描述,而不是更全局但是错误的描述。
如何让CLIP模型更关注细粒度特征学习,避免“近视”?360人工智能研究团队提出了FG-CLIP,可以明显缓解CLIP的“视觉近视”问题。让模型能更关注于正确的细节描述,而不是更全局但是错误的描述。
AI编程工具正引发技术革命,Cursor等产品通过自然语言交互颠覆传统编程模式,显著提升开发效率。全球创业公司竞逐AI Coding赛道,但技术成熟度、商业化路径仍面临挑战。中国企业在安全定制、垂直领域探索机会,行业期待通过代码平权重构开发生态,推动AGI实现进程。
曾撼动Transformer统治地位的Mamba作者之一Tri Dao,刚刚带来新作——提出两种专为推理“量身定制”的注意力机制。
据彭博社消息,双方正就预装Perplexity 应用及助手到三星新款设备,以及将该初创企业的搜索功能整合至三星网页浏览器进行谈判;两家公司还探讨了将 Perplexity 技术融入三星 Bixby 虚拟助手的方案。
数据枯竭正成为AI发展的新瓶颈!CMU团队提出革命性方案SRT:让LLM实现无需人类标注的自我进化!SRT初期就能迭代提升数学与推理能力,甚至性能逼近传统强化学习的效果,揭示了其颠覆性潜力。
北大校友官宣推出号称“最强通用Agent” Fairies(中译仙女),能执行Deep research、代码生成、发邮件等1000个操作。关键是无需邀请码,Mac和Windows用户只需下载APP就能立即上手试玩。(⊙ˍ⊙)
据撰写这份报告的 AI 编程助手厂商 Replit 员工 Matt Palmer 称,他和一位同事扫描了 Lovable 网站上 1645 款由其开发的 Web 应用程序。经过审查核实,其中 170 款应用程序允许任何人访问网站的用户信息,包括姓名、电子邮件地址、财务信息以及 AI 服务的 API 密钥。
近日,利用昆虫嗅觉受体制造生物传感器的生物制造企业Scentian Bio宣布,与全球最大猕猴桃营销商新西兰巨头佳沛(Zespri)达成合作。Scentian Bio的核心技术是一套基于昆虫嗅觉受体(iOR)的生物传感器,可以检测食品、植物或人体中的挥发性有机化合物 (VOC)。
深度|对话英伟达CEO黄仁勋:不进入中国就等于错过了90%的市场机会;英伟达即将进入高达50万亿美元的产业领域
近段时间,已经出现了不少基于扩散模型的语言模型,而现在,基于扩散模型的视觉-语言模型(VLM)也来了,即能够联合处理视觉和文本信息的模型。今天我们介绍的这个名叫 LaViDa,继承了扩散语言模型高速且可控的优点,并在实验中取得了相当不错的表现。