AI资讯新闻榜单内容搜索-2

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 2
FG-CLIP 2: 为细粒度跨模态理解而生的下一代VLM,8大类29项任务双语性能全球第一

FG-CLIP 2: 为细粒度跨模态理解而生的下一代VLM,8大类29项任务双语性能全球第一

FG-CLIP 2: 为细粒度跨模态理解而生的下一代VLM,8大类29项任务双语性能全球第一

在 AI 多模态的发展历程中,OpenAI 的 CLIP 让机器第一次具备了“看懂”图像与文字的能力,为跨模态学习奠定了基础。如今,来自 360 人工智能研究院冷大炜团队的 FG-CLIP 2 正式发布并开源,在中英文双语任务上全面超越 MetaCLIP 2 与 SigLIP 2,并通过新的细粒度对齐范式,补足了第一代模型在细节理解上的不足。

来自主题: AI技术研报
6702 点击    2025-11-03 09:52
RAE的终极形态?北大&阿里提出UniLIP: 将CLIP拓展到重建、生成和编辑

RAE的终极形态?北大&阿里提出UniLIP: 将CLIP拓展到重建、生成和编辑

RAE的终极形态?北大&阿里提出UniLIP: 将CLIP拓展到重建、生成和编辑

统一多模态模型要求视觉表征必须兼顾语义(理解)和细节(生成 / 编辑)。早期 VAE 因语义不足而理解受限。近期基于 CLIP 的统一编码器,面临理解与重建的权衡:直接量化 CLIP 特征会损害理解性能;而为冻结的 CLIP 训练解码器,又因特征细节缺失而无法精确重建。例如,RAE 使用冻结的 DINOv2 重建,PSNR 仅 19.23。

来自主题: AI技术研报
7751 点击    2025-11-03 09:50
前OpenAI灵魂人物Jason Wei最新演讲!三大思路揭示2025年AI终极走向

前OpenAI灵魂人物Jason Wei最新演讲!三大思路揭示2025年AI终极走向

前OpenAI灵魂人物Jason Wei最新演讲!三大思路揭示2025年AI终极走向

在AI加持下的这一年人类突飞猛进,停下来回头看去,似乎AI已经无所不能,但前OpenAI灵魂研究员认为AI不可能瞬间超越人类,他还提出了三个关于AI的最新洞见。所有能被验证的任务,最终都会被AI解决 智能最后会变成商品,知识价格归零 AI不会瞬间超过人类

来自主题: AI资讯
7860 点击    2025-11-02 14:09
今年双11,聪明人都在偷偷换AI PC

今年双11,聪明人都在偷偷换AI PC

今年双11,聪明人都在偷偷换AI PC

双11别只盯着打折——真正值得买的,是能让你工作不卡顿、生活不焦虑的效率神器。说到效率神器,AI PC绝对是其中之一。因为现在它们已经搭载了英特尔® 酷睿™ Ultra 200H系列处理器,“打开方式”完全变了样——

来自主题: AI资讯
7157 点击    2025-11-02 10:34
一场直播,10万人被骗!「AI黄仁勋」比真人火8倍

一场直播,10万人被骗!「AI黄仁勋」比真人火8倍

一场直播,10万人被骗!「AI黄仁勋」比真人火8倍

论直播,AI版黄仁勋,竟碾压了本尊?周三的GTC 2025大会上,黄仁勋在华盛顿登台激情演讲。但怪事发生了。另一个打着「NVIDIA LIVE」旗号的直播,却悄悄聚集了近10万观众。

来自主题: AI资讯
9114 点击    2025-11-01 13:10
原神LOL齐聚的Unity开发者大会,我看到了AI游戏的未来

原神LOL齐聚的Unity开发者大会,我看到了AI游戏的未来

原神LOL齐聚的Unity开发者大会,我看到了AI游戏的未来

在上海,“AI+游戏”的浪潮得到了最新证明。从《恋与深空》到LOL,技术论道的背后,开发者们正在用AI创造全新的世界。下面就让我们将目光转向2025 Unity开发者大会,看看AI+游戏又会碰撞出怎么的火花:

来自主题: AI资讯
8523 点击    2025-11-01 13:01
刚刚,英伟达拟10亿美元砸向这家AI编码创企!Copilot 技术大佬带队、成立两年估值近千亿

刚刚,英伟达拟10亿美元砸向这家AI编码创企!Copilot 技术大佬带队、成立两年估值近千亿

刚刚,英伟达拟10亿美元砸向这家AI编码创企!Copilot 技术大佬带队、成立两年估值近千亿

10 月 30 日,据彭博社援引知情人士报道,英伟达计划向人工智能初创公司 Poolside 投资最高达 10 亿美元,这笔交易预计将使后者的估值翻四倍。消息人士称,Poolside 目前正在洽谈一轮新融资,拟以 120 亿美元的投前估值融资 20 亿美元。其中,英伟达计划出资至少 5 亿美元,若本轮融资顺利完成,英伟达的总投资额可能达到 10 亿美元。

来自主题: AI资讯
7988 点击    2025-11-01 09:50
微软AI新天团曝光!只有1位华人,「谷歌系」超1/3

微软AI新天团曝光!只有1位华人,「谷歌系」超1/3

微软AI新天团曝光!只有1位华人,「谷歌系」超1/3

微软AI CEO苏莱曼领导的17名核心高管阵容曝光:新增9名核心成员中有5位来自谷歌(包含DeepMind)系;8名老将中有2名来自苏莱曼共同创办的Inflection AI;17人中有7位是原微软的资深高管。新核心团队将聚焦AI产品落地、安全与隐私、增长与商业化。

来自主题: AI资讯
8529 点击    2025-11-01 09:46
内存直降50%,token需求少56%!用视觉方式处理长文本

内存直降50%,token需求少56%!用视觉方式处理长文本

内存直降50%,token需求少56%!用视觉方式处理长文本

在NeurIPS 2025论文中,来自「南京理工大学、中南大学、南京林业大学」的研究团队提出了一个极具突破性的框架——VIST(Vision-centric Token Compression in LLM),为大语言模型的长文本高效推理提供了全新的「视觉解决方案」。值得注意的是,这一思路与近期引起广泛关注的DeepSeek-OCR的核心理念不谋而合。

来自主题: AI技术研报
8473 点击    2025-11-01 09:23
从 SD 到 Wan2.5-Preview,AI 视频 2025 质变启示录

从 SD 到 Wan2.5-Preview,AI 视频 2025 质变启示录

从 SD 到 Wan2.5-Preview,AI 视频 2025 质变启示录

最大的时代红利,属于今年四季度发布的中美两大明星产品,OpenAI 的 Sora 2 与阿里的 Wan2.5-Preview。其中,Sora 2 的登场堪称一场教科书级的营销战役。熟悉的邀请码机制再次奏效,用户为了获得一个入场券除了需要购买 GPT 的会员之外,甚至还在二手平台再花几十美金购买邀请码。更绝的是,它把自己变成了一个 AI 版抖音,

来自主题: AI资讯
7095 点击    2025-11-01 09:21