AI资讯新闻榜单内容搜索-GE

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: GE
谷歌、字节神仙打架,为何这款叫 Reve 的工具却在悄悄刷屏?

谷歌、字节神仙打架,为何这款叫 Reve 的工具却在悄悄刷屏?

谷歌、字节神仙打架,为何这款叫 Reve 的工具却在悄悄刷屏?

Reve AI 是一家 2023 年 12 月才建立的加州 AI 初创公司,他们在 2025 年 3 月推出了第一个生图模型叫 Reve Image 1.0,内部代号是「Halfmoon」。6 个月过后,再次升级该模型为「图像编辑模型」。

来自主题: AI资讯
10011 点击    2025-10-17 08:39
刚刚,谷歌深夜上新Veo 3.1!网友狂刷2.75亿条,Sora 2要小心了

刚刚,谷歌深夜上新Veo 3.1!网友狂刷2.75亿条,Sora 2要小心了

刚刚,谷歌深夜上新Veo 3.1!网友狂刷2.75亿条,Sora 2要小心了

谷歌凌晨更新Veo 3.1,主打更强叙事与音频控制、首尾帧与多图参考等精控,接入Gemini API与Vertex AI,Flow与Gemini可用。可合成多人物场景、音画同步,片段最长约148秒;规格至1080p/24fps。

来自主题: AI资讯
8487 点击    2025-10-16 15:36
王兴兴硕士论文惊现GitHub,宇树雏形那时候就有了

王兴兴硕士论文惊现GitHub,宇树雏形那时候就有了

王兴兴硕士论文惊现GitHub,宇树雏形那时候就有了

人火了是连毕业论文都要被翻出来的(doge)。 这不,宇树科技CEO王兴兴的硕士毕业论文就被网友们掘地三尺找到了。

来自主题: AI资讯
7586 点击    2025-10-16 15:12
NTU等联合提出A-MemGuard:为AI记忆上锁,投毒攻击成功率暴降95%

NTU等联合提出A-MemGuard:为AI记忆上锁,投毒攻击成功率暴降95%

NTU等联合提出A-MemGuard:为AI记忆上锁,投毒攻击成功率暴降95%

在AI智能体日益依赖记忆系统的时代,一种新型攻击悄然兴起:记忆投毒。A-MemGuard作为首个专为LLM Agent记忆模块设计的防御框架,通过共识验证和双重记忆结构,巧妙化解上下文依赖与自我强化错误循环的难题,让AI从被动受害者转为主动守护者,成功率高达95%以上。

来自主题: AI技术研报
7392 点击    2025-10-16 14:51
NeurIPS 2025 Spotlight | 条件表征学习:一步对齐表征与准则

NeurIPS 2025 Spotlight | 条件表征学习:一步对齐表征与准则

NeurIPS 2025 Spotlight | 条件表征学习:一步对齐表征与准则

一张图片包含的信息是多维的。例如下面的图 1,我们至少可以得到三个层面的信息:主体是大象,数量有两头,环境是热带稀树草原(savanna)。然而,如果由传统的表征学习方法来处理这张图片,比方说就将其送入一个在 ImageNet 上训练好的 ResNet 或者 Vision Transformer,往往得到的表征只会体现其主体信息,也就是会简单地将该图片归为大象这一类别。这显然是不合理的。

来自主题: AI技术研报
7032 点击    2025-10-16 14:43
具身智能迎来ImageNet时刻:RoboChallenge开放首个大规模真机基准测试集

具身智能迎来ImageNet时刻:RoboChallenge开放首个大规模真机基准测试集

具身智能迎来ImageNet时刻:RoboChallenge开放首个大规模真机基准测试集

近日,RoboChallenge 重磅推出!这是全球首个大规模、多任务的在真实物理环境中由真实机器人执行操作任务的基准测试。

来自主题: AI技术研报
7869 点击    2025-10-16 12:45
不再靠「猜坐标」!颜水成团队等联合发布PaDT多模态大模型:实现真正的多模态表征输出

不再靠「猜坐标」!颜水成团队等联合发布PaDT多模态大模型:实现真正的多模态表征输出

不再靠「猜坐标」!颜水成团队等联合发布PaDT多模态大模型:实现真正的多模态表征输出

近年来,多模态大语言模型(Multimodal Large Language Models, MLLMs)在图文理解、视觉问答等任务上取得了令人瞩目的进展。然而,当面对需要精细空间感知的任务 —— 比如目标检测、实例分割或指代表达理解时,现有模型却常常「力不从心」。

来自主题: AI技术研报
9587 点击    2025-10-16 12:31
仅4B!阿里千问最强视觉模型新开源,网友:我的16GB Mac有救了

仅4B!阿里千问最强视觉模型新开源,网友:我的16GB Mac有救了

仅4B!阿里千问最强视觉模型新开源,网友:我的16GB Mac有救了

智东西10月15日报道,今日,阿里通义千问团队推出其最强视觉语言模型系列Qwen3-VL的4B与8B版本,两个尺寸均提供Instruct与Thinking版本,在几十项权威基准测评中超越Gemini 2.5 Flash Lite、GPT-5 Nano等同级别顶尖模型。

来自主题: AI资讯
10097 点击    2025-10-15 17:05
谷歌新版Gemini一夜端掉UI:单HTML文件复刻macOS,成功率100%

谷歌新版Gemini一夜端掉UI:单HTML文件复刻macOS,成功率100%

谷歌新版Gemini一夜端掉UI:单HTML文件复刻macOS,成功率100%

前端UI的工作,被谷歌AI一夜干没了。 就在最新能力展示中,Gemini 3.0 Pro居然自己“捏”出了一个macOS。

来自主题: AI资讯
7848 点击    2025-10-15 15:03
LangChain 不看好 OpenAI AgentKit:世界不需要再来一个 Workflow 构建器

LangChain 不看好 OpenAI AgentKit:世界不需要再来一个 Workflow 构建器

LangChain 不看好 OpenAI AgentKit:世界不需要再来一个 Workflow 构建器

在几天前的开发者大会上,OpenAI 发布了一套面向开发者和企业的完整工具集 AgentKit。其中,可视化画布 Agent Builder 用于创建、管理和版本化多智能体工作流,通过拖拽节点的方式即可编辑工作流。

来自主题: AI资讯
7755 点击    2025-10-15 14:57