AI资讯新闻榜单内容搜索-A

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: A
CVPR 2025 | 2D 大模型赋能3D Affordance 预测,GEAL助力可泛化的3D场景可交互区域识别

CVPR 2025 | 2D 大模型赋能3D Affordance 预测,GEAL助力可泛化的3D场景可交互区域识别

CVPR 2025 | 2D 大模型赋能3D Affordance 预测,GEAL助力可泛化的3D场景可交互区域识别

在现实世界中,如何让智能体理解并挖掘 3D 场景中可交互的部位(Affordance)对于机器人操作与人机交互至关重要。所谓 3D Affordance Learning,就是希望模型能够根据视觉和语言线索,自动推理出物体可供哪些操作、以及可交互区域的空间位置,从而为机器人或人工智能系统提供对物体潜在操作方式的理解。

来自主题: AI技术研报
6101 点击    2025-04-11 09:55
AI绘图知识点补充:摄影景别提示词与效果展示

AI绘图知识点补充:摄影景别提示词与效果展示

AI绘图知识点补充:摄影景别提示词与效果展示

一直以来大多数时候都是直接告诉大家一张图的提示词是什么,且现在有更多工具和AI加持,写提示词也变得越来越简单几乎没有门槛,但是关于如何通过提示词更加精准控制画面得到自己想要的效果,其实还是有很多地方可以细说的。

来自主题: AI资讯
9536 点击    2025-04-11 09:46
预训练还没终结!港中文清华等提出「三位一体」框架,持续自我进化

预训练还没终结!港中文清华等提出「三位一体」框架,持续自我进化

预训练还没终结!港中文清华等提出「三位一体」框架,持续自我进化

港中文、清华等高校提出SICOG框架,通过预训练、推理优化和后训练协同,引入自生成数据闭环和结构化感知推理机制,实现模型自我进化,为大模型发展提供新思路。

来自主题: AI技术研报
9251 点击    2025-04-11 09:36
闭环端到端精度暴涨19.61%!华科&小米汽车联手打造自动驾驶框架ORION,代码将开源

闭环端到端精度暴涨19.61%!华科&小米汽车联手打造自动驾驶框架ORION,代码将开源

闭环端到端精度暴涨19.61%!华科&小米汽车联手打造自动驾驶框架ORION,代码将开源

近年来,端到端(End-to-End,E2E)自动驾驶技术不断进步,但在复杂的闭环交互环境中,由于其因果推理能力有限,仍然难以做出准确决策。虽然视觉 - 语言大模型(Vision-Language Model,VLM)凭借其卓越的理解和推理能力,为端到端自动驾驶带来了新的希望,但现有方法在 VLM 的语义推理空间和纯数值轨迹的行动空间之间仍然存在巨大鸿沟。

来自主题: AI技术研报
8686 点击    2025-04-11 09:28
Google一夜十二次,能否逆袭当回AI界老大

Google一夜十二次,能否逆袭当回AI界老大

Google一夜十二次,能否逆袭当回AI界老大

今天早上看到 Google 开完了他们的 Google Cloud Next 25,发了近 20 个 AI 相关的模型、应用、开发工具、硬件。

来自主题: AI资讯
6952 点击    2025-04-11 09:23
“我要去世了,豆包。”

“我要去世了,豆包。”

“我要去世了,豆包。”

昨天,我就在正常刷抖音的时候。看到一个让我泪止不住的视频,特别是最后一幕。大概就是女生的父亲,去世了,那天晚上她用她父亲的手机发讣告的时候,看了一下他父亲,跟豆包的聊天记录。因为她父亲生前很爱用豆包,所以,想知道她父亲之前,跟豆包聊了什么。

来自主题: AI资讯
9555 点击    2025-04-11 09:14
GPT-4.1 即将登场!但今天最让 OpenAI CEO 半夜兴奋的新功能不是它

GPT-4.1 即将登场!但今天最让 OpenAI CEO 半夜兴奋的新功能不是它

GPT-4.1 即将登场!但今天最让 OpenAI CEO 半夜兴奋的新功能不是它

几乎每次重大产品发布前,Sam Altman 都会习惯性抛出「预告」,吊足网友的胃口,昨晚他也在 X 上化身谜语人,声称今天会推出一个「令人兴奋」的新功能。就在刚刚,这个新功能已经揭晓——全面升级的记忆功能。

来自主题: AI资讯
10763 点击    2025-04-11 08:32
刚刚,商汤发布第六代大模型:6000亿参数多模态MoE,中长视频直接可推理

刚刚,商汤发布第六代大模型:6000亿参数多模态MoE,中长视频直接可推理

刚刚,商汤发布第六代大模型:6000亿参数多模态MoE,中长视频直接可推理

商汤最新升级的日日新SenseNova V6解锁的新能力—— 原生多模态通用大模型,采用6000亿参数MoE架构,实现文本、图像和视频的原生融合。从性能评测来看,SenseNova V6已经在纯文本任务和多模态任务中,多项指标均已超越GPT-4.5、Gemini 2.0 Pro,并全面超越DeepSeek V3:

来自主题: AI资讯
10231 点击    2025-04-10 23:17
重磅!Google推出官方AI编程工具Firebase Studio

重磅!Google推出官方AI编程工具Firebase Studio

重磅!Google推出官方AI编程工具Firebase Studio

Google 终于下场了。搞了一个完全平替 V0、Bolt.new、Lovable 的产品 Firebase Studio。用自然语言一键生成网站或者App,后续还能集成 firebase 的各种服务,构建全栈应用。

来自主题: AI资讯
10399 点击    2025-04-10 16:49