AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
ICLR 2025 Oral | IDEA联合清华北大提出ChartMoE:探究下游任务中多样化对齐MoE的表征和知识

ICLR 2025 Oral | IDEA联合清华北大提出ChartMoE:探究下游任务中多样化对齐MoE的表征和知识

ICLR 2025 Oral | IDEA联合清华北大提出ChartMoE:探究下游任务中多样化对齐MoE的表征和知识

最近,全球 AI 和机器学习顶会 ICLR 2025 公布了论文录取结果:由 IDEA、清华大学、北京大学、香港科技大学(广州)联合团队提出的 ChartMoE 成功入选 Oral (口头报告) 论文。据了解,本届大会共收到 11672 篇论文,被选中做 Oral Presentation(口头报告)的比例约为 1.8%

来自主题: AI技术研报
3436 点击    2025-04-01 15:27
一脑多机!智源的新发布,让不同机器人轻松协作

一脑多机!智源的新发布,让不同机器人轻松协作

一脑多机!智源的新发布,让不同机器人轻松协作

3 月 29 日,智源研究院在 2025 中关村论坛 “未来人工智能先锋论坛” 上发布首个跨本体具身大小脑协作框架 RoboOS 与开源具身大脑 RoboBrain,可实现跨场景多任务轻量化快速部署与跨本体协作,推动单机智能迈向群体智能,为构建具身智能开源统一生态加速场景应用提供底层技术支持。

来自主题: AI技术研报
5657 点击    2025-04-01 15:19
这篇综述,LLM代理的方法、应用和挑战,2025的Agent势头特别猛。| 重磅

这篇综述,LLM代理的方法、应用和挑战,2025的Agent势头特别猛。| 重磅

这篇综述,LLM代理的方法、应用和挑战,2025的Agent势头特别猛。| 重磅

2025年,人工智能领域正在经历一场由LLM Agent引发的深刻变革,不管普通人的衣食住行还是研究者的尖端研究,都很难不受Agent的影响。

来自主题: AI技术研报
7689 点击    2025-04-01 10:06
奥赛级AI基准来了:难倒所有模型,GPT-4o仅考34分,上海交大出品

奥赛级AI基准来了:难倒所有模型,GPT-4o仅考34分,上海交大出品

奥赛级AI基准来了:难倒所有模型,GPT-4o仅考34分,上海交大出品

为了进一步挑战AI系统,大家已经开始研究一些最困难的竞赛中的问题,特别是国际奥林匹克竞赛和算法挑战。

来自主题: AI技术研报
3473 点击    2025-04-01 09:49
一秒十图!英伟达MIT联手刷新SOTA,一步扩散解锁实时高质量可控图像生成

一秒十图!英伟达MIT联手刷新SOTA,一步扩散解锁实时高质量可控图像生成

一秒十图!英伟达MIT联手刷新SOTA,一步扩散解锁实时高质量可控图像生成

SANA-Sprint是一个高效的蒸馏扩散模型,专为超快速文本到图像生成而设计。通过结合连续时间一致性蒸馏(sCM)和潜空间对抗蒸馏(LADD)的混合蒸馏策略,SANA-Sprint在一步内实现了7.59 FID和0.74 GenEval的最先进性能。SANA-Sprint仅需0.1秒即可在H100上生成高质量的1024x1024图像,在速度和质量的权衡方面树立了新的标杆。

来自主题: AI技术研报
7894 点击    2025-03-31 16:16
清华朱军团队 | 从点云到高保真三维网格:DeepMesh突破自回归生成瓶颈

清华朱军团队 | 从点云到高保真三维网格:DeepMesh突破自回归生成瓶颈

清华朱军团队 | 从点云到高保真三维网格:DeepMesh突破自回归生成瓶颈

在三维数字内容生产领域,三角形网格作为核心的几何表示形式,其质量直接影响虚拟资产在影视、游戏和工业设计等应用场景中的表现与效率。

来自主题: AI技术研报
4352 点击    2025-03-31 15:31
200美金,人人可手搓QwQ,清华、蚂蚁开源极速RL框架AReaL-boba

200美金,人人可手搓QwQ,清华、蚂蚁开源极速RL框架AReaL-boba

200美金,人人可手搓QwQ,清华、蚂蚁开源极速RL框架AReaL-boba

由于 DeepSeek R1 和 OpenAI o1 等推理模型(LRM,Large Reasoning Model)带来了新的 post-training scaling law,强化学习(RL,Reinforcement Learning)成为了大语言模型能力提升的新引擎。然而,针对大语言模型的大规模强化学习训练门槛一直很高:

来自主题: AI技术研报
8932 点击    2025-03-31 15:07
被LangChain折磨够了吗?试下100行代码打造的LLM有向图框架PocketFlow | 独家最新

被LangChain折磨够了吗?试下100行代码打造的LLM有向图框架PocketFlow | 独家最新

被LangChain折磨够了吗?试下100行代码打造的LLM有向图框架PocketFlow | 独家最新

你是否曾对着一个繁复的AI框架,无奈地想:"真有必要搞得这么复杂吗?"在与臃肿框架斗争一年后,Zachary Huang博士决定大刀阔斧地革新,剔除所有花里胡哨的部分。于是Pocket Flow诞生了——一个仅有100行代码的超轻量级大语言模型框架!

来自主题: AI技术研报
7941 点击    2025-03-31 09:48
CVPR 2025 | EmoEdit:情感可编辑?深大VCC带你见证魔法!

CVPR 2025 | EmoEdit:情感可编辑?深大VCC带你见证魔法!

CVPR 2025 | EmoEdit:情感可编辑?深大VCC带你见证魔法!

当你翻开相册,看到一张平淡无奇的风景照,是否希望它能更温暖、更浪漫,甚至更忧郁?现在,EmoEdit 让这一切成为可能 —— 只需输入一个简单的情感词,EmoEdit 便能巧妙调整画面,使观众感知你想传递的情感。

来自主题: AI技术研报
8815 点击    2025-03-31 09:25
自动驾驶首次应用测试时计算!港大英伟达等新技术让AI边开边学,无人车遇变道自如应对

自动驾驶首次应用测试时计算!港大英伟达等新技术让AI边开边学,无人车遇变道自如应对

自动驾驶首次应用测试时计算!港大英伟达等新技术让AI边开边学,无人车遇变道自如应对

当开车遇到变道、加塞等场景时,驾驶员往往会下意识地激活自己的“安全驾驶思维”,从而做出激进的规避行为。

来自主题: AI技术研报
4566 点击    2025-03-31 09:07
AI「癌症神探」降临:准确度近100%,医生也自叹不如!

AI「癌症神探」降临:准确度近100%,医生也自叹不如!

AI「癌症神探」降临:准确度近100%,医生也自叹不如!

医学变革风暴来袭!ECgMPL模型如同医学领域的超级侦探,从细胞和组织微观图像里精准揪出癌症踪迹,诊断子宫内膜癌准确率近100%,远超医生平均水平。

来自主题: AI技术研报
5721 点击    2025-03-30 15:07
模型调优无需标注数据!将Llama 3.3 70B直接提升到GPT-4o水平

模型调优无需标注数据!将Llama 3.3 70B直接提升到GPT-4o水平

模型调优无需标注数据!将Llama 3.3 70B直接提升到GPT-4o水平

最近,AI 公司 Databricks 推出了一种新的调优方法 TAO,只需要输入数据,无需标注数据即可完成。更令人惊喜的是,TAO 在性能上甚至超过了基于标注数据的监督微调。

来自主题: AI技术研报
6790 点击    2025-03-30 14:33
网上晒图要当心!AI六成可能知道你在哪儿

网上晒图要当心!AI六成可能知道你在哪儿

网上晒图要当心!AI六成可能知道你在哪儿

给AI一张全新的照片,它能以相当高的准确率还猜出照片在哪个城市拍摄的。在新研究中,表现最好的AI模型,猜出图片所在城市的正确率比人类高62.6%!以后网上晒图可要当心了,AI可能知道你在哪里!

来自主题: AI技术研报
7577 点击    2025-03-30 14:23
一文读懂n8n:零基础玩转AI智能体,我该怎么选!与Coze(扣子)、Dify区别在哪?

一文读懂n8n:零基础玩转AI智能体,我该怎么选!与Coze(扣子)、Dify区别在哪?

一文读懂n8n:零基础玩转AI智能体,我该怎么选!与Coze(扣子)、Dify区别在哪?

疯哥收到最多的问题就是关于n8n与coze(扣子)、Dify有何不同,n8n和他们相比有什么优势?疯哥是资深n8n玩家,深知n8n能带给个人和企业多么强大的能力。但是,非常多的国内朋友从来都没听说过n8n,更不用提使用n8n为自己和企业搭建强大的AI自动化工作流。

来自主题: AI技术研报
7542 点击    2025-03-30 11:01
Adobe黑科技:视频扩散降维图像编辑,ObjectMover秒懂物理规律

Adobe黑科技:视频扩散降维图像编辑,ObjectMover秒懂物理规律

Adobe黑科技:视频扩散降维图像编辑,ObjectMover秒懂物理规律

论文第一作者为余鑫,香港大学三年级博士生,通讯作者为香港大学齐晓娟教授。主要研究方向为生成模型及其在图像和 3D 中的应用,发表计算机视觉和图形学顶级会议期刊论文数十篇,论文数次获得 Oral, Spotlight 和 Best Paper Honorable Mention 等荣誉。此项研究工作为作者于 Adobe Research 的实习期间完成。

来自主题: AI技术研报
7576 点击    2025-03-30 10:46
专抓AI“看图说谎”,谷歌哥大用三类陷阱触发幻觉,打造可随技术发展动态演进的评估框架

专抓AI“看图说谎”,谷歌哥大用三类陷阱触发幻觉,打造可随技术发展动态演进的评估框架

专抓AI“看图说谎”,谷歌哥大用三类陷阱触发幻觉,打造可随技术发展动态演进的评估框架

幻觉(Hallucination),即生成事实错误或不一致的信息,已成为视觉-语言模型 (VLMs)可靠性面临的核心挑战。随着VLMs在自动驾驶、医疗诊断等关键领域的广泛应用,幻觉问题因其潜在的重大后果而备受关注。

来自主题: AI技术研报
5682 点击    2025-03-29 15:36
1.6万字Rankify完全指南:三行代码搞定RAG,24种重排序方法任你选 | 全网最详细。

1.6万字Rankify完全指南:三行代码搞定RAG,24种重排序方法任你选 | 全网最详细。

1.6万字Rankify完全指南:三行代码搞定RAG,24种重排序方法任你选 | 全网最详细。

继昨天《RAG太折磨人啦,试下pip install rankify,检索、重排序、RAG三合一,完美》发布之后,有许多朋友向我询问Rankify的具体使用方法和部署细节,尤其是生产环境如何处理自定义数据集和本地数据集。

来自主题: AI技术研报
5056 点击    2025-03-29 15:23
单张照片生成360°3D场景,支持灵活视角漫游|人大&北师大&字节

单张照片生成360°3D场景,支持灵活视角漫游|人大&北师大&字节

单张照片生成360°3D场景,支持灵活视角漫游|人大&北师大&字节

从单张图像生成灵活视角3D场景的技术来了,在考古保护、自主导航等直接获取3D数据成本高昂或不可行的领域具有重要应用价值。

来自主题: AI技术研报
5722 点击    2025-03-29 14:34
VBench-2.0:面向视频生成新世代的评测框架

VBench-2.0:面向视频生成新世代的评测框架

VBench-2.0:面向视频生成新世代的评测框架

近一年以来,AI 视频生成技术发展迅猛。自 2024 年初 Sora 问世后,大家惊喜地发现:原来 AI 可以生成如此逼真的视频,一时间各大高校实验室、互联网巨头 AI Lab 以及创业公司纷纷入局视频生成领域。

来自主题: AI技术研报
5711 点击    2025-03-29 14:13
《连线》杂志长文:疯狂追赶OpenAI的2年,谷歌都做了什么?

《连线》杂志长文:疯狂追赶OpenAI的2年,谷歌都做了什么?

《连线》杂志长文:疯狂追赶OpenAI的2年,谷歌都做了什么?

AGI的这两年,基本OpenAI压着谷歌打的两年,包括但不限于谷歌自己的失误、每次发布会的被截胡。比如这次Gemini 2.5 Pro 被 4o图片生成功能抢走了几乎所有关注点。但谷歌确实也在一直追赶,从最开始的措手不及,到现在已经开始有来有往。著名科技杂志《连线》采访了谷歌前和现员工超50人,发布了一篇长文,深度挖掘了谷歌这两年苦苦追赶Openai的内幕故事,

来自主题: AI技术研报
6729 点击    2025-03-29 14:01
CVPR 2025高分论文:从照片重建3D矢量,告别模糊渲染,重建边缘更清晰

CVPR 2025高分论文:从照片重建3D矢量,告别模糊渲染,重建边缘更清晰

CVPR 2025高分论文:从照片重建3D矢量,告别模糊渲染,重建边缘更清晰

三维高斯泼溅(3D Gaussian Splatting, 3DGS)技术基于高斯分布的概率模型叠加来表征场景,但其重建结果在几何和纹理边界处往往存在模糊问题。

来自主题: AI技术研报
7745 点击    2025-03-29 13:40
17款大模型PK八款棋牌游戏,o3-mini胜出,DeepSeek R1输在中间步骤

17款大模型PK八款棋牌游戏,o3-mini胜出,DeepSeek R1输在中间步骤

17款大模型PK八款棋牌游戏,o3-mini胜出,DeepSeek R1输在中间步骤

AI社区掀起用大模型玩游戏之风!例如国外知名博主让DeepSeek和Chatgpt下国际象棋的视频在Youtube上就获得百万播放,ARC Prize组织最近也发布了一个贪吃蛇LLM评测基准SnakeBench。

来自主题: AI技术研报
7576 点击    2025-03-29 10:19