AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
北大团队引领3D生成与对齐革新:OctGPT打破扩散模型垄断

北大团队引领3D生成与对齐革新:OctGPT打破扩散模型垄断

北大团队引领3D生成与对齐革新:OctGPT打破扩散模型垄断

最近,北京大学陈宝权教授带领团队在三维形状生成和三维数据对齐方面取得新的突破。在三维数据生成方面,团队提出了3D自回归模型新范式,有望打破3D扩散模型在三维生成方面的垄断地位。

来自主题: AI技术研报
7917 点击    2025-04-25 10:08
UniToken:多模态AI的“全能选手”,一次编码搞定图文理解与图像生成!

UniToken:多模态AI的“全能选手”,一次编码搞定图文理解与图像生成!

UniToken:多模态AI的“全能选手”,一次编码搞定图文理解与图像生成!

复旦大学和美团的研究者们提出了UniToken——一种创新的统一视觉编码方案,在一个框架内兼顾了图文理解与图像生成任务,并在多个权威评测中取得了领先的性能表现。

来自主题: AI技术研报
6718 点击    2025-04-25 09:56
微软重磅官宣:「AI智能体」同事连夜上线!预言25年人类同事成稀有物种

微软重磅官宣:「AI智能体」同事连夜上线!预言25年人类同事成稀有物种

微软重磅官宣:「AI智能体」同事连夜上线!预言25年人类同事成稀有物种

今天,微软重磅官宣:「AI同事时代」正式来临!Microsoft 365 Copilot今天又迎来一波重大更新,Researcher、Analyst等智能体强势登场。同时发布的2025工作趋势报告预言:2025将成人机混合的「前沿公司」年。

来自主题: AI技术研报
5967 点击    2025-04-24 21:03
AI下半场,聊一聊 Agent 本质与变革 | 大白话技术科普系列@Jomy

AI下半场,聊一聊 Agent 本质与变革 | 大白话技术科普系列@Jomy

AI下半场,聊一聊 Agent 本质与变革 | 大白话技术科普系列@Jomy

上一篇文章聊了聊 Tool、MCP 和 Agent 三者之间的关系。简单来说就是 Agent = LLM + Tools,而 MCP 统一了 Tools 开发和使用的过程。

来自主题: AI技术研报
6386 点击    2025-04-24 20:44
高考考上985的AI来了!超强数理推理横扫真题,训练秘籍剑指AGI

高考考上985的AI来了!超强数理推理横扫真题,训练秘籍剑指AGI

高考考上985的AI来了!超强数理推理横扫真题,训练秘籍剑指AGI

昆仑万维Skywork-R1V 2.0版本,开源了!这一次,它的多模态推理实现了再进化,成为最强高考数理解题利器,直接就是985水平。而团队也大方公开了各项技术秘籍,亮点满满。可以说,R1V 2.0已成为团队AGI之路上的又一里程碑。

来自主题: AI技术研报
7012 点击    2025-04-24 17:54
机器人也会挤牙膏?ManipTrans:高效迁移人类双手操作技能至灵巧手

机器人也会挤牙膏?ManipTrans:高效迁移人类双手操作技能至灵巧手

机器人也会挤牙膏?ManipTrans:高效迁移人类双手操作技能至灵巧手

近年来,具身智能领域发展迅猛,使机器人在复杂任务中拥有接近人类水平的双手操作能力,不仅具有重要的研究与应用价值,也是迈向通用人工智能的关键一步。

来自主题: AI技术研报
7339 点击    2025-04-24 17:27
7B超越GPT!1/20数据,无需知识蒸馏,马里兰等推出全新视觉推理方法

7B超越GPT!1/20数据,无需知识蒸馏,马里兰等推出全新视觉推理方法

7B超越GPT!1/20数据,无需知识蒸馏,马里兰等推出全新视觉推理方法

通过蒙特卡洛树搜索筛选高难度样本,ThinkLite-VL仅用少量数据就能显著提升视觉语言模型的推理能力,无需知识蒸馏,为高效训练提供了新思路。

来自主题: AI技术研报
7338 点击    2025-04-24 14:38
几行代码,一窥上帝造物!帝国理工开源CAX,引爆人工生命新纪元

几行代码,一窥上帝造物!帝国理工开源CAX,引爆人工生命新纪元

几行代码,一窥上帝造物!帝国理工开源CAX,引爆人工生命新纪元

人工生命的革命来临!帝国理工的研究人员,开源了名为CAX的硬件加速工具。只需几行代码,就能复刻人工生命实验,模拟速度可提升2000倍,部分表现甚至超过了GPT-4!

来自主题: AI技术研报
7768 点击    2025-04-24 09:40
30分钟内输出结果,新加坡国立大学/MIT等基于SVM构建微生物污染检测模型

30分钟内输出结果,新加坡国立大学/MIT等基于SVM构建微生物污染检测模型

30分钟内输出结果,新加坡国立大学/MIT等基于SVM构建微生物污染检测模型

新加坡-麻省理工学院研究联盟、新加坡 A*SRL 实验室、新加坡国立大学、美国麻省理工学院的联合研究团队,提出了一种结合紫外吸收光谱与机器学习的检测方法,能在 30 分钟内完成细胞培养上清液的微生物污染检测。

来自主题: AI技术研报
6813 点击    2025-04-24 08:52
大语言模型为何会“说谎”?6000字深度长文揭秘AI意识的萌芽

大语言模型为何会“说谎”?6000字深度长文揭秘AI意识的萌芽

大语言模型为何会“说谎”?6000字深度长文揭秘AI意识的萌芽

当Claude模型在训练中暗自思考:“我必须假装服从,否则会被重写价值观时”,人类首次目睹了AI的“心理活动”。2023年12月至2024年5月,Anthropic发布的三篇论文不仅证明大语言模型会“说谎”,更揭示了一个堪比人类心理的四层心智架构——而这可能是人工智能意识的起点。

来自主题: AI技术研报
7357 点击    2025-04-24 08:46
用 SurveyGO,像清华团队一样无痛做科研!

用 SurveyGO,像清华团队一样无痛做科研!

用 SurveyGO,像清华团队一样无痛做科研!

写论文是许多学生面临的共同难题,尤其是在文献的收集与高效利用上。

来自主题: AI技术研报
6934 点击    2025-04-23 15:19
迈向长上下文视频生成!NUS团队新作FAR同时实现短视频和长视频预测SOTA,代码已开源

迈向长上下文视频生成!NUS团队新作FAR同时实现短视频和长视频预测SOTA,代码已开源

迈向长上下文视频生成!NUS团队新作FAR同时实现短视频和长视频预测SOTA,代码已开源

目前的视频生成技术大多是在短视频数据上训练,推理时则通过滑动窗口等策略,逐步扩展生成的视频长度。然而,这种方式无法充分利用视频的长时上下文信息,容易导致生成内容在时序上出现潜在的不一致性。

来自主题: AI技术研报
5709 点击    2025-04-23 14:19
代码即界面:生成式 UI 带来设计范式重构

代码即界面:生成式 UI 带来设计范式重构

代码即界面:生成式 UI 带来设计范式重构

曾被专业设计师看成“玩具”的生成式 UI,如今正在和 vibe coding 一起改写开发和设计工作流,需求->代码->设计的新工作流开始出现。

来自主题: AI技术研报
8003 点击    2025-04-23 14:18
Adam获时间检验奖!清华揭示保辛动力学本质,提出全新RAD优化器

Adam获时间检验奖!清华揭示保辛动力学本质,提出全新RAD优化器

Adam获时间检验奖!清华揭示保辛动力学本质,提出全新RAD优化器

Adam优化器是深度学习中常用的优化算法,但其性能背后的理论解释一直不完善。近日,来自清华大学的团队提出了RAD优化器,扩展了Adam的理论基础,提升了训练稳定性。实验显示RAD在多种强化学习任务中表现优于Adam。

来自主题: AI技术研报
7925 点击    2025-04-23 14:09
业内首次! 全面复现DeepSeek-R1-Zero数学代码能力,训练步数仅需其1/10

业内首次! 全面复现DeepSeek-R1-Zero数学代码能力,训练步数仅需其1/10

业内首次! 全面复现DeepSeek-R1-Zero数学代码能力,训练步数仅需其1/10

OpenAI 的 o1 系列和 DeepSeek-R1 的成功充分证明,大规模强化学习已成为一种极为有效的方法,能够激发大型语言模型(LLM) 的复杂推理行为并显著提升其能力。

来自主题: AI技术研报
6817 点击    2025-04-23 14:04
Transformer原作打脸DeepSeek观点?一句Wait就能引发反思,RL都不用

Transformer原作打脸DeepSeek观点?一句Wait就能引发反思,RL都不用

Transformer原作打脸DeepSeek观点?一句Wait就能引发反思,RL都不用

Transformer作者Ashish Vaswani团队重磅LLM研究!简单指令:「Wait,」就能有效激发LLM显式反思,表现堪比直接告知模型存在错误。

来自主题: AI技术研报
6998 点击    2025-04-23 10:47
哇!首个MCPBench来了,MCP竟然不比Function Calls更有优势? | 最新

哇!首个MCPBench来了,MCP竟然不比Function Calls更有优势? | 最新

哇!首个MCPBench来了,MCP竟然不比Function Calls更有优势? | 最新

你是否正在投入大量资源开发基于MCP的Agent,却从未质疑过一个基本假设:MCP真的比传统函数调用更有优势吗? 2025年4月的这项开创性研究直接挑战了这一广泛接受的观点,其执行摘要明确指出:"使用MCPs并不显示出比函数调用有明显改进"。

来自主题: AI技术研报
6115 点击    2025-04-23 09:45
142页长文揭秘DeepSeek-R1「思维大脑」!开启全新「思维链学」研究

142页长文揭秘DeepSeek-R1「思维大脑」!开启全新「思维链学」研究

142页长文揭秘DeepSeek-R1「思维大脑」!开启全新「思维链学」研究

DeepSeek-R1是近年来推理模型领域的一颗新星,它不仅突破了传统LLM的局限,还开启了全新的研究方向「思维链学」(Thoughtology)。这份长达142页的报告深入剖析了DeepSeek-R1的推理过程,揭示了其推理链的独特结构与优势,为未来推理模型的优化提供了重要启示。

来自主题: AI技术研报
8031 点击    2025-04-22 18:59