AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
往 Codex 里塞块无限画布,AI 改图终于能指哪打哪了|附教程

往 Codex 里塞块无限画布,AI 改图终于能指哪打哪了|附教程

往 Codex 里塞块无限画布,AI 改图终于能指哪打哪了|附教程

和 Codex、Claude Code 等 Coding Agent 沟通,很多时候就像站在许愿池边,对着池子里的王八扔硬币,嘴里念念有词,关键它还真给你兑现愿望。

来自主题: AI技术研报
6409 点击    2026-06-25 15:26
让机器人学会「预判接触」:它石智航牵头四大顶尖机构发布TacForeSight,破解精细操作难题

让机器人学会「预判接触」:它石智航牵头四大顶尖机构发布TacForeSight,破解精细操作难题

让机器人学会「预判接触」:它石智航牵头四大顶尖机构发布TacForeSight,破解精细操作难题

机器人已经学会看见世界,也开始学会摸到世界。但对于真实接触操作而言,仅仅感知当前状态远远不够,机器人还需要预测物理世界接下来会如何变化。擦拭、插接、拧紧,这些人类几乎凭感觉就能完成的动作,对机器人来说却并非易事:接触力度会变化,物体位置会偏移,反馈慢一步,就可能打滑、卡住或丢失。

来自主题: AI技术研报
6809 点击    2026-06-25 15:24
中国造出一颗「不怕死」的AI大脑,专接最要命的活儿

中国造出一颗「不怕死」的AI大脑,专接最要命的活儿

中国造出一颗「不怕死」的AI大脑,专接最要命的活儿

太硬核了!全球首个搭载AI大脑的防爆机器人,正式接管加油站。自主定位、拧盖、提枪、注油,全套动作行云流水,24小时无休作业,具身智能终于在高危场景一战封神。

来自主题: AI技术研报
8927 点击    2026-06-25 15:01
SIGGRAPH 2026 | 无需训练,一段单目视频解锁任意运镜与「子弹时间」

SIGGRAPH 2026 | 无需训练,一段单目视频解锁任意运镜与「子弹时间」

SIGGRAPH 2026 | 无需训练,一段单目视频解锁任意运镜与「子弹时间」

给定一段普通单目视频,FreeOrbit4D 可沿任意指定相机轨迹「重拍」整个动态场景,包括影视级的「子弹时间」环绕镜头。

来自主题: AI技术研报
8044 点击    2026-06-25 15:01
首个长程Doc2Repo训练集!代码Agent不止修bug,开始造仓库

首个长程Doc2Repo训练集!代码Agent不止修bug,开始造仓库

首个长程Doc2Repo训练集!代码Agent不止修bug,开始造仓库

DeNovoSWE是一个用于训练代码智能体从零生成完整仓库的数据集,包含4818个真实任务实例。它通过结构化文档和严格验证机制,帮助智能体掌握复杂系统构建能力,而不仅仅是修复代码。这为代码智能体迈向更高阶的软件工程任务提供了关键支持。

来自主题: AI技术研报
9304 点击    2026-06-25 10:04
全球算力分布地图曝光:谁掌握能源,谁掌握AI未来

全球算力分布地图曝光:谁掌握能源,谁掌握AI未来

全球算力分布地图曝光:谁掌握能源,谁掌握AI未来

近日,国际能源研究机构AixEnergy发布《Market Outlook》报告,提出一个值得关注的判断:AI基础设施首先是一项能源决策,其次才是一项技术决策。报告认为,决定未来全球AI版图的关键因素,正从芯片、模型和算法,转向稳定、低成本且能够快速接入的能源系统。海湾国家凭借廉价电力迅速崛起,美国受制于电网瓶颈,中国则依托新能源和产业链优势加速布局,东南亚正试图成为新的算力高地。

来自主题: AI技术研报
8966 点击    2026-06-24 17:38
端侧跑大模型,现在也太简单了

端侧跑大模型,现在也太简单了

端侧跑大模型,现在也太简单了

最近,我们都在关注旗舰级大模型的进步,其实本地运行的 AI 模型也迎来了重要的分水岭。

来自主题: AI技术研报
7961 点击    2026-06-24 16:58
Claude惊人真相被教授曝光:思考过程加密,给钱也看不到!

Claude惊人真相被教授曝光:思考过程加密,给钱也看不到!

Claude惊人真相被教授曝光:思考过程加密,给钱也看不到!

当初,Anthropic推出extended thinking的时候,把它包装成「让用户看到思考过程」的透明标杆。现在真相是:你看到的只是他们允许你看到的部分。那些被加密、被压缩、被锁在全局密钥里的内容,藏着什么?

来自主题: AI技术研报
9805 点击    2026-06-24 16:36
Mimo Code 爆火:我们挖开源代码,找到小米 AI 的真创新

Mimo Code 爆火:我们挖开源代码,找到小米 AI 的真创新

Mimo Code 爆火:我们挖开源代码,找到小米 AI 的真创新

6 月 11 日凌晨,小米 MiMo 团队公开了一个叫 MiMo Code 的项目,定位是终端编程 Agent,MIT 协议开源。官方宣传重点有三处,14 天 5 人团队投入的“vibe coding”开发叙事、Claude Code 之上的 SWE-Bench Pro 跑分。以及“无限上下文”的记忆架构。

来自主题: AI技术研报
9572 点击    2026-06-24 16:35
直接从像素到单词:这个原生大模型统一单图、多图、视频和空间智能

直接从像素到单词:这个原生大模型统一单图、多图、视频和空间智能

直接从像素到单词:这个原生大模型统一单图、多图、视频和空间智能

今天几乎所有主流视觉语言模型(VLM)—— 无论是 Qwen-VL、InternVL,还是 LLaVA 系列 —— 都遵循着同一套经典架构:先用预训练视觉编码器(如 CLIP、SigLIP)将图像压缩为特征,再通过投影层把这些特征送入大语言模型。

来自主题: AI技术研报
7307 点击    2026-06-24 16:06
从0到1跑通AI爽剧:超高质量短剧制作全流程SOP直接拿走!【建议收藏】

从0到1跑通AI爽剧:超高质量短剧制作全流程SOP直接拿走!【建议收藏】

从0到1跑通AI爽剧:超高质量短剧制作全流程SOP直接拿走!【建议收藏】

大家好,我是最近疯狂研究短剧的袋鼠帝 最近的AI漫剧发展的是真快啊,各种爽文小说改编的AI漫剧播放量甚至已经超过了某些电影和电视剧。

来自主题: AI技术研报
9916 点击    2026-06-24 16:05
真机强化学习如何保证安全性?清华团队提出安全探索均衡机制

真机强化学习如何保证安全性?清华团队提出安全探索均衡机制

真机强化学习如何保证安全性?清华团队提出安全探索均衡机制

近日清华大学于IEEE TPAMI发表论文,探讨了真机强化学习的安全性保障问题,提出了一套「安全探索均衡」新型机制,揭示了安全探索的理论最大边界,并攻克了其收敛性证明难题。

来自主题: AI技术研报
6500 点击    2026-06-24 16:03
斯坦福改变了LLM的生成顺序,Google把它做了出来。DiffusionGemma技术报告来了

斯坦福改变了LLM的生成顺序,Google把它做了出来。DiffusionGemma技术报告来了

斯坦福改变了LLM的生成顺序,Google把它做了出来。DiffusionGemma技术报告来了

Google DeepMind在6月份对外分享了DiffusionGemma的技术报告,明确指向了一条与现有主流完全不同的演进道路。当大家都在绞尽脑汁让大模型逐词吐字的速度变快时,谷歌干脆把生成顺序改了。

来自主题: AI技术研报
7353 点击    2026-06-24 09:54
如何使用 Codex,进行长程任务

如何使用 Codex,进行长程任务

如何使用 Codex,进行长程任务

这两天在赶工,鞭策 Codex 赶紧把 AGI Bar 的小程序弄出来,已经连续蹬了 80+ 小时了,预估再蹬 20 个小时就能蹬完

来自主题: AI技术研报
7577 点击    2026-06-23 16:46
SCI 论文配图 Prompt 怎么写?这篇直接抄

SCI 论文配图 Prompt 怎么写?这篇直接抄

SCI 论文配图 Prompt 怎么写?这篇直接抄

做科研的人应该都懂,论文配图真的很耗时间。

来自主题: AI技术研报
5532 点击    2026-06-23 15:03
你的AI正在「见人下菜」,亚马逊团队ACL高分论文,首次系统测评「记忆」如何影响LLM情商

你的AI正在「见人下菜」,亚马逊团队ACL高分论文,首次系统测评「记忆」如何影响LLM情商

你的AI正在「见人下菜」,亚马逊团队ACL高分论文,首次系统测评「记忆」如何影响LLM情商

近年来,个性化语言模型迅速普及。 从 ChatGPT、Claude 到各类垂直 agent,用户 “长期记忆” 功能也逐渐成为标配,它们被广泛部署在推荐系统、客户服务、情感陪伴等场景中。

来自主题: AI技术研报
9256 点击    2026-06-23 15:03