AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型
超越O4-mini,多模态大模型终于学会回头「看」:中科院自动化所提出GThinker模型

超越O4-mini,多模态大模型终于学会回头「看」:中科院自动化所提出GThinker模型

超越O4-mini,多模态大模型终于学会回头「看」:中科院自动化所提出GThinker模型

尽管多模态大模型在数学、科学等结构化任务中取得了长足进步,但在需要灵活解读视觉信息的通用场景下,其性能提升瓶颈依然显著。

来自主题: AI技术研报
5539 点击    2025-07-20 11:50
OpenAI核心研究员:比提示词工程更重要的,是spec-writing

OpenAI核心研究员:比提示词工程更重要的,是spec-writing

OpenAI核心研究员:比提示词工程更重要的,是spec-writing

程序员最有价值的技能已经不再是编写代码了,而是精确地向 AI 传达意图。一份完善的规范才是包含完整意图的真正「源代码」。

来自主题: AI资讯
5836 点击    2025-07-20 11:44
无需NeRF/高斯点后处理,视频秒变游戏模型成现实!新方法平均每帧仅需60秒 | ICCV 2025

无需NeRF/高斯点后处理,视频秒变游戏模型成现实!新方法平均每帧仅需60秒 | ICCV 2025

无需NeRF/高斯点后处理,视频秒变游戏模型成现实!新方法平均每帧仅需60秒 | ICCV 2025

只需一段视频,就可以直接生成可用的4D网格动画?!来自KAUST的研究团队提出全新方法V2M4,能够实现从单目视频直接生成高质量、显式的4D网格动画资源。

来自主题: AI技术研报
5452 点击    2025-07-20 11:21
真实物理加持,人物动画再也不像塑料人!UIUC华人让角色活起来了 | ICCV'25

真实物理加持,人物动画再也不像塑料人!UIUC华人让角色活起来了 | ICCV'25

真实物理加持,人物动画再也不像塑料人!UIUC华人让角色活起来了 | ICCV'25

PhysRig是UIUC与Stability AI联合提出的首个面向角色动画的可微物理绑定框架。通过将刚性骨架嵌入弹性软体体积,并使用Material Point Method(MPM)进行可微分物理模拟,PhysRig能够自然还原皮肤、脂肪、尾巴等柔性结构的变形过程,显著提升角色动画的真实感,解决传统LBS无法克服的体积丢失与变形伪影问题。

来自主题: AI技术研报
5897 点击    2025-07-20 11:13
AI「偷学」你的数据?6大顶级机构联手提出数据保护4大分级体系

AI「偷学」你的数据?6大顶级机构联手提出数据保护4大分级体系

AI「偷学」你的数据?6大顶级机构联手提出数据保护4大分级体系

你是否也曾担心过,随手发给 AI 助手的一份代码或报告,会让你成为下一个泄密新闻的主角?又或是你在网上发布的一张画作,会被各种绘画 AI 批量模仿并用于商业盈利?

来自主题: AI技术研报
6552 点击    2025-07-20 11:02
“AI登月时刻”,OpenAI模型摘取奥数金牌

“AI登月时刻”,OpenAI模型摘取奥数金牌

“AI登月时刻”,OpenAI模型摘取奥数金牌

OpenAI通用推理模型在国际奥数竞赛中达到金牌水平,解出5题得分35/42。模型通过新技术实现长时间复杂推理和自然语言证明,非专用系统。标志AI在创造性思考和科学研究的重大突破,为解决千年难题铺路。GPT-5即将发布但暂缺此能力。

来自主题: AI资讯
7417 点击    2025-07-20 10:23
马斯克AI女友直播「一秒变身」,世界首个实时AI扩散视频模型MirageLSD登场

马斯克AI女友直播「一秒变身」,世界首个实时AI扩散视频模型MirageLSD登场

马斯克AI女友直播「一秒变身」,世界首个实时AI扩散视频模型MirageLSD登场

世界首个实时AI扩散视频模型炸场,Karpathy亲自站台,颠覆AI视频交互,0延迟+无限时长,每秒24帧不卡顿,MirageLSD首次实现AI直播级生成。

来自主题: AI资讯
7032 点击    2025-07-19 12:28
庞若鸣交班陈智峰,苹果发布2025基础模型技术报告

庞若鸣交班陈智峰,苹果发布2025基础模型技术报告

庞若鸣交班陈智峰,苹果发布2025基础模型技术报告

Apple Intelligence 进入新的一章。 近日,苹果发布了 2025 年 Apple Intelligence 基础语言模型技术报告。

来自主题: AI资讯
5578 点击    2025-07-19 12:10
演讲生成黑科技,PresentAgent从文本到演讲视频

演讲生成黑科技,PresentAgent从文本到演讲视频

演讲生成黑科技,PresentAgent从文本到演讲视频

我们提出了 PresentAgent,一个能够将长篇文档转化为带解说的演示视频、多模态智能体。现有方法大多局限于生成静态幻灯片或文本摘要,而我们的方案突破了这些限制,能够生成高度同步的视觉内容和语音解说,逼真模拟人类风格的演示。

来自主题: AI技术研报
6296 点击    2025-07-19 11:31