大规模3D场景2分钟生成,效率提升30倍!中科院发布空间智能新框架 | AAAI 2025

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
大规模3D场景2分钟生成,效率提升30倍!中科院发布空间智能新框架 | AAAI 2025
7112点击    2025-01-02 14:26

「空间智能」和「世界模型」是最近学术界和产业界非常火热的研究方向,走向虚实结合、模拟世界机理的关键一步,就是创造出一个生动的虚拟世界。


然而,想要打造丰富多样、充满细节,同时具备高度可编辑性和物理真实性的3D虚拟世界,仍然困难重重。


为了解决这些难题,来自中国科学院自动化研究所和北京科技大学的联合团队,首次提出了一种全新的3D场景生成框架SceneX,只需简单的文字描述,就能快速生成高质量的3D虚拟场景。


不论是辽阔的自然风景,还是充满活力的城市街道,模型都能轻松应对。


大规模3D场景2分钟生成,效率提升30倍!中科院发布空间智能新框架 | AAAI 2025

网站:https://zhouzq1.github.io/SceneX/

论文:https://arxiv.org/abs/2403.15698


更重要的是,SceneX还能根据需求灵活调整,让场景更贴合用户设想。


有了SceneX,虚拟世界的构建也会更轻松,简单且高效。


SceneX开启高效、逼真场景生成新时代


SceneX以创新的方式打破传统局限,全面提升效率与真实感,主要包括两个核心模块:


PCGHub:通过集成多种程序化生成模块并封装为标准化API,PCGHub提供了一个灵活的平台,解决单一生成模块因固有算法和规则受限而导致的局限性,大幅扩展了资源生成的多样性和灵活性。


PCGPlanner:作为智能规划器,PCGPlanner高效协调PCGHub的资源完成场景生成。其全自动化流程包括场景分解、地形生成、资产生成与检索、资产放置等阶段。通过模块化设计,确保生成结果的连贯性与几何一致性。


相比传统方法需要数周完成的大规模场景建模,SceneX将时间压缩至数小时,同时支持通过简单的文字指令精确控制场景的细节。SceneX的跨模态协同能力,赋予场景生成前所未有的灵活性与可控性。


大规模3D场景2分钟生成,效率提升30倍!中科院发布空间智能新框架 | AAAI 2025

图1:SceneX可根据文本指令自动生成大规模3D自然场景或城市。生成的模型具备精细的几何结构、真实的材质纹理和自然的光照效果,可无缝应用于工业流程


大规模3D场景2分钟生成,效率提升30倍!中科院发布空间智能新框架 | AAAI 2025


大规模3D场景2分钟生成,效率提升30倍!中科院发布空间智能新框架 | AAAI 2025


大规模3D场景2分钟生成,效率提升30倍!中科院发布空间智能新框架 | AAAI 2025


大规模3D场景2分钟生成,效率提升30倍!中科院发布空间智能新框架 | AAAI 2025


大规模3D场景2分钟生成,效率提升30倍!中科院发布空间智能新框架 | AAAI 2025


大规模3D场景2分钟生成,效率提升30倍!中科院发布空间智能新框架 | AAAI 2025


大规模3D场景2分钟生成,效率提升30倍!中科院发布空间智能新框架 | AAAI 2025


大规模3D场景2分钟生成,效率提升30倍!中科院发布空间智能新框架 | AAAI 2025


大规模3D场景2分钟生成,效率提升30倍!中科院发布空间智能新框架 | AAAI 2025


PCGHub:多样化程序化资产与布局生成平台


场景的多样性离不开资产的多样性。


为此,PCGHub提供了一个集成丰富程序化生成模块和3D资产的平台,旨在解决传统方法的局限性并提升内容真实感。


PCGHub提供了172个涵盖自然环境、建筑等多领域的程序化资产,并配备了散射、网格、线性等多种灵活的布局生成器,使开发者能够轻松创建丰富多样的3D场景。


大规模3D场景2分钟生成,效率提升30倍!中科院发布空间智能新框架 | AAAI 2025

表1:PCGHub中各元素功能概览


这些资产可通过调整几何和材质参数实现多样化变化。


从2,362个原始参数中提取了263个核心参数,并封装为标准化API,每个API配有详尽文档,包括功能描述和参数规格,方便用户调用和扩展。


此外,PCGHub还包含11,284个高质量3D静态资产,极大地丰富了资源库的多样性。


PCGHub的推出,为生成多样化且真实感强的场景提供了高效而灵活的解决方案。


大规模3D场景2分钟生成,效率提升30倍!中科院发布空间智能新框架 | AAAI 2025

图2:某个树木程序化生成模块的API文档、API功能及生成结果示例


PCGPlanner:智能场景生成与布局规划


PCGPlanner利用PCGHub提供的资源,实现高效的自动化场景生成。整个生成过程包括四个关键阶段:


(1)场景分解:根据用户需求分析场景并列出所需资产;


(2)地形生成:构建基础地形并应用适当的材质;


(3)物体生成与检索:根据需求生成或导入场景所需的资产;


(4)资产放置:根据不同的布局类型和程序化生成器,在场景中安排资产。


大规模3D场景2分钟生成,效率提升30倍!中科院发布空间智能新框架 | AAAI 2025

图3:SceneX框架通过四个阶段将用户文本输入转换为不同的3D场景:场景分解阶段、地形生成阶段、物体生成和检索阶段以及资产放置阶段


一系列实验验证了SceneX在质量、效率和场景编辑上的全方位优势。主要成果如下:


1.用户与专家一致好评


在对场景质量进行评分时,邀请了用户和专业设计师参与测试。


结果表明,SceneX生成的场景获得了用户和专家的一致认可,评分结果几乎持平。


这意味着,无论是普通用户还是行业专家,都对SceneX生成的场景赞不绝口。


大规模3D场景2分钟生成,效率提升30倍!中科院发布空间智能新框架 | AAAI 2025

表2:美学平均得分(AS)和美学专家平均得分(AES)的比较分析


大规模3D场景2分钟生成,效率提升30倍!中科院发布空间智能新框架 | AAAI 2025

图4:不同场景下个性化编辑结果的可视化


大规模3D场景2分钟生成,效率提升30倍!中科院发布空间智能新框架 | AAAI 2025

图5:SceneX场景生成效果对比

2.所见即所得的精准还原


通过提示词与场景匹配度评估,SceneX展现了卓越的语义理解和生成能力。


无论是静谧的河边风光,还是繁华的城市景象,SceneX都能完美复现用户想象,实现「所见即所得」。


大规模3D场景2分钟生成,效率提升30倍!中科院发布空间智能新框架 | AAAI 2025

图6:大规模场景和城市生成结果

3.效率无与伦比


时间就是一切,而SceneX让场景生成变得又快又准。


实验结果显示,生成一片壮丽的自然景观只需要短短几分钟,打造一座大型城市也快得令人惊讶。


大规模3D场景2分钟生成,效率提升30倍!中科院发布空间智能新框架 | AAAI 2025


结语


SceneX框架展示了程序化内容生成与多Agent工作流结合的巨大潜力,为大规模场景生成提供了全新的解决方案。


通过其强大的可控性和高质量的生成能力,SceneX为虚拟世界构建、游戏开发、影视制作等领域开辟了新的可能性。


未来,SceneX将进一步优化生成过程,为用户提供更加高效便捷的场景生成体验。


参考资料:


https://arxiv.org/abs/2403.15698


文章来自微信公众号“新智元”


大规模3D场景2分钟生成,效率提升30倍!中科院发布空间智能新框架 | AAAI 2025

关键词: AI , 空间智能 , AI 3D , SceneX
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费)


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/(付费)

2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0