ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
2D图纸分分钟转3D模型!杭州独角兽补齐空间智能关键一环,现公开两大技术引擎
8746点击    2024-11-22 10:14

李飞飞谈到的空间智能,被这家中国独角兽补上关键一环。


群核科技,来自浙江杭州,目前估值超百亿元。


他们致力于打造物理世界的模拟引擎,并且将其运用在大模型具身智能训练、实时设计渲染、工业生产制造等场景中。


被大多数人熟知的,是3D空间设计平台酷家乐,正是他们的核心产品。目前产品已沉淀了超3.2亿的3D模型,平均每月活跃访问者达7780万。



在最新「酷+科技峰会」上,他们首次公开了产品背后的两大技术引擎:



  • 启真(渲染)引擎:基于云端实时渲染、光线追踪等技术达到逼真渲染效果,实现所谓的「所想即所见」。它能渲染物理世界99%的材质,并能完成对人、山川河流等复杂形态的模拟。

  • 矩阵(CAD)引擎:给一张2D设计图纸,就能分分钟给你转化成3D模型,并且都是符合物理真实的参数化数据,也就是「所见即所得」。背后的多模态CAD大模型是群核自主研发的百亿级参数模型,可以实现对空间更精准的结构化表述。



除此之外,还发布了群核空间智能平台SpatialVerse,专门面向具身智能、AIGC等领域开放空间智能训练相关服务。


公开两大技术引擎


此次,群核科技公布两大技术引擎,分别是群核启真渲染引擎(KooRender)和群核矩阵引擎(KooCAD)。


启真渲染引擎KooRender,简单来说,它解决的是将人们脑海中对空间的想象,实时在数字世界中构建出来,并保持它在3D可视化维度的物理正确性。



目前已经迭代至3.5版本,实时渲染速度已经提升至6秒到2秒,这就能让设计和渲染同时发生。


另外结合AIGC能力,渲染拓展到了更多以前CG技术很难触达的复杂领域。比如毛发、人体、山川、特殊材质等。



这样一来,很多场景的关键痛点就能得到解决。创始人兼CEO陈航列举了跨境电商这一个例子。


很多中国产品拿到海外卖,你要说老外能听得懂的语言,比如能拍出场景图售卖你的沙发,但实拍周期成本很高,还需要经常上新。但PS又或者AIGC生成的产品,无法保证逼真度。


渲染引擎赋能下不限制品类一键就可以出图,还是有场景、有模特的那种。以往需要两周的工作量,一天就可以完成。


现场董事长黄晓煌表示:


我们的定位是未来你用得到相机的地方,可能有一天你不想拿着一个物理相机拍的时候,可以用到我们的。


另一个矩阵(CAD)引擎。它是通过群核科技几何参数化引擎、BIM引擎和多模态CAD大模型三大技术,来实现物理正确的3D结构化数据的识别和生成。



首先,它把真实世界中各种对于空间的信息,比如说图片、图纸、户型图各种图纸,视频采集信息收集过来,灌注到矩阵引擎里面,结合商家的输入,形成了物理空间方案,但是核心是参数驱动。再通过BIM引擎对接生产和施工,再回到物理世界落地,所以形成这么一个增强化的闭环。


比如输入一张CAD图纸,它就能自动识别并生成一套3D空间的解决方案。




除此之外,群核科技资深副总裁吴锴亮发布了群核生态开放平台,其中包括面向空间智能技术训练需求的新产品:


群核空间智能平台


它可以为AIGC、具身智能、AR/VR等企业开放物理正确的3D空间数据资产以及空间认知解决方案。


该平台拥有全球最大的室内场景认知深度学习数据集,并具备模拟室内真实特性、自动分割标注、场景增强及多平台对接等核心能力。


构建起物理世界与数字世界的桥梁


群核科技于2011年创办,三位创始人黄晓煌、陈航和朱皓都是UIUC的研究生。


其中董事长黄晓煌、CEO陈航还是本科浙江大学竺可桢学院的同学;而CTO朱皓本科则毕业于清华大学计算机系。


他们专注于计算机图形学、高性能计算等方向,在创办群核之前,曾在英伟达、微软、亚马逊等科技巨头工作。其中黄晓煌就参与英伟达CUDA平台的开发。


当时他们用低价显卡集合成一个端云协同的高性能GPU集群,并通过优化算力资源的调度策略,大幅度提升GPU利用率。


进一步为了顺应市场,他们基于高性能计算GPU做了物理正确的光追渲染,原本需要一小时出的效果图,他们压缩到10秒。


他们首先瞄准的家居家装行业,也就是后来诞生的酷家乐平台。


也正因为这样深厚的学术背景和技术实力,十几年发展以来始终收到资本市场的青睐。


公开信息显示,群核科技截至2021年累计获得8轮融资,估值超20亿美元。投资方包括高瓴、IDG、顺为、GGV领投、经纬中国等一众知名投资机构。


而现在,随着生成式AI的出现、技术引擎驱动以及行业know-how的累积,他们瞄准了更广阔的领域和场景——


那就是构建起物理世界与数字世界的桥梁



一方面,生成式AI的引入,解决了物理渲染世界的行业痛点。


以往基于有机物或者对于复杂材质和形态的图形渲染,比如人脸皮肤、山川等,很难通过物理方程进行描述清楚,因此基于计算机图形学技术很难渲染得真实;但现在引入AI的学习和预测能力,AI通过训练学习物理方程,能够实现超真实的渲染效果。


另一方面,本身基于3D引擎和酷家乐产品积累的大量3D合成数据,成为空间智能的“关键养料”。


这里面其实有两个点值得关注,解决了当前数据层的核心挑战。


一个是这些数据都是符合物理世界规律的,可以帮助具身智能理解真实世界。这是以前酷家乐交付给消费者的渲染图,都一定是符合现实标准和生产工艺的。


另一个则是合成数据天然规避掉了数据隐私安全的风险,并且由于可控可选择场景可以生成各式各样的3D数据。


基于此,群核可能也是目前国内唯一一家能够提供海量物理3D数据的公司。


事实上,不少主流的具身智能、机器人厂商已经是他们的客户。


据透露,今年他们已经开始实现盈利。


未来,关于「世界模拟器」的发展,黄晓煌表示时间上不好预估。


但从三要素来看,现在算力确定了,数据这方面群核认为也是确定的。最不确定的就是算法。这需要科研人员持续的创新实践。


也就是说,算力数据已具备,只差算法这个东风了。


文章来自于“量子位”,作者“白小交”。


关键词: AI , AI 3D , 酷家乐 , 人工智能
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI数据分析

【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。

项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file

本地安装:https://www.deepbi.com/

【开源免费airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。

项目地址:https://github.com/hitsz-ids/airda