几何更干净、细致,工作流更合理,Meshy的3D生成能力又进化了,所有人都可以免费试用。
天命人,你现在已经到哪儿了?
毫无疑问,不论是朋友圈还是各个网络平台,这两天最火的是《黑神话:悟空》。
哪怕你平时根本不玩游戏,也可能因为破纪录的销售额,或者全网刷屏的「自来水」,而关注到这个被誉为「创造了中国游戏历史」的超级大作。
不过《黑神话:悟空》首次出圈,是因为一支实机演示视频。这支拥有近六千万播放量的预告片,宣告着在西方文化主导的游戏行业,中国玩家即将迎来他们梦寐以求的根植于中国文化的英雄主角。
而预告片中直击人心的视觉效果,无疑是《黑神话:悟空》大爆的直接原因。无论是对每个小怪形象的精心设计,还是庙宇之中精美的雕塑与建筑,游戏科学对视觉效果的雕琢,都做到了极致。
想把猴哥从这样的一张原画,变成能在游戏中施展「72 变」的 3D 对象,中间要经过建模、渲染、优化等繁琐流程。
从原画到建模
相比人物,场景建模更为复杂,《黑神话・悟空》的美术总监杨奇在采访中曾表示:一些场景建筑的原型需要到实地去考察和研究,形成自己的数字资产,再经过长达数月加工和美化,最后才能呈现出如此精美的画面。在扫描第一版重庆大足石刻时,建模一度达到夸张的「12 亿个面」,可见背后耗费的工作量何其巨大。
虽然这种工作量的人工精度难以企及,但 AI 工具的建模效果也已经足够能打。想要得到下图这样的建模效果只需要 1 分钟。铁甲上的花纹清晰分明,边缘也没有模糊和闪烁的迹象。
只需要选择雕塑风格,再输入「Black Myth:Wukong」与对应的角色,不需要高配置的电脑,直接就能得到接近游戏风格的 3D 对象:
这款 3D AIGC 工具来自一家创业公司 Meshy 。公司联合创始人兼 CEO 胡渊鸣是计算机图形学知名学者,毕业于清华大学姚班,MIT 博士,也是「太极」(TaiChi)编程语言作者。
截至目前,Meshy 已经更新到了第 4 代。从 2023 年 11 月登场,Meshy 就以快速、保真、操作简易走在行业前列。Meshy 3 在提升文生 3D 的真实感,以及图生 3D 模型的自然度与细腻度都往前迈了一步。这次的 Meshy 4 又带来了哪些新的进展呢?
干净、充满细节的几何网格
在 Meshy-4 中,胡渊鸣团队突破了 3D AI 生成的一些技术难题,无论你是使用文本到 3D 还是图像到 3D,现在都能体验到生成模型的几何质量大幅提升。
通过改进的生成算法,Meshy-4 生成的 3D 模型具有非常干净的硬表面,没有以前版本中困扰生成结果的凸起和凹痕。
此外,Meshy-4 生成的几何细节也得到大大增强,允许使用者创建高度复杂的模型,捕捉以前 AI 生成的模型无法捕捉到的细微差别。
团队还更新了「发现」页面,以配合 Meshy-4 的模型质量增强功能。更新之后,当你将鼠标悬停在 Meshy-4 生成的模型上时,你可以立即显示其无纹理版本。如此一来,你可以仔细检查模型的底层几何形状,看到 Meshy-4 改进算法提供的干净坚硬表面和复杂细节。
新的文本到 3D 工作流
Meshy-4 用户交互界面中最大的更新是新的文本到 3D 工作流。在以前的版本中,文本到 3D 过程分为粗略阶段(Coarse stage)和细化阶段(Refine stage)。虽然这种方法旨在逐步提高模型质量,但它经常让用户对最终结果感到不确定,Meshy 团队收到了大量关于细化模型偏离粗略结果的用户反馈。
因此,在 Meshy-4 中,他们以一种更独特和专注的方式将「文本到 3D」分割为两个步骤:建模和纹理。
Meshy 团队表示,这个新的文本到 3D 工作流也为后续专注于建模或纹理的新功能铺平了道路。二者的分离能够让使用者更方便地控制生成结果,例如在生成纹理之前编辑网格或为同一模型自定义多种颜色变体。
一次不行,再试一次
有人说现在的 AI 生成就像抽卡游戏,很难知道哪次能抽到好的结果。因此,Meshy 团队在新版本中加了一个「重试」功能。
即使你的纹理已经生成好了,「重试」也是可以用的。但需要注意的是,点击「重试」之后,之前的结果会被丢弃,因此最好慎重一些。
由于重试涉及更多的计算资源,该功能被设定为仅订阅用户可用。对于每个模型:
在之前发布的 Meshy-3 Turbo 中,团队引入了一个用于文本到 3D 生成的模型选择器,它允许使用者在 Meshy-3 和 Meshy-3 Turbo 算法之间切换。Meshy-4 进一步扩展了此功能,你可以在下面的选项中选择文本到 3D 和图像到 3D 任务中的生成模型。
另外,在新版本中,图像到 3D 中的「Mode」选项已被替换。这是因为它与底层模型完全对应:有机模式(Organic Mode)由 Meshy-3 Turbo 驱动,而坚硬表面模式(Hard Surface Mode)由 Meshy-4 驱动。
胡渊鸣与 Meshy 团队
Meshy 是胡渊鸣创立的一家初创公司,主要研究如何用 AI 生成更好的 3D 资产。
胡渊鸣是计算机图形学知名学者,毕业于清华大学姚班。
2019 年,在 MIT 读博期间,他主导开发了一个名为「太极」(Taichi)的开源计算机图像库,在计算机图形学领域引发广泛关注。2021 年 3 月,他通过了 MIT 电气工程与计算机科学博士论文答辩,之后回国创业,创立了名为「太极图形」的公司。该公司在成立不到一年的时间里就完成了两轮融资,包括 5000 万美元的 A 轮融资。
2023 年 11 月,胡渊鸣的全新创业项目 Meshy 曝光。新公司打造的在线生成 AI 工具(初版 Meshy )只需一分钟,即可使用 Al 生成 3D 内容(模型)。在之后的几个月里,这个工具迅速迭代,如今已经迎来第四个大的版本。
据悉,Meshy 团队成员遍布全球,来自 MIT、哈佛大学、英伟达、谷歌、 Meta 等知名机构。他们希望通过提供一种直观、轻松的内容创建方式,彻底改变当前 3D 内容制作生态系统。
不过,他们也清楚,罗马不是一天建成的。所以他们从未设想未来会有一劳永逸的 AI 完全取代艺术家和设计师的工作。他们更希望自己打造的工具能成为增强创造力的工具,推动想象力的边界。
参考链接:https://www.meshy.ai/zh/blog/meshy-4-break-grounds
文章来源“机器之心”,作者“机器之心”
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)