贴说网 > 社会 > 正文

​A16Z独家投资,3D技术公司「Luma AI」完成4300万美元B轮融资

2024-01-14 19:57 来源:贴说网 点击:

A16Z独家投资,3D技术公司「Luma AI」完成4300万美元B轮融资

文 | 周鑫雨

编辑 | 邓咏仪

36 氪获悉,美国 AI 3D 创业公司「Luma AI」近日完成 4300 万美元 B 轮融资,由 A16Z 独家投资。

此前,Luma AI 已经完成了 2000 万美元的 A 轮融资,投资方包括 Amplify Partners、NVIDIA ( NVentures ) 、General Catalyst。

成立于 2021 年,Luma AI 是一家聚焦于 3D 内容生成的技术公司,提供 3D 内容生成和 3D 内容重建技术解决方案。

截至目前,Luma AI 已经推出了拍摄捕获 3D 图片和视频、Image to 3D(图片生 3D)、Video to 3D(视频生 3D)、Text to 3D(文字生 3D)等功能。基于 Luma AI 的技术,用户只需用一台手机,就可以短时间、低成本生成所需的 3D 模型。

Luma AI 的核心团队,拥有海外头部大厂和高校的履历。创始人兼 CEO Amit Jain 出身 Apple AR/VR 部门,在 3D 计算机视觉、深度技术产品等方面有丰富经验。创始人兼 CTO Alex Yu 毕业于 UC Berkeley,曾与人工智能研究实验室教授 Angjoo Kanazawa 共同进行 NeRF(Neural Radiance Fields,神经辐射场)相关的 3D 计算机视觉研究。

今年,来自 Nvidia 和斯坦福大学的 Jiaming Song,来自 UC Berkeley 人工智能实验室、NeRF 论文作者之一的 Matt Tancik,分别加入 Luma AI,担任首席科学家和应用研究团队的负责人。

随着技术的开源和更多玩家的涌入,3D 内容生成行业的竞争也愈发激烈。对于 3D 行业而言,企业真正的 " 护城河 " 则在 3D 数据。

相较于文本和 2D 图像数据,可供训练的 3D 数据并不多,而经过标注和语义匹配的 3D 数据则更为稀缺。目前普遍的解决方案是利用 2D 扩散生成模型来指导 3D 表示的优化,从而实现 3D 内容生成。

所谓的 NeRF 技术,是 Luma AI 构建 3D 内容的核心。这一套最初由 UC Berkeley 和 Google 发布的深度学习系统,可以基于少量的 2D 图像,对 3D 场景的几何形状和外观进行建模。

Luma AI 增长负责人 Barkley Dai 告诉 36 氪,基于 NeRF 和 Gaussian Splatting 3D 重建技术,Luma AI 可以基于 2D 图像数据快速构建高质量 3D 数据,用于机器学习和算法训练。

减少生成高质量 3D 内容所需的算力资源和时间,则是 AI 3D 生成技术落地的关键。自今年以来,Text to 3D 所耗时长已经从小时级,缩减到了分钟级。

2023 年 11 月,Luma AI 在 Discord 上发布了最新 Text to 3D 工具 Genie,则将 Text to 3D 所耗时长缩减到秒级。基于大量 3D 形状、结构和场景数据进行深度神经网络训练,Genie 建立了对语义和 3D 空间几何对应关系的理解能力。

Genie 3D 内容生成效果。

Genie 重建鞋子 3D 模型的效果。

根据输入的自然语言提示词,Genie 可在 10 秒左右的时间生成相应的 3D 模型,并提供可下载的 GLB、OBJ 和 FBX 等 3D 数据的标准化文件格式。Barkley 告诉 36 氪,目前市面上极少有厂商能做到 10 秒级的 3D 内容生成时间。

Genie 使用页面。

在 Jain 看来,所有视觉生成模型的推理和生成过程都要基于对 3D 现实场景的理解,互联网的视觉呈现是降维到 2D 后的表达成果。而随着 XR 等内容载体的发展,3D 内容生成落地的场景也远不止游戏和影视,而是将成为消费级的内容生产和表达形式。

欢迎交流!