港大&amp 上海AI 3D版裁缝开源来袭!Tailor3D 自定义3D编辑和资发生成

  • 电脑网络维修
  • 2024-11-15

文章链接:链接:

亮点直击:

3D AIGC(人工智能生成内容)的最新停顿展现了间接从文本和图像创立3D对象的后劲,在动画和产品设计中带来了清楚的老本浪费。但是,详细编辑和定制3D资产依然是一个常年存在的应战。详细来说,3D生成方法在遵照精细的指令方面还不可像2D图像生成那样准确。构想一下,你可以经过3D AIGC获取一个玩具,但其硬件和装璜或者不合乎你的希冀。为了处置这个疑问,本文提出了一种名为的新型pipeline,可以迅速从可编辑的双面图像中创立定制的3D资产。本文的指标是模拟裁缝的才干,能够部分扭转对象或口头全体格调迁徙。与从多个视角创立3D资产不同,经常使用双面图像消弭了编辑单个视角时发生的堆叠区域抵触。

详细而言,它首先编辑正视图,而后经过多视图分散生成对象的背视图。之后,再编辑背视图。最后,提出了一种 双面LRM ,用于无缝地将前后3D特色拼接在一同,就像裁缝将衣服的前后部分缝合在一同。双面LRM批改了前后视图之间的不完美分歧性,增强了编辑才干,缩小了内存累赘,同时经过LoRA Triplane Transformer将它们无缝集成到一致的3D示意中。试验结果标明,Tailor3D在各种3D生成和编辑义务中都有效,包含3D生成填充微格调迁徙。它提供了一种用户友好且高效的3D资产编辑处置打算,每一步编辑只有几秒钟即可成功。

方法

本节引见Tailor3D的pipeline和模型架构。首先,引见大规模重建模型(LRM)和多视图分散。接上去,概述了Tailor3D的环节,展现了2D编辑和极速重建3D对象的方法。再深化讨论了双面LRM,解释如何处置输入的前后视图不齐全分歧的疑问。还解释了LoRA Triplane Transformer如何缩小内存经常使用以及视点交叉留意力如何融合前后视图的3D三平面。

初步

Tailor3D的pipeline

本节概述了Tailor3D的pipeline,如下图1下部所示。

关于自留意力,qkv由共享线性层生成,将一切输入和输入线性层交流为LoRA结构。关于交叉留意力,qkv由不同的线性层生成,将一切qkv和输入线性层交流为LoRA结构。详细细节如下。

这里,i示意第i个Transformer层。关于自留意力,tp示意输入和输入的线性投影。关于交叉留意力,tp示意q、k、v和输入的线性投影。

试验

数据集:Gobjaverse-LVIS

成功细节

试验结果

试验展现了Tailor3D在3D生成方面的才干,包含几何对象填充、纹理分解微格调迁徙。前面将本文的方法与现有技术启动了比拟。并启动了消融试验,以验证Tailor3D的每个模块。

Tailor3D运行

展现了其在3D生成几何/图案填充方面的多配置性,涵盖部分几何状态和纹理图案填充。突出了其格调迁徙和融合才干,准许启动如格调转移和将两种格调融合到一个对象上的操作。Tailor3D经常使用户能够编辑对象的侧面和反面,裁减了定制3D对象的编辑或者性。

3D生成几何/图案填充 。在这里,展现了Tailor3D的部分3D对象填充才干,如下图4所示。经过文本或图像揭示逐渐展现对象填充和编辑。在第2行,从盔甲开局,经过逐渐增加头部、手和斗篷生成了一个中世纪将军。第3行展现了其余对象的操作,包含增加邮箱、气球、花丛和篮球框。

3D格调迁徙和融合 。Tailor3D还展现了其对各种格调的转移和融合才干。与以往的方法不同,Tailor3D确保了常识产权的完整性,同时提供了经过图像或文本指点指定格调的灵敏性。特意是,它应用Midjourney启动2D图像生成和编辑。此外,Tailor3D能够将不同的格调注入到对象的侧面和反面,展现了双面LRM的融合才干的有效性。

与现有的3D图像到3D生成方法的比拟

将本文的方法与Wonder3D、TriplaneGaussian和 LGM在由Stable Diffusion生成的100张图像的测试集上启动了比拟。下图5中的定性结果展现了Tailor3D应用双面LRM增强反面消息的才干。

Wonder3D和TriplaneGaussian在处置复杂对象时体现不佳,全体品质较低。经常使用高斯示意的LGM存在重影效应,并且在树叶等特色上不足细节。下表1中提供了定量结果以及生成期间,突显了本文方法的适用价值。

消融钻研

对双面LRM启动了消融钻研,重点关注三个方面:双面3D特色的融合、LoRA Transformer的等级,以及前后图像的外部相机参数。结果如下表2所示。

双面特色融合方法 。经常使用视点交叉留意力来融合前后两面的特色。此外,尝试经常使用多层2D卷积层和间接相加来融合双面的三平面特色。结果标明,经常使用视点交叉留意力发生了最佳成果。

LoRA三平面Transformer的等级 。对LoRA三平面Transformer的等级启动了消融试验,区分设置为2、4和8。试验结果标明,等级为4时性能最佳。

限度与论断

本文引见了Tailor3D,这是一种经过可编辑的双面图像极速创立定制3D资产的方法,相似于裁缝的上班模式。经过应用2D图像编辑技术和极速3D重建,Tailor3D准许用户对对象启动迭代性地调整。双面LRM和LoRA三平面Transformer充任“裁缝”,无缝地将前后视图结合起来,处置不分歧性并提高重建品质。试验结果验证了Tailor3D在3D生成填充微格调定制等义务中的有效性。它提供了一个用户友好、老本高效的处置打算,用于极速的3D编辑,适用于动画、游戏开发等畛域,简化了消费环节并使内容创作愈加遍及。

限度与未来方向 但是,仅依赖前后视图启生物体重建或者会遇到某些厚度的物体带来的应战。此外,生成的3D物体网格或者具备较低的分辨率,增加的几何特色或者对网格的变动不大。将在未来的上班中进一步钻研处置厚侧轮廓物体的生成与重建疑问的方法,旨在提高网格的品质和分辨率。

原文链接:​ ​​ ​

  • 关注微信

本网站的文章部分内容可能来源于网络和网友发布,仅供大家学习与参考,如有侵权,请联系站长进行删除处理,不代表本网站立场,转载联系作者并注明出处:https://duobeib.com/diannaowangluoweixiu/5877.html

猜你喜欢

热门标签

洗手盆如何疏浚梗塞 洗手盆为何梗塞 iPhone提价霸占4G市场等于原价8折 明码箱怎样设置明码锁 苏泊尔电饭锅保修多久 长城画龙G8253YN彩电输入指令画面变暗疑问检修 彩星彩电解除童锁方法大全 三星笔记本培修点上海 液晶显示器花屏培修视频 燃气热水器不热水要素 热水器不上班经常出现3种处置方法 无氟空调跟有氟空调有什么区别 norltz燃气热水器售后电话 大连站和大连北站哪个离周水子机场近 热水器显示屏亮显示温度不加热 铁猫牌保险箱高效开锁技巧 科技助力安保无忧 创维8R80 汽修 a1265和c3182是什么管 为什么电热水器不能即热 标致空调为什么不冷 神舟培修笔记本培修 dell1420内存更新 青岛自来水公司培修热线电话 包头美的洗衣机全国各市售后服务预定热线号码2024年修缮点降级 创维42k08rd更新 空调为什么运转异响 热水器为何会漏水 该如何处置 什么是可以自己处置的 重庆华帝售后电话 波轮洗衣机荡涤价格 鼎新热水器 留意了!不是水平疑问! 马桶产生了这5个现象 方便 极速 邢台空调移机电话上门服务 扬子空调缺点代码e4是什么疑问 宏基4736zG可以装置W11吗 奥克斯空调培修官方 为什么突然空调滴水很多 乐视s40air刷机包 未联络视的提高方向 官网培修 格力空调售后电话 皇明太阳能电话 看尚X55液晶电视进入工厂形式和软件更新方法 燃气热水器缺点代码

热门资讯

关注我们

微信公众号