Learning beyond human expertise with generative models for dental restorations

ZhuYuanxiang 2023-02-22 09:57:49
Categories: Tags:

#! https://zhuanlan.zhihu.com/p/567762676

在牙体修复中生成式的学习模型超越人类技术人员

Hwang J J, Azernikov S, Efros A A, et al. Learning beyond human expertise with generative models for dental restorations[J]. arXiv preprint arXiv:1804.00064, 2018.

摘要

计算机视觉已经取得了长足的进步,许多识别方法(如:物体识别)已经在现实中被广泛应用。我们提出了另一个令人激动的发展方向,利用生成模型满足医疗产品大规模定制化需要,例如:牙冠生成。在牙科行业,技师需要接受数年的培训才能设计出人造牙冠,用于恢复缺失牙齿的功能和完整性。每个牙冠都需要为每位患者量身定制,即使有计算机辅助设计软件的支持,也需要专业人士在时间和体力付出巨大代价。我们开发了一个完全自动化的方法,不仅可以从人类设计好的牙冠中学习,还可以从相对牙齿之间的自然空间轮廓中学习。而后者对于咬合与咀嚼功能非常重要,但是技术人员又很难解释清楚。基于生成式对抗网络(Generative Adversarial Network,GAN)的结构,利用缺失牙深度扫描信息和相对牙深度扫描信息,对于需要定制的填充牙冠,我们的深度学习模型可以预测它的深度扫描信息。我们建议在学习过程中混合附加的空间约束和统计的相容性。在形态的良好性与功能性方面,我们的自动设计超过了人类技术人员的标准,我们的算法正在经历生产环境的测试。

关键词

计算机辅助设计,大规模定制,自动设计的学习,条件图像生成,生成模型

Ch01 介绍

计算机视觉在许多判别式方法中已经取得了显著的进步,如:目标检测、目标识别和语义分割,并且现在已经成功地部署在实际应用中。侧重于生成逼真图像的生成式方法还主要停留在研究领域。我们首先提出了一种生成式模型,这个模型主要应用于大规模定制医疗产品,特别是在牙体修复领域。

在牙体修复中,牙医首先清除病人牙齿中龋坏的部分,然后利用口腔内的3D扫描仪对处理好的牙齿及其周围的结构进行物理的或者数字的印模,捕获的数据用于生成完整的牙冠或者嵌体。

image-20210929132814173

图1:牙冠设计阶段图解。图的上面显示了预备颌骨、对侧颌骨、冠填充修复体的3D模型,图的下面显示了特定平面的2D深度图。间隙距离是从相对咬合中计算得出。

成功实现牙齿修复必须满足一些要求:

  1. 必须完全适合病人的齿列;
  2. 必须提供咀嚼功能;
  3. 应该拥有一个美观的形状。

在过去的十年中,计算机辅助设计(CAD)技术被引入到牙科行业,极大地促进了这些需求的实现。然而,在当前的流程中依然需要人工协助。牙科CAD通常是基于一个预定义的理想牙齿模型的模板库,将模板的模型放在处理好牙齿的位置,然后根据患者的解剖结构进行调整。在图1所示的牙体修复过程中,设计师需要评估冠的情况,并且手动进行调整。

为了建立一套自动化的牙科CAD系统,需要将人类的专业知识集成到软件中。
一种方法是建立一套可以理解的规则集,集合中包含了有经验的牙科专业人士所知道的所有细微差别,并且采用机器能够理解的方式表达出来。这项任务非常繁琐,而且只有在能够提供这组规则的时候才是可行的。
另一种方法是构建一个能够从大量示例中学习的系统,而无需制定显性的规则。

我们遵循后一种数据驱动的深度学习方法,并且将牙体修复任务定义为条件图像预测问题。我们将三维扫描结果表示为给定平面的二维深度图像。以处理好的缺失冠的牙齿的深度图像作为输入条件,以技术人员设计的填充冠的深度图像作为基准的真实输出预测。也就是说,我们可以从技术人员那里学习,并且通过一个将一个图像转换成另一个图像的深度网络来捕捉人类的设计专长。

然而,技术人员除了试错外没有好的解决方案,例如:如何在牙齿表面设计自然的沟槽,如何基于对面牙齿制作几个接触点以支持正确地咬合与咀嚼。

我们的工作中激动人心的方面是,在牙体修复方面,通过从大数据中学习自然拟合约束,我们可以超越人类的专业知识。对于理想的牙冠,我们建议混合硬性的和软性的功能约束:前者捕捉了物理可行性,即不允许将牙冠穿透到对侧颌;后者捕捉了存在于相对的双颌之间的自然空间间隙的统计数据,即适当的咬合和咀嚼需要一定的稀疏接触。

我们使用 GAN 模型来完成条件图像预测任务,新颖的学习损失使得该模型强化了功能约束,超越了人类专家所能达到的边界。我们对比了自动化预测和技术人员的设计,并且成功地对该领域从业者感兴趣的一些指标进行了评估。我们通过了最终的现场测试,并且算法正在经历实际的生产检验。

Ch02 相关工作

生成模型

在计算机视觉领域对自然图像的分布建模是研究热点,提出了许多方法来解决这个问题,例如:受限的 Boltzmann 机[^11]、自动编码器[^12][^13]、自回归模型[^14]和 GAN[^8]。

变分自编码器[^15]通过对隐分布的再参数化进行训练来捕获分布的随机性。自回归模型是有效的,但是受逐像素生成图像的影响,其推理过程速度缓慢。

另一方面,GAN[^8],将基于低维分布中采样获取的随机值作为输入,通过单个前馈通道生成图像。GAN 引入了一个判别器,它的工作是区分真实样本和由生成器产生的假样本 。最近,GAN在这个任务上的主要成功案例[^18][^19][^20][^21][^22][^23][^24][^25][^26][^27][^28]。

条件图像生成

上面提到的所有方法都很容易条件化。例如:条件化 VAE[^29]与条件化自回归模型[^16][^17]都已经展示了令人期望的结果[^30][^31][^32]。先前的工作使得条件化 GAN[^9]可以处理各种图像到图像的生成问题。在先前的工作中,基于输入与输出之间的空间对应关系的设置,图像到图像的条件化 GAN(Pix2Pix)[^6][^37][^38]的模型质量得到大幅提升。

统计特征

统计特征可以追溯到手工特征,例如:词袋[^39]、Fisher 向量[^40]、二阶池化[^41]等。这样的全局上下文特征弥补了手工制作的低级特征的不足。

沿着这一研究方向,许多深度学习方法试图将统计特征融合到深度网络中。例如:深度 Fisher 网络[^42]整合了 Fisher 向量,而无序池[^43]整合了局部聚合描述符的向量。这两种方法都只是简单地将深度网络的特征视为现成的特征。最近,一些研究成功地将直方图学习[^44][^45]融入深度神经网络,用于分类任务和特征嵌入。

Ch03 我们的方法

我们在图1中的牙冠设计管道如下所示:

image-20210929132520468

图2:建议模型的图解说明。为了了解技术人员设计的功能,我们提出了包含空间信息(在蓝框中)的功能性损失函数。功能性损失函数的计算图参考图3.(对于所有的冠,为了得到更好的视觉效果,我们将图像放大了两倍)。

如果我们直接应用2D图像生成模型,如:Pix2Pix 模型,则生成的冠确实匹配邻近的牙齿,但是很难满足牙齿的全部功能。在3D模型中,理想的牙冠不应该穿透到对面的牙齿中,同时保持少量的接触点来撕裂与挤压食物。因此,我们建议整合一个功能性损失来解决这个问题。

下面的段落组织如下:

3.1 条件生成式对抗网络

最近提出的 Pix2Pix 模型[^6]在图像到图像转换场景的各种任务中展示了令人期望的结果。这个想法是利用条件生成式对抗网络[^9]来帮助改善生成器,从而产生一个在感知上符合现实的结果。设输入图像为$x$,基准真值为$y$,则条件对抗损失的数学公式:
$$
\mathcal{L}{cGAN}(G,D)=\mathbb{E}{x,y}[\log D(x,y)]+\mathbb{E}{x,z}[\log(1-D(G(x,z)))]
$$
其中,$G$试图最小化损失,而$D$试图最大化损失,即$G^*=\arg\min
{G}\max_{D}\mathcal{L}_{cGAN}(G,D)$。

对抗性损失鼓励生成样本的分布尽可能地逼近真实数据。然而,这种损失不能直接影响实例到实例的影射,因此引入$L_1$损失以确保生成器学习实例到实例的映射,公式化表示为:
$$
\mathcal{L}{L_1}(G)=\mathbb{E}{x,y,z}[|y-G(x,z)|1]
$$
最终的损失函数混合了对抗损失和$L_1$损失,使用$\lambda
{L_1}$平衡:
$$
G^*=\arg\min_G\max_D\mathcal{L}{cGAN}(G,D)+\lambda{L_1}\mathcal{L}_{L_1}(G)
$$

3.2 空间信息的条件化

基于邻近牙齿匹配的牙冠除了满足外观和种植需要外,无法满足牙齿的全部功能性需要。因为我们还必须考虑牙冠与相对牙齿的互相作用,从而满足咬合与咀嚼的需要。也就是说,为了生成一个功能良好的牙冠,对应的相对牙齿和两颌之间每个像素的间隙信息都是需要的。

提供这些信息的最直接的方法是使用条件变量公式。除了预备颌骨条件化,网络还可以基于空间信息条件化,空间信息类似于对侧颌骨$\tilde{x}$和两个颌骨之间的间隙$d$。条件化对抗损失的再公式化为:
$$
\mathcal{L}{cGAN}=\mathbb{E}{x,\tilde{x},d,y}[\log D(x,\tilde{x},d,y)]+\mathbb{E}{x,\tilde{x},d,z}[\log(1-D(G(x,\tilde{x},d,z)))]
$$
同样的,$L_1$重构损失再公式化为:
$$
\mathcal{L}
{L_1}(G)=\mathbb{E}_{x,\tilde{x},z,y}[|y-G(x,\tilde{x},d,z)|_1]
$$
并且最终的目标与公式3相同。

3.3 功能感知的图像到图像的变换

对空间信息的条件化不会使约束显性化,即:网络将会匹配生成的冠在合理的空间中,但是网络无法感知到实际的关键约束。为了公式化功能性约束,我们必须用生成的冠 $\hat{y}$ 重构间隙距离,这可以在给定预备颌骨和输入间隙距离的情况下计算:

$$
f(d,x,\hat{y})=d+\gamma (\hat{y}-x), \hat{y}>0
$$

其中,$\gamma$可以是缩放参数,用于将像素值映射到真实的距离值(以毫米为单位),或者在我们的例子中是$3.14\times 10^{-2}$。

现在,我们讨论如何对约束进行建模。一方面,理想的冠不应该接触相对的牙,或者其重构的间隙小于0。否则,当转换回3D模型时,冠将穿透相对的牙。这种冠会被看作过度生长的,是会伤害到邻近牙齿的相互作用。另一方面,理想的冠应该保持少量的接触点,以便撕裂和挤压食物。也就是说,重建的距离图应该遵循关键区域的一定的分布。因此,我们可以建模这两个功能性约束为:
$$
\begin{cases}
f(d,x,G)>0,\
\hat{f}(d,x,G)\approx\hat{f}(d,x,y)
\end{cases}
$$
其中,$\hat{f}$描述了关键区域。关键区域为间隙距离值小于或者等于$f$的全部距离值中最小的$5%$的像素。这个比例是根据实践中真实的关键距离(0.5毫米)给定的。

为了将功能性约束整合到学习中,我们考虑匹配间隙的分布。原因有两个:
第一个原因,重建的距离图不需要逐像素地匹配基准的真实距离图,因为这个映射关系早在使用$L_1$回归损失时就被模型化了。
第二个原因,为了满足约束条件,模型化接触点的特定位置不是必须的。通过放松空间对应关系,模型允许探索更大的优化空间。因此,我们提出了一个直方图损失模型化功能性,使用$\chi^2$距离公式化:
$$
\mathcal{L}H(G)=\mathbb{E}{x,\tilde{x},d,z,y}[\sum_i\frac{(h_i(f(d,x,G))-h_i(f(d,xx,y)))^2}{\max{1,h_i(f(d,x,y))}}]
$$
其中,第$i$个分箱(建构直方图需要分箱)由一个可微的分段线性函数$h_i(d)$模型化:
$$
h_i(d)=\sum\max{0,1-|d-c_i|\times l_i}
$$
其中,$c_i$和$l_i$分别是第$i$个箱的中心和宽度。这个直方图损失将基于斜率$\pm l_i$对$d$中的任意像素执行反向传播误差,$d$落在$(c_i-l_i,c_i+l_i)$的区间中。计算图如图3所示。

image-20210929133814247图3:计算直方图损失的计算图。我们在冠的区域中计算了距离图,在分段可微核中计算了对应的直方图。最终,我们在两个直方图之间计算了$\chi^2$距离。(直方图中$x$轴的单位是米)

最终的目标函数是:
$$
G*=\arg\min_G\max_D\mathcal{L}{cGAN}(G,D)+\lambda{L1}\mathcal{L}_{L1}(G)+\lambda_H\mathcal{L}_H(G)
$$
其中,直方图损失的平衡依靠$\lambda_H$。

因为功能性与关键区域的相关性,所以想要有所收益可以在某种范围内(最好是关键区域)加强直方图损失函数或者在第$i$个分箱上使用权重$w_i$得:
$$
\mathcal{L}{\hat{H}}(G)=\mathbb{E}{x,\tilde{x},d,z,y}[\sum_iw_i\frac{(h_i(f(d,x,G))-h_i(f(d,x,y)))^2}{\max
{h_i(f(d,x,y)),1}}]
$$
权重的选择应该是通过分析间隙距离和实践中对关键区域的考虑来得出的。实现的细节将在实验部分说明。

提出的直方图损失函数的一个性质是空间不变性。也就是说,冠的表面是允许发生巨大变化的。某些时候,这个性质是不需要的,因为它会在冠的表面引起不必要的突起。为了减少空间不变性和平滑表面,我们提出在直方图损失函数中集成二阶信息。我们将二阶操作公式化为局部平均。因此,二阶直方图损失函数定义为:
$$
\mathcal{L}{H^2}(G)=\mathbb{E}{x,\tilde{x},d,z,y}[w_i\frac{(h_i(\bar{f}(d,x,G))-h_i(\bar{f}(d,x,y)))^2}{\max{h_i(\bar{f}(d,x,y)),1}}]
$$
其中,$\bar{f}(d,x,y)$为$f(d,x,y)$的平均池化。

Ch04 实验

我们通过实验来评估和验证我们提出的方法。第4.1节描述了数据集、网络架构和训练过程。第4.2节描述了实验的参数设置。第4.3节使用了理想的技术人员的设计作为基准来评估生成的牙冠的质量,然后使用技术人员设计失败的疑难案例来评估我们的方法。评估结果在第4.4节和第4.5节分别证实了我们的方法显著地降低了失败的比例,改善了牙齿的功能性。

4.1 实现细节

数据集:我们的牙冠数据集包含了1500个训练数据、1570个验证数据和243个疑难测试案例。对于每个案例,都有一个预备颌的扫描图、一个对侧颌的扫描图、两个颌之间的间隙距离图和一个手动设计的冠(被当作训练集和验证集的基准)。缺失的牙齿依据国际标准组织的名称系统中36个数字之一,但是其他的牙齿可以使用相同的方法建模。所有的超参数根据验证结果进行选择。测试案例虽然没有其他集合的数据多,但是其都是从手工设计的牙冠中选出的无法通过穿透检测的数据,具有相当的困难度。我们通过这些疑难案例证明了我们提出的方法的有效性。

网络架构:我们密切关注了pix2pix的架构设计[^6]。我们使用U-Net[^46]实现了生成器G,它包含一个编码器-解码器架构,具有对称的跳跃连接。当成对的输入与输出之间存在空间对应关系时,这种架构会产生很好的结果。编码器结构为:

C64-C128-C256-C512-C512-C512-C512-C512,其中C#表示卷积层,后面跟的是滤波器的数量。解码器的结构为:

CD512-CD512-CD512-C512-C256-C128-C64,其中CD#表示反卷积层,后面跟的是滤波器的数量。在解码器的最后一层的后面,应用卷积来映射为输出通道的数量,随后是Tanh函数。BatchNorm应用于除编码器中第一个C64层之外的每个卷积层之后。编码器中的所有ReLU都有泄漏的斜率0.2,而解码器中的所有ReLu都是常规的。

判别器D的架构为:C64-C128-C256-C512。在最后一层的同,应用卷积层来映射为一维输出,随后是Sigmoid函数。BatchNorm应用于除第一个C64层之外的每个卷积层之后。所有ReLU都有泄漏的斜率0.2。

训练过程:为了优化网络,我们遵循pix2pix的训练过程:交替在D上完成一个梯度下降步骤和在G上完成一个梯度下降步骤。正如[^8]中所建议的,我们不是训练G来最小化$\log(1-D(x,G(x,z)))$,而是最大化$\log D(x,G(x,z))$。此外,当我们优化D时通过2将目标分解,这减慢了D相对于G的学习速度。我们使用小批量SGD和Adam求解器,学习率为0.0002,却是参数$\beta_1=0.5,\beta_2=0.999$。所有网络都是从头开始训练的。权重基于均值为0、标准差为0.02的高斯分布进行初始化。每个实验训练150从此周期,数据使用随机镜像,批量大小为1。

4.2 实验设置

我们在表1所示的6种不同设置中进行实验。

方法 间隙距离 直方图损失 权重箱 平均统计
Cond1 × × × ×
Cond3 × × ×
HistU × ×
HistW ×
Hist$2^{nd}$

Cond1:表示原始的pix2pix模型设置的实验,其中只输入预备颌,也仅使用回归损失和对抗损失。

Cond3:表示基于附加空间信息的pix2pix模型设置的实验,仅使用回归损失和对抗损失。

HistU:表示具有均匀加权的直方图损失的实验。超参数$\lambda_H$设置为0.001,使用回归损失、对抗损失、功能性(直方图)损失。

HistW:为了决定直方图分箱的权重,我们计算得到了每张训练图的最小$5%$间隙距离的阈值,并将它们显示为图4中的直方图。最小$5%$间隙距离的分布的峰值在0.5毫米处,这也是实践中的关键间隙距离。

根据分析,我们决定的不同分箱的权重如下:分箱内的值为负时,权重为2;分箱内的值在0到0.5之间时,权重为1;分箱内的值在0.5到1.0之间时,权重为0.5;分箱内的值是其他值时,权重为0(即:忽略大的间隙距离)。超参数$\lambda_H$设置为0.002。请注意,我们不会调整分箱的权重,因为它是由分析决定的,这也是实验被称为“HistW”(History Weights,历史权重)的原因。

4.3 质量评估

我们根据技术人员的设计评估生成的牙冠。事实说明,我们的结果与理想设计相当,即:技术人员的设计在训练和验证集是保质、保量的。

image-20210930161500825

图4:训练集中最小 $5%$ 间隙距离的阈值分布。X轴的单位是毫米。

度量:我们引入了三种度量完成定量评估,评估预测冠对验证集中的基准数据的模拟效果,如表2中总结的。

方法 均方误差 交并比均值 准确率 召回率 F-测度
Cond1 0.078 0.915 0.932 0.944 0.938
Cond3 0.066 0.922 0.944 0.953 0.949
HistU 0.065 0.921 0.937 0.952 0.945
HistW 0.066 0.920 0.931 0.954 0.942
Hist$2^{nd}$ 0.069 0.916 0.930 0.947 0.938

表2:验证集的质量评估

平均均方误差(Mean root-mean-square error, RMSE):$\text{RMSE}=\sqrt{\mathbb{E}[(\hat{y}-y)^2]}$,其中$\hat{y}$表示预备冠,$y$表示基准数据。均方误差是回归相关任务的标准误差测量方式之一。请注意,我们仅测量牙冠区域的误差,以准确地评估每个像素的质量。

平均交并比(Mean Intersection-over-Union, IoU):$IoU=\frac{(\hat{y}\cap y)}{\hat{y}\cup y}$,被广泛应用于测量分割中的区域重叠。我们使用IoU来确定牙冠是否能很好地适应牙列。

轮廓的准确率、召回率和F-测度:当平均交并比在评估预备冠的大面积区域时,我们还引入了 轮廓检测任务[^47]中常用的边界测量,以准确地评估预测牙冠的边界质量。

表2显示所有方法都获得了类似的令人满意的结果。平均均方误差低于0.07,平均交并比高于$91%$,所有边界相关指标均高于$93%$。结果表明,虽然引入了统计特征来纳入约束,但是它们几乎不会牺牲预测的质量。

image-20210930174750451

图5:我们在三维模型中可视化了所有验证集中重构的冠及相邻的牙齿。结果表明我们生成的牙齿拥有相似的外观和拟合。然而,与技术人员的设计相比,我们的方法为了咬合和咀嚼生成了更加复杂的表面。(不同实例的三维渲染视点可能不同)

图5显示了样本的预测结果,可视化为3D效果(2D的结果可以在补充材料中找到)。我们生成的牙冠与基准数据相比具有相似的外观和拟合。然而,我们的方法为咬合和咀嚼产生了更加复杂的表面。例如:在案例#1、#3和#4中,Hist$2^{nd}$生成的牙冠拥有更多的齿脊,齿脊出现在咀嚼时可能会接触到牙齿的一侧。另一方面,在案例#2和#5中,因为没有空间信息,生成的冠经常会过度生长。

4.4 穿透评价

我们在验证集和测试集上评估了不同方面的穿透问题。一旦牙冠穿透到对面的牙齿,就代表不可接受,需要人工干预。因此,我们要求该方法尽可能减小穿透。

我们使用下面的指标来评估穿透的严重程度:

穿透率(Penetration Rate, PR):$\mathbb{E}[I(\min f(\cdot)<0)]$,其中$I(\cdot)$表示指示函数,$f(\cdot)$表示重构的间隙距离。也就是说,我们计算失败案例数与案例总数的比率(其中$\min f(\cdot)<0$)。穿透率是衡量生产失败率的重要指标。

平均最大穿透Average Maximum Penetration, AMP):$\mathbb{E}[\min f(\cdot);\text{if};f(\cdot)<0]$。也就是说,对于每个失败案例,我们计算了所有失败案例的最大穿透值和平均值。

平均穿透面积(Average Penetration Areas):$\mathbb{E}[#{\min f(\cdot)<0};\text{if};f(\cdot)<0]$。也就是说,我们测量了牙冠穿透到对侧牙齿的面积,并对所有失败案例进行平均。

方法 PR($%$)val PR($%$)test MPval MPtest PAval PAtest
设计 - 100.00 - 5.63 - 57.07
Cond1 53.25 85.60 12.40 16.47 101.06 186.39
Cond3 1.66 17.28 4.50 3.36 14.54 16.48
HistU 1.02 13.99 4.56 2.62 15.56 12.24
HistW 0.96 9.47 3.67 2.30 16.87 10.00
Hist$2^{nd}$ 0.96 7.82 5.00 2.47 24.74 20.27

表3:穿透评估结果。’val’表示验证集,’test’表示测试集,PR表示穿透率,MP表示最大穿透,PA表示穿透面积。

我们在表3中总结了验证集和测试集的穿透率评估。基于空间信息的Cond3相比Cond1大幅减少了穿透率,而HistW和Hist$2^{nd}$的穿透率相比Cond3在验证集上降低了$42%$,在测试集上降低了$55%$,并且HistW的平均最大穿透和平均穿透面积也减少了。然而,Hist$2^{nd}$的平均穿透面积则变大了。因为加强了局部区域的平滑性,所以分区穿透发生的更加频繁。可视化效果参看图6。

image-20210930175204401

图6:测试集上违规案例的可视化。牙冠上的红色像素表示穿透(间隙距离为负)。重构的间隙距离直方图显示临界范围在-0.5到0.5毫米之间。

4.5 接触点分析

我们在验证集和测试集上使用不同的方法评估了接触点。如4.2节所述,我们将最小间隙距离在5%内的牙冠区域分为两类关键像素,分别用于咬合与咀嚼。

我们使用以下的指标来评估接触点的分布:

平均簇数:我们将距离在2以内的相邻关键像素连接起来形成一个簇。这样的簇形成了一个咬合锚。人类牙齿的自然组合方式是一颗牙由几个咬合锚构成。因此,簇的数量反映了生成牙冠的咬合和咀嚼质量。

平均扩散:我们将冠的关键像素的空间标准差的测度作为扩散。原生牙齿的接触点应该是分散的,而不是集中在一个区域。

偏差:由于聚类和扩散的数量没有明显的趋势,因此我们以聚类和扩散的偏差作为测度。我们计算每个方法相对于理想值的相对误差,如:$\frac{\hat{y}-y}y$。理想值使用训练集来计算,训练集来自于那些被看作好的技术人员的设计结果。

方法 NC val Dv($%$) NC test Dv($%$) Spd val Dv($%$) Spd test Dv($%$)
理想 4.15 0.00 4.15 0.00 11.01 0.00 11.01 0.00
设计 - - 1.98 -52.29 - - 8.67 -21.25
Cond1 1.78 -57.11 1.76 -57.59 12.47 13.26 14.84 34.79
Cond3 3.61 -13.01 2.94 -29.16 10.98 -0.27 9.38 -14.80
HistU 3.72 -10.36 3.02 -27.23 11.15 1.27 9.45 -14.17
HistW 3.82 -7.95 3.14 -24.34 11.06 0.45 9.63 -12.53
Hist$2^{nd}$ 3.79 -8.67 3.74 -9.88 11.05 0.36 11.08 0.64

我们将验证集和测试集的接触点评估结果总结于表4中。观察到与穿透评估相似的趋势:与 Cond1 相比,以空间信息为条件的 Cond3 极大地改善了接触点的质量。HistU、HistW 和 Hist$2^{nd}$ 都比 Cond3 提高更多。在测试集上,最棒的 Hist$2^{nd}$ 相比 Cond3 在集群数和扩散数上分别提高了 $27.2%$ 和 $18.1%$。结果表明,虽然 Hist$2^{nd}$ 与 HistW 在穿透质量上表现相当,但在生成牙冠的接触点的分布上表现更好,从而产生更好地咬合和咀嚼功能。效果如图7所示,观测与数量结果是一致的。

Ch05 结论

我们提出了一种使用生成模型自动设计牙冠的方法。生成的牙冠不仅达到了与人类专家设计相似的形态质量,而且通过学习统计特征得到牙齿更好的功能性。这项工作是首次使用GANs解决实际存在的问题。