0
在这两种情况下,神经网络都首先将高度多维的图像“智能”压缩为低维,然后使用此压缩信息将其解码为分段图。
在U-net的情况下,压缩的表示形式是大量相对较低分辨率的特征图。如果是自动编码器,则需要一些潜在代码(如果是可变自动编码器,则为多维高斯分布)。
无论采用哪种方法,此表示都应比图像紧凑得多,以便网络可以从原始输入中“提取”最有用的信息。这是编码部分。
现在进入解码部分:在U-Net和自动编码器中。这相当于采用这种低维表示并将其解码(上采样)到分割图中。
因此,从本质上讲,这两种方法的思想都是压缩输入并提取一些低维的中间表示形式,然后可以将其解码为所需的输出。
收藏