为什么大多数人选择U-net或自动编码器类型的网络执行图像分割任务？ - 问答

在这两种情况下，神经网络都首先将高度多维的图像“智能”压缩为低维，然后使用此压缩信息将其解码为分割图。

在U-net的情况下，压缩的表示形式是大量相对较低分辨率的特征图。如果是自动编码器，则需要一些潜在代码（如果是可变自动编码器，则为多维高斯分布）。

无论采用哪种方法，此表示都应比图像紧凑得多，以便网络可以从原始输入中“提取”最有用的信息，以上是编码部分。

现在进入解码部分：在U-Net和自动编码器中。这相当于采用这种低维表示并将其解码（上采样）到分割图中。

因此，从本质上讲，这两种方法的思想都是压缩输入并提取一些低维的中间表示形式，然后可以将其解码为所需的输出。

2021-01-20 17:46 更新

理工酷