为什么U-net或自动编码器类型的网络会成为图像分割任务的主流选择?
0 348
1
该提问暂无详细描述
收藏
2021-01-27 16:09 更新 天明 •  1292
共 1 个回答
高赞 时间
0

在这两种情况下,神经网络都首先将高度多维的图像“智能”压缩为低维,然后使用此压缩信息将其解码为分段图。

在U-net的情况下,压缩的表示形式是大量相对较低分辨率的特征图。如果是自动编码器,则需要一些潜在代码(如果是可变自动编码器,则为多维高斯分布)。

无论采用哪种方法,此表示都应比图像紧凑得多,以便网络可以从原始输入中“提取”最有用的信息。这是编码部分。

现在进入解码部分:在U-Net和自动编码器中。这相当于采用这种低维表示并将其解码(上采样)到分割图中。

因此,从本质上讲,这两种方法的思想都是压缩输入并提取一些低维的中间表示形式,然后可以将其解码为所需的输出。

收藏
2021-01-27 16:12 更新 Lisa •  1800