Semantic Segmentation
1. Semantic Segmentation
1.1. Overview
semantic segmentation 的一个核心问题是如何解决 pooling 导致的 representational bottleneck. 所谓的 bottleneck 是指通过多次 pooling 会丢失浅层的特征, 只保留深层的特征, 深层特性对图片的分类更有用, 但浅层特征对语义分割更有用.
解决的方法主要是不同尺度的特征的融合, 以保留浅层特征.
具体的, 大约有以上三种模型:
1.2. FCN
1.3. ENet
cascade dilated conv, max unpooling
1.4. UNet
encoder-decoder
1.5. SCNN
message passing (up, down, right, left)
1.6. DeepLab
parralle dialted conv
1.7. PSPNet
parralle pooling
1.8. ICNet
multi-scale training
Backlinks
Deconv2D (CNN > Deconv2D): Deconv2D 是一种 Upsample 的手段, 被用在大部分 Semantic Segmentation 模型中
Dilated Conv2D (CNN > Dilated Conv2D): 大部分的 Semantic Segmentation 模型都会使用 dilated conv2d, 用来提高 receptive field.