Semantic Segmentation

1. Semantic Segmentation

1.1. Overview

semantic segmentation 的一个核心问题是如何解决 pooling 导致的 representational bottleneck. 所谓的 bottleneck 是指通过多次 pooling 会丢失浅层的特征, 只保留深层的特征, 深层特性对图片的分类更有用, 但浅层特征对语义分割更有用.

解决的方法主要是不同尺度的特征的融合, 以保留浅层特征.

semantic_segmentation.png

具体的, 大约有以上三种模型:

  • (a) 通过 skip-connection, 例如 FCN
  • (b) encoder-decoder 结构, 例如 UNet
  • (c) 并行的输入或中间层的融合, 例如 deeplab, pspnet, icnet

1.2. FCN

1.3. ENet

cascade dilated conv, max unpooling

1.4. UNet

encoder-decoder

1.5. SCNN

message passing (up, down, right, left)

1.6. DeepLab

parralle dialted conv

1.7. PSPNet

parralle pooling

1.8. ICNet

multi-scale training

Backlinks

Deconv2D (CNN > Deconv2D): Deconv2D 是一种 Upsample 的手段, 被用在大部分 Semantic Segmentation 模型中

Dilated Conv2D (CNN > Dilated Conv2D): 大部分的 Semantic Segmentation 模型都会使用 dilated conv2d, 用来提高 receptive field.

Author: [email protected]
Date: 2022-01-19 Wed 00:00
Last updated: 2022-01-28 Fri 13:54

知识共享许可协议