ํฐ์คํ ๋ฆฌ ๋ทฐ
AI/Segmentation
Image Segmentation ๋ชจ๋ธ ์ ๋ฆฌ(FCN, DeepLab, U-Net)
ํด๋์๊ทธ 2025. 2. 12. 16:38๋ฐ์ํ
Intro
- image segmentation์ด๋ ๋ฌผ์ฒด์ ๊ฒฝ๊ณ๋ฅผ ์ค๊ณฝ์ ์ผ๋ก ํ์ํ์ฌ ํด๋น ๋ฌผ์ฒด๊ฐ ์๋ ์์น๋ฅผ ๊ฐ๋ณ ์ฐพ์๋
- or Object etection์ผ๋ก๋ถํฐ ์ด๋ฏธ์ง ์ ์ฌ๋ฌ ์์ญ์ ๊ฐ๋ณ ๋ ์ด๋ธ์ ์ง์ ํ๋ ํ ์คํฌ
- Sem antic Segmentation :์ ๋ ฅ๋ ์ด๋ฏธ์ง์ ๋ชจ๋ ๋จ์ผ ํฝ์ ์ ํด๋น ์ฝํ ์ธ ๋ฅผ ์ค๋ช ํ๋ ํด๋์ค ๋ ์ด๋ธ์ ํ ๋นํ๋ ๊ฒ
- Image classification ๋ชจ๋ธ์ ์์ ์ ํตํด ๊ตฌํ! โก FCN์์ ์์๋จ โก DeepLab, FastFCN ๋ฑ
FCN : Fully Convolutional Networks
- ๊ธฐ์กด classification ๋ชจ๋ธ๋ค์ ์ถ๋ ฅ์ธต์ด fully-connected layer -> ์ด๋ฏธ์ง ์์น ์ ๋ณด ์ฌ๋ผ์ง & ์ ๋ ฅ ์ด๋ฏธ์ง ํฌ๊ธฐ๊ณ ์
- segmentation์์๋ ์๋ณธ ์ด๋ฏธ์ง์ ๊ฐ ํฝ์ ์ ๋ํด class ๊ตฌ๋ถ & instance ๋ฐ ๋ฐฐ๊ฒฝ ๋ถํ ํ ์คํฌ ์ํ -> ์ด๋ฏธ์ง์ ์์น ์ ๋ณด ๋งค์ฐ ์ค์
- ๋ชจ๋ FC-layer๋ฅผ Conv-layer ๋์ฒด ํ์! : Fully connected layer๋ฅผ 1x1 convolution ์ธต์ผ๋ก ๋ฐ๊ฟ
- but, conv๋ง์ ์ด์ฉํ FCN์ ์ถ๋ ฅ์ ๋๋ฌด coarseํจ. (๋ํ ์ผํ์ง ๋ชปํจ. <-> dense) -> dense map์ผ๋ก ์ ํ ํ์
- end-to-end ํ์ต : ์ฒ์๋ถํฐ ๋๊น์ง, ํ๋์ ๋ชจ๋ธ์ด ํ์ตํจ.
DeepLab
Atrous Convolution
- ๊ธฐ์กด conv ์ ๋ค๋ฅด๊ฒ ํํฐ ๋ด๋ถ์ ๋น ๊ณต๊ฐ์ ๋ ์ฑ๋ก ์๋
- ๋น ๊ณต๊ฐ์ ์ผ๋ง๋ ๋์ง ๊ฒฝ์ ํ๋ ํ๋ผ๋ฏธํฐ rate๊ฐ 1์ผ ๋๋ ๊ธฐ์กด conv์ ๋์ผํ๊ณ , rate๊ฐ ์ปค์ง ์๋ก ๋น๊ณต๊ฐ์ด ๋์ด๋จ.
- ๊ธฐ์กด conv์ ๋์ผํ ์์ ํ๋ผ๋ฏธํฐ์ ๊ณ์ฐ๋์ ์ ์งํ๋ฉด์ ํ ํฝ์
์ด ๋ณผ ์ ์๋ ์์ญ = field of view๋ฅผ ํฌ๊ฒ ํ ์ ์๊ฒ๋จ.
- ๋ณดํต ๋์ ์ฑ๋ฅ์ ์ํด์๋, cnn์ ๋ง์ง๋ง์ ์กด์ฌํ๋ ํ ํฝ์ ์ด ์ ๋ ฅ๊ฐ์์ ์ด๋ ํฌ๊ธฐ์ ์์ญ์ ์ปค๋ฒํ ์ ์๋ ์ง๋ฅผ ๊ฒฐ์ ํ๋ receptive field์ ํฌ๊ธฐ๊ฐ ์ค์ํ๊ฒ ์์ฉํจ.
- Atrous conv๋ฅผ ํ์ฉํ๋ฉด, ํ๋ผ๋ฏธํฐ ์๋ฅผ ๋๋ฆฌ์ง ์์ผ๋ฉด์, receptive field๋ฅผ ํฌ๊ฒ ํค์ธ ์ ์์!
- VGG16์ ์ฌ์ฉํจ
- pooling์ ์ด์ฉํ ๊ฒฝ์ฐ ํด์๋ ๋ฎ์์ง๊ณ , ๋ถ๋ณ์ฑ ๋๋ฌธ์ ๊ณต๊ฐ์ ๋ณด์ ์์ค -> localization์ ์ ํ๋ ๋จ์ด์ง.
- atrous conv๋ฅผ ์ผ์ ๋ ๊ฒฐ๊ณผ์ feature map์ด ๋ ํฌ๊ธฐ ๋๋ฌธ์ ์๋ณธ์ด๋ฏธ์ง๋ก ๋ณต์(์ ์ํ๋ง) ํ ๋๋ ์์ -> segmentation์ ์ฑ๋ฅ์ ๋์ผ ์ ์์.
U-NET
- ์ํ ์ด๋ฏธ์ง segmentation์ ์ํด ๊ฐ๋ฐ๋ U ํํ์ ๋ชจ๋ธ
- ๋น ๋ฅธ ์๋ : ์ด๋ฏธ์ง๋ฅผ ์ธ์ํ๋ ๋จ์(patch)์ ๋ํ overlap ๋น์จ์ด ์ ์ / ๊ธฐ์กด์ sliding window ๋ฐฉ์์ ์ด์ patch์์ ๊ฒ์ฆ์ด ๋๋ ๋ถ๋ถ์ ๋ค์ patch์์ ๋ค์ ๊ฒ์ฆํ์ฌ ์ฐ์ฐ์ ๋ญ๋น -> U-NET์์๋ ์ค๋ณต ๊ฒ์ฆ X
- Context์ Localization ๊ด๊ณ ๊ทน๋ณต : ํด๋์ค ๋ถ๋ฅ๋ฅผ ์ํ ์ธ์ ๋ฌธ๋งฅ ํ์ (context)์ ๊ฐ์ฒด์ ์์น ํ๋จ(Localization)์ ๋์์ ์ํํด์ผ ํจ. -> patch์ ํฌ๊ธฐ๊ฐ ์ปค์ง๋ฉด ๋ ๋์ ์ด๋ฏธ์ง ํ๋ฒ์ ์ธ์ ๊ฐ๋ฅ์ผ๋ก context์ ํจ๊ณผ์ VS ๋ง์ max-pooling์ผ๋ก localization ์ฑ๋ฅ ์ ํ (trade-off ๊ด๊ณ) -> U-NET์ ๋ค์ธต์ laye์ output์ ๋์์ ๊ฒ์ฆํด ๊ทน๋ณต
Architecture
Contracting Path
- encoder ์ญํ ์ํ ํ๋ ๋ถ๋ถ, Conv Net์ผ๋ก ๊ตฌ์ฑ
- input->feature map์ผ๋ก ๋ณํํด ์ด๋ฏธ์ง์ context ํ์
- ์ ์ง์ ์ผ๋ก Spatial dimension์ ์ค์ฌ๊ฐ๋ฉฐ ๊ณ ์ฐจ์์ semantic ์ ๋ณด๋ฅผ convolution filter๊ฐ ์ถ์ถํด๋ผ ์ ์๊ฒ ๋จ.
- Contracting Path์ ์๋จ์ ์ด๋ฏธ ์ ํ์ต๋ ๋ชจ๋ธ์ Backbone์ผ๋ก ์ฌ์ฉํด ํ์ต ํจ์จ๊ณผ ์ฑ๋ฅ์ ๋์ผ ์ ์์ผ๋ฉฐ, ์ฃผ๋ก ResNet ๋ฑ์ ๋ชจ๋ธ์ ์ฌ์ฉํจ.
Expanding Path
- Decoder์ ์ญํ ์ํ, Upsampling+Conv Net์ผ๋ก ๊ตฌ์ฑ
- Convolution ์ฐ์ฐ์ ๊ฑฐ์น๊ธฐ ์ , Contracting Path์์ ์ค์ด๋ ์ฌ์ด์ฆ๋ฅผ ๋ค์ ๋ณต์(Upsampling)
- Contracting์ ํตํด ์ป์ Feature Map์ Upsamplingํ๊ณ , ๊ฐ Expanding ๋จ๊ณ์ ๋์๋๋ Contracting ๋จ๊ณ์์์ Feature Map๊ณผ ๊ฒฐํฉํด์(Skip-Connection Concatenate) ๋ ์ ํํ Localization์ ์ํ
- encoder์์ spatial dimension ์ถ์๋ก ์ธํด ์์ค๋ spatial ์ ๋ณด๋ฅผ ์ ์ง์ ์ผ๋ก ๋ณต์ํ์ฌ ์ ๊ตํ boundary segmentation์ ์์ฑ
- Multi-Scale Object Segmentation์ ์ํด DownSampling๊ณผ UpSampling์ ์์๋๋ก ๋ฐ๋ณตํ๋ ๊ตฌ์กฐ
* ํ์ ์ ์ด ์ค์ํจ!
-> spatial ์ ๋ณด๋ฅผ ๋ณต์ํ๋ ๊ณผ์ ์์ feature map ์ค ๋์ผํ ํฌ๊ธฐ๋ฅผ ์ง๋ feature map์ ๊ฐ์ ธ์ prior๋ก ํ์ฉ
-> ๋ ์ ํํ boundary segmentation์ด ๊ฐ๋ฅํด์ง
๋ฐ์ํ
๊ณต์ง์ฌํญ
์ต๊ทผ์ ์ฌ๋ผ์จ ๊ธ
์ต๊ทผ์ ๋ฌ๋ฆฐ ๋๊ธ
- Total
- Today
- Yesterday
๋งํฌ
TAG
- AI์ปจํผ๋ฐ์ค
- ์ปดํจํฐ๋น์
- gs๋ ผ๋ฌธ
- MYSQL
- ์ฝํ ์ค๋น
- Aimers
- Paper review
- 3d-gs
- CLOVAX
- ํ ํฌ์๋ฐ
- ์ฝ๋ฉ๊ณต๋ถ
- ํ๋ก๊ทธ๋๋จธ์ค
- ์คํ ์ด๋ธ๋ํจ์
- ๋ ผ๋ฌธ
- AIRUSH2023
- ๋ ผ๋ฌธ์ฝ๊ธฐ
- ๋๋ฆผ๋ถ์ค
- dreambooth
- SQL
- ๋ ผ๋ฌธ๋ฆฌ๋ทฐ
- AIRUSH
- lgaimers
- C์ธ์ด
- SKTECHSUMMIT
- 2d-gs
- gan
- ํ์ด์ฌ์ฝํ
- ํ์ด์ฌ
- ์ฝ๋ฉ์๋ฌ
- Gaussian Splatting
์ผ | ์ | ํ | ์ | ๋ชฉ | ๊ธ | ํ |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
๊ธ ๋ณด๊ดํจ
๋ฐ์ํ