U-Net: Convolutional Networks for BiomedicalImage Segmentation(18 May 2015)

2025. 3. 30. 20:17친해지기, 논문

* 원문 논문 아카이브

https://arxiv.org/abs/1505.04597

U-Net: Convolutional Networks for Biomedical Image Segmentation

There is large consent that successful training of deep networks requires many thousand annotated training samples. In this paper, we present a network and training strategy that relies on the strong use of data augmentation to use the available annotated

arxiv.org

0. Abstract

  • 깊은 네트워크의 성공적인 훈련을 위해선 많은 훈련 샘플이 필요.
  • 이 논문에서는 데이터 증강을 활용해 훈련 샘플을 보다 효율적으로 사용.
U-Net의 구조

 

1. Introduction

  • CNN 네트워크
    • 성공적이지만 훈련 세트, 네트워크 크기의 한계로 제한적.
    • 주로 단일 클래스 레이블에 사용되나, 생물 의학 이미지 처리에서는 픽셀별 레이블인 위치 정보를 포함해야함.
    • 또한 생물 의학에서는 수천 개의 훈련 이미지 확보 어려움.
    • 이 단점을 보완한 네트워크들은 속도가 느리고, 위치와 전체 문맥간의 균형을 맞춰야함.
  • U-Net
    • Fully Convolutional Network를 기반으로 구축.
    • 적은 수의 데이터로 더 정밀한 분할 결과 도출.
    • 일반적인 축소 네트워크에 연속적 레이어 추가.(풀링 연사자를 업샘플링 연산자로 대체.)
    • 위치 지정 위해 축소 경로의 고해상도 특징과 업샘플링 된 출력(전체 맥락 제) 결합.
    • 더욱 정밀한 출력.
    • 확장 경로와 축소 경로가 거의 대칭을 이루며 U자형 아키텍처를 형성.
임의의 큰 이미지의 매끄러운 세분화를 위한 오버랩 타일 전략 (여기서는 EM 스택에서 신경 구조의 세분화). 노란 영역에서의 세분화 예측은 파란 영역 내의 이미지 데이터를 입력으로 필요로 합니다. 누락된 입력 데이터는 반전시켜 보완됩니다.

=> 다양한 생물 의학 세분화 문제(Various Biomedical Segmentation Problems)에 적용. EM 스택에서 신경 구조의 세분화 결과를 보여줌.
 
* Various Boimedical Segmentation Problems : 생물 의학 분야 에서 영상 내 특정 객체나 영역을 픽셀 단위로 분리해내는 작업. 예를 들어, 의료 영상에서 종양을 분리하거나, 세포의 경계를 구분하는 것.
* EM 스택 : 전자 현미경. 2차원 전자 현미경 이미지를 스택으로 쌓아 3차원 구조를 얻음.
* 오버랩 : 이미지를 분할할 때 경계 부분 분할 결과가 매끄럽지 않으므로 겹치도록해 인접한 타일과 공유.
* 예측 : 특정 영역(노란색 영역)의 정확한 분할 예측을 위해 더 넓은 영역(파란색 영역)의 활용.
* 미러링 : 타일의 경계 부분에서 필요한 입력 데이터가 이미지 영역 밖인 경우 이미지 경계를 반전(Mirroring) 시켜 데이터를 보완.  
 

2. Network Architecture

  • 아키텍처는 축소 경로와 확장 경로로 구성.
  • 축소 경로는 전형적인 합성곱 네트워크의 구조.
  • 축소 경로는 특징 채널 수를 두 배로 증가 시키고, 확장 경로는 특징 채널 수를 절반으로 줄임.
  • 매끄러운 타일링(위 그림)을 위해, 입력 타일의 크기를 선택하는 것이중요.

 

감상

  • CNN의 데이터의 한계를 극복한 모델이라 매우 흥미롭다.
  • 잔차 연결의 개념이 소개된 논문을 읽어봐서 뿌듯하다.
  • Segmentation의 Overlap 개념은 나도 많이 생각하는 문제이다. 최근 Speaker Verification을 Live Streaming에서 수행하는 업무를 하고 있는데 경계 부분에서 많은 문제를 일으킨다. Overlap 알고리즘을 연구해서 무조건 적용해야 겠다.
  • 또한, 경계 부분에서의 처리도 놀랍다. 반전시켜 확대하는 개념이라니. 조만간 활용할 날이 올 것 같다.  
728x90