2025. 3. 30. 20:17ㆍ친해지기, 논문
* 원문 논문 아카이브
https://arxiv.org/abs/1505.04597
U-Net: Convolutional Networks for Biomedical Image Segmentation
There is large consent that successful training of deep networks requires many thousand annotated training samples. In this paper, we present a network and training strategy that relies on the strong use of data augmentation to use the available annotated
arxiv.org
0. Abstract
- 깊은 네트워크의 성공적인 훈련을 위해선 많은 훈련 샘플이 필요.
- 이 논문에서는 데이터 증강을 활용해 훈련 샘플을 보다 효율적으로 사용.

1. Introduction
- CNN 네트워크
- 성공적이지만 훈련 세트, 네트워크 크기의 한계로 제한적.
- 주로 단일 클래스 레이블에 사용되나, 생물 의학 이미지 처리에서는 픽셀별 레이블인 위치 정보를 포함해야함.
- 또한 생물 의학에서는 수천 개의 훈련 이미지 확보 어려움.
- 이 단점을 보완한 네트워크들은 속도가 느리고, 위치와 전체 문맥간의 균형을 맞춰야함.
- U-Net
- Fully Convolutional Network를 기반으로 구축.
- 적은 수의 데이터로 더 정밀한 분할 결과 도출.
- 일반적인 축소 네트워크에 연속적 레이어 추가.(풀링 연사자를 업샘플링 연산자로 대체.)
- 위치 지정 위해 축소 경로의 고해상도 특징과 업샘플링 된 출력(전체 맥락 제) 결합.
- 더욱 정밀한 출력.
- 확장 경로와 축소 경로가 거의 대칭을 이루며 U자형 아키텍처를 형성.

=> 다양한 생물 의학 세분화 문제(Various Biomedical Segmentation Problems)에 적용. EM 스택에서 신경 구조의 세분화 결과를 보여줌.
* Various Boimedical Segmentation Problems : 생물 의학 분야 에서 영상 내 특정 객체나 영역을 픽셀 단위로 분리해내는 작업. 예를 들어, 의료 영상에서 종양을 분리하거나, 세포의 경계를 구분하는 것.
* EM 스택 : 전자 현미경. 2차원 전자 현미경 이미지를 스택으로 쌓아 3차원 구조를 얻음.
* 오버랩 : 이미지를 분할할 때 경계 부분 분할 결과가 매끄럽지 않으므로 겹치도록해 인접한 타일과 공유.
* 예측 : 특정 영역(노란색 영역)의 정확한 분할 예측을 위해 더 넓은 영역(파란색 영역)의 활용.
* 미러링 : 타일의 경계 부분에서 필요한 입력 데이터가 이미지 영역 밖인 경우 이미지 경계를 반전(Mirroring) 시켜 데이터를 보완.
2. Network Architecture
- 아키텍처는 축소 경로와 확장 경로로 구성.
- 축소 경로는 전형적인 합성곱 네트워크의 구조.
- 축소 경로는 특징 채널 수를 두 배로 증가 시키고, 확장 경로는 특징 채널 수를 절반으로 줄임.
- 매끄러운 타일링(위 그림)을 위해, 입력 타일의 크기를 선택하는 것이중요.
감상
- CNN의 데이터의 한계를 극복한 모델이라 매우 흥미롭다.
- 잔차 연결의 개념이 소개된 논문을 읽어봐서 뿌듯하다.
- Segmentation의 Overlap 개념은 나도 많이 생각하는 문제이다. 최근 Speaker Verification을 Live Streaming에서 수행하는 업무를 하고 있는데 경계 부분에서 많은 문제를 일으킨다. Overlap 알고리즘을 연구해서 무조건 적용해야 겠다.
- 또한, 경계 부분에서의 처리도 놀랍다. 반전시켜 확대하는 개념이라니. 조만간 활용할 날이 올 것 같다.