Image size : 12000*12000
딥러닝 초기 입문에 많이 쓰는 오픈소스 데이터는 이미지 사이즈가 작음
실무로 들어가다보면 굉장히 곤혹스러울때가 있는데
그 중 하나가 고해상도 이미지를 딥러닝할때이다.
단순히 리사이즈를 한다 ?!
그럼 이미지 정보 손실이 있을 뿐더러, small object 같은 경우 못찾는 경우가 허다하다
그럴때, 두가지 전략을 사용한다.
1. 하이브리드형 패치
1-1 대형패치로 1차 탐색
1-2 소형 패치로 정밀탐색
2. Feature-map stitching
보통 패치 전략으로 학습하면 예측할때,
patch → backbone → head → bbox
patch → backbone → head → bbox
patch → backbone → head → bbox
이렇게 하게되는데
패치들을 원본기준으로 붙여 큰 피처맵을 완성하는 방식이다.
그렇게되면 패치마다 head를 돌리지않고 전체 feature map에 한번 실행하면됨
단점으론 최종 stiched feature map이 매우 커질수 있음
그렇지만 patch 수가 100개 이상일땐 고려해볼만함
반응형
'Deep learning > Computer Vision' 카테고리의 다른 글
| [딥러닝 기초] 딥러닝에서 RGB, Gray 이미지 다루는법 (0) | 2025.12.23 |
|---|---|
| zeroshot 1세대 2세대 차이 (0) | 2025.12.17 |
| MMpretrain custom dataset Train Base Line code _Tutorial 튜토리얼 (0) | 2024.09.20 |
| [pytorch]transform.Compose와albumentation.Compose 차이 (0) | 2022.07.21 |
| 코너검출,직렬형 분류기,ORB (0) | 2022.01.17 |
댓글