[딥러닝 기초] 딥러닝에서 RGB, Gray 이미지 다루는법

내가 무엇을 딥러닝모델을 개발을 할지 혹은 연구자의 마인드에서 연구 자세는

1. 데이터셋 특성 파악하기

2. 어떤 방식으로 접근할 것인가

이 두가지 방식 부터 큰 그림을 파악하며 진행이 된다.

특히, 이미지의 경우 대부분 오픈소스로 되어있는 데이터의 경우 RGB로 이루어진 이미지로 구성되어있는데 의료영상(X-ray, CT, MRI) 그리고 비전 업계의 이미지 같은경우 대부분 회색조 영상으로 구성되어있기에 딥러닝 모델 적용시 접근 방법에 대해 생각해봐야된다.

RGB 이미지의 채널수는 3 (Red,Green,Blue) , GRAY 이미지의 채널 수는 1

대부분 Pretrained model도 3채널로 학습된 것을 릴리즈 하는 거기에 때문에

데이터셋으로 구성할 이미지 채널을 생각하지 않는다면 괜한 연산량 낭비만 될 수도있다.

Gray 이미지의 특징을 생각해보자

채널 1 이 뭘로 되어있는가 바로 intensity 밝기만 존재한다.

그래서 딥러닝 학습을 할땐,

윤곽,패턴에 집중할 수 있도록 augmentation을

contrast,brightness,blur계열, noise계열 등 적용하는 것이 좋지만

hue,Saturation, ColorJitter적용하는 것은 색상이 없기 때문에 적용하는 것은 아무 의미가 없다.

모델을 구성할때도 마찬가지

depth가 1이기 때문에 모델 input 부분도 1로 바꿔주어야 된다.

혹은 모델 수정하는 방법을 원치 않으면 1채널을 3채널로 복제하는 방법도 있다.

대신 단점은 연산낭비가 약간 있지만 장점은 릴리즈된 pretrained모델을 그대로 사용할 수 있다는점

알고하는 것과 그냥하는 것은 차이가 있기에

별거 아닌것 처럼 보여도

이 부분은 알고 넘어갔음 한다.

고해상도 이미지 딥러닝 학습방법 (0)	2026.02.13
zeroshot 1세대 2세대 차이 (0)	2025.12.17
MMpretrain custom dataset Train Base Line code _Tutorial 튜토리얼 (0)	2024.09.20
[pytorch]transform.Compose와albumentation.Compose 차이 (0)	2022.07.21
코너검출,직렬형 분류기,ORB (0)	2022.01.17

minmin_0114