전체 글54 고해상도 이미지 딥러닝 학습방법 Image size : 12000*12000 딥러닝 초기 입문에 많이 쓰는 오픈소스 데이터는 이미지 사이즈가 작음실무로 들어가다보면 굉장히 곤혹스러울때가 있는데 그 중 하나가 고해상도 이미지를 딥러닝할때이다. 단순히 리사이즈를 한다 ?!그럼 이미지 정보 손실이 있을 뿐더러, small object 같은 경우 못찾는 경우가 허다하다 그럴때, 두가지 전략을 사용한다. 1. 하이브리드형 패치 1-1 대형패치로 1차 탐색 1-2 소형 패치로 정밀탐색2. Feature-map stitching 보통 패치 전략으로 학습하면 예측할때, patch → backbone → head → bbox patch → backbone → head → bbox patch → backbone → head → bb.. 2026. 2. 13. [딥러닝 기초] 딥러닝에서 RGB, Gray 이미지 다루는법 내가 무엇을 딥러닝모델을 개발을 할지 혹은 연구자의 마인드에서 연구 자세는 1. 데이터셋 특성 파악하기2. 어떤 방식으로 접근할 것인가 이 두가지 방식 부터 큰 그림을 파악하며 진행이 된다. 특히, 이미지의 경우 대부분 오픈소스로 되어있는 데이터의 경우 RGB로 이루어진 이미지로 구성되어있는데 의료영상(X-ray, CT, MRI) 그리고 비전 업계의 이미지 같은경우 대부분 회색조 영상으로 구성되어있기에 딥러닝 모델 적용시 접근 방법에 대해 생각해봐야된다. RGB 이미지의 채널수는 3 (Red,Green,Blue) , GRAY 이미지의 채널 수는 1 대부분 Pretrained model도 3채널로 학습된 것을 릴리즈 하는 거기에 때문에 데이터셋으로 구성할 이미지 채널을 생각하지 않는다면 괜한 연산.. 2025. 12. 23. zeroshot 1세대 2세대 차이 clip모델에서 사용하는 제로샷에 대한 개념이 내가 알고 있던 지식과 서로 충돌해서 정리해보았다. 대학원 시절 제로샷에 관한 연구를 랩세미나에서 듣긴했다만 이 당시는 초창기 제로샷이라당시 든 생각은 상용화 못되겠는데.. 이런 생각이였고 자매품 처럼 few-shot learning과 같이 언급될 시절이었다. 그래서 내가 알던 개념은 이때 당시로 멈춰있어 [전형적인 구조]이미지 → 이미지 인코더 → visual embedding 클래스 → attribute vector → semantic embedding 학습: visual embedding ↔ semantic embedding 정렬 [문제유형] : Image Classification [모달리티] : Vision (+ Semantic At.. 2025. 12. 17. ERROR:torch.distributed.elastic.multiprocessing.api:failed 해결법 yolo v5 학습 중 만난 오류 ERROR:torch.distributed.elastic.multiprocessing.api:failed train.py python -m torch.distributed.run --nproc_per_node=2 train.py \--device 0,1 \ --epochs 150 \ --imgsz 5120 \ --batch-size 2 \ --optimizer SGD \--seed 42 \ --multi-scale \ --cos-lr \ --exist-okWARNING:torch.distributed.elastic.multiprocessing.api:Sending process 3094519 closing signal SIGTERM ERROR:torch.distr.. 2024. 12. 10. MMpretrain custom dataset Train Base Line code _Tutorial 튜토리얼 #mmpretrain_base_ = [ '../_base_/models/mae_vit-base-p16.py', '../_base_/datasets/imagenet_bs512_mae.py', '../_base_/default_runtime.py',]train_dataloader = dict( dataset=dict( type='CustomDataset', data_root='data/custom_dataset/', ann_file='', # We assume you are using the sub-folder format without ann_file data_prefix='', # The `data_root` is t.. 2024. 9. 20. 'LocalVisualizer is not in the mmengine::visualizer registry. Please check whether the value of `LocalVisualizer` is correct or it was registered as expected. mmpretrain으로 classification 진행하려는데 "'LocalVisualizer is not in the mmengine::visualizer registry. Please check whether the value of `LocalVisualizer` is correct or it was registered as expected." 이런 문제가 생겼을때 별것을 다검색했지만 해결안됫는데 결론은 mmpretrain과 mmcv의 호환성문제였음 https://mmcv.readthedocs.io/en/latest/get_started/installation.html 에 들어가서 해당하는 토치버전이랑 같이 설정하고 다운 받고 추가로 mmcv-lite다운받았더니 해결 2024. 9. 19. 이전 1 2 3 4 ··· 9 다음 반응형