참고자료는 밑에 첨부했습니다!
Rich feature hierarchies for accurate object detection and semantic segmentationTech report (v5)
Object Detection
: 물체 검출 알고리즘은 여러 물체에 대해 어떤 물체인지 분류하는 이미지 분류와 그 물체가 어디 있는지 네모 박스(Bounding Box)를 통해 위치 정보를 나타내는 위치 문제 두 가지를 해내는 알고리즘이다.
Object Detection 분야에서 두가지 키 인사이트를 조합하여 성능을 향상하였다.
1. Convolutional Neural Network 사용 및 bottom-up region proposal(Selective Search) 적용.
2. 학습 데이터가 부족할 때, pre-training된 모델을 사용하여 해당 도메인에 맞게 fine-tuning을 적용.
region proposals with CNN = R-CNN
R-CNN 시스템의 전체 동작 구조
1. Input image : 이미지 입력
2. Extract region proposals : 입력된 이미지로부터 region proposals 2000개 생성 -> Selective Search
3. class-specific linear : SVM을 통해 image classification(K+1개 분류, +1은 이미지에 object가 없는 경우), regression을 통한 bounding-box 계산 수행
R-CNN의 Speed bottlenect
- 모든 입력 이미지에 N개에 대해 region proposals 2000개 생성
- 2000개의 region proposals 각각에 대해 CNN feature vector 추출 (N images * 2000)
-> CNN을 통한 feature vector 추출
-> SVM classifier를 통한 image classification
-> Bounding box regression
+++ 추가 자료
Object detection에 Instance segmentation을 추가한 Mask R-CNN !
rladuddms.tistory.com/10?category=935550
rladuddms.tistory.com/12?category=935550
+++ 참고자료
arclab.tistory.com/165
'Stay Hungry Stay Foolish > 논문 정리' 카테고리의 다른 글
[논문 정리] Better Sign Language Translation with STMC-Transformer (0) | 2021.08.12 |
---|---|
[논문 정리] Fast R-CNN (0) | 2021.04.07 |
[논문 정리] Very Deep Convolutional Networks For Large-Scale Image Recognition (0) | 2021.03.16 |
[논문 정리] ArcFace: Additive Angular Margin Loss for Deep Face Recognition (0) | 2020.12.15 |
[논문 정리] Memory Enhanced Global-Local Aggregation for Video Object Detection (0) | 2020.12.07 |
댓글