본문 바로가기
Daily/김인턴의 하루

COCO Dataset

by HANNI하니 2020. 10. 12.

1. 정의

여러 일상 이미지들의 집합.

COCO is a large-scale object detection, segmentation, and captioning dataset.

COCO has several features : 

- Object segmentation

- Recognition in context

- Superpixel stuff segmentation

- 330K images (>200K labeled)

- 1.5 million object instances

- 80 object categories

- 91 stuff categories

- 5 captions per image

- 250,000 people with keypoints


2017년 공개된 데이터 셋 기준으로,

- train2017 (19G)

- val2017 (788M)

- test2017 (6.3G)

- annotation (808M)

   - captions(텍스트로 된 그림에 대한 설명)

   - instances(그림에 있는 사람/사물에 대한 category와 영역 mask)

   - person_keypoint(사람의 자세 데이터)




COCO Dataset - 코코 데이터셋

머신러닝을 위해 많은 데이터 셋이 만들어져 있는데, 그 중에 COCO dataset은 object detection, segmentation, keypoint detection 등을 위한 데이터셋으로, 매년 다른 데이터셋으로 전 세계의 여러 대학/기업이 ��




2. Annotation 분석

5가지 종류. 용도에 맞는 annotation을 갖고 있다.

한 줄짜리 json 형식으로 되어 있다.


1) Object detection

2) Keypoint detection

3) Stuff segmentation

4) Panoptic segmentation

5) Image captioning




COCO dataset

Microsoft COCO: Common Objects in Context, ECCV 2014 논문 참고, https://arxiv.org/pdf/1405.0312.pdf COCO dataset COCO dataset은 여러 일상 이미지들의 집합이고, 2017년 공개된 데이터 셋 기준으로, trai..









COCO - Common Objects in Context



'Daily > 김인턴의 하루' 카테고리의 다른 글

TPU 텐서처리장치  (0) 2020.10.13
DeepLab 딥랩  (0) 2020.10.13
DLL 파일  (0) 2020.10.12
배쉬 Bash  (0) 2020.10.12
파이프라인 구조 Pipeline  (0) 2020.10.12
