본문 바로가기

NLP/dataset

SAM dataset 사용 방법

https://arxiv.org/abs/2304.02643

 

Segment Anything

We introduce the Segment Anything (SA) project: a new task, model, and dataset for image segmentation. Using our efficient model in a data collection loop, we built the largest segmentation dataset to date (by far), with over 1 billion masks on 11M license

arxiv.org

 

작년을 강타한 논문이 있다.

위 논문인데, 사실 필요없고 데이터셋 사용법을 알아야 한다.

 

 

문제점

 

https://ai.meta.com/datasets/segment-anything-downloads/

 

Segment Anything Dataset

 

ai.meta.com

 

위 링크에서 다운받을 수 있었다.

 

 

문제는 압축을 풀면 확장자가 없는 파일이 달랑 하나 나온다. 이게 뭐야, 압축을 풀었는데 왜 알 수 없는 파일이 하나 나온 것이지?!

github 에 들어가서 issue 를 다 읽어봤는데 다들 별 문제 없이 사용하는 듯 했다.

뭐야, 나만 바보야? 나만 저거 어떻게 사용할 줄 모르는 건가?

 

해결 방법

 

파일 이름을 'sa_000001.tar' 처럼 확장자를 추가하여 바꾸면 된다.

바꾸니까 한번 압축을 풀 수 있었고 정상적으로 작동하는 걸 확인했다.

 

이런 뻘글이라도 내가 1명이라도 살릴 수 있지 않을까해서 올린다!!

'NLP > dataset' 카테고리의 다른 글

[dataset] Korean Information Retrieval Dataset  (0) 2023.01.27