데이터셋 제공 건수로 본 상위 20개 기관
순위 | 제공 기관 | 서비스 | 데이터셋 갯수 |
---|---|---|---|
1 | SK텔레콤 | 유통 빅데이터 플랫폼 | 11,342 |
2 | 국립암센터 | 헬스케어 빅데이터 플랫폼 | 4,094 |
3 | 대구광역시 | 4.대구 D-데이터허브 | 3,944 |
4 | 바이브컴퍼니 | 유통 빅데이터 플랫폼 | 3,834 |
5 | 부산광역시 | 4.부산 공공데이터 포털 | 2,543 |
6 | 서울특별시 | 2.서울특별시 | 2,513 |
7 | 인천광역시 | 3.인천데이터포털 | 2,224 |
8 | 빌트온 | 유통 빅데이터 플랫폼 | 2,046 |
9 | 경상남도 | 4.경상남도 | 1,874 |
10 | 식신 | 유통 빅데이터 플랫폼 | 1,253 |
11 | 코리아크레딧뷰로 | 유통 빅데이터 플랫폼 | 1,088 |
12 | 동북아역사재단 | 1.공공데이터포털 | 1,028 |
13 | 경기도 | 1.공공데이터포털 | 991 |
14 | MBN | 유통 빅데이터 플랫폼 | 963 |
15 | 제주특별자치도 | 1.공공데이터포털 | 940 |
16 | 대전광역시 | 1.공공데이터포털 | 931 |
17 | 국토교통부 | 1.공공데이터포털 | 922 |
18 | 경상남도 | 1.공공데이터포털 | 741 |
19 | 경기도 | 3.경기도 | 726 |
20 | 온누리에이치엔씨 | 유통 빅데이터 플랫폼 | 725 |
유통 빅데이터 플랫폼
SK텔레콤이 제공하는 데이터셋의 건수가 눈에 띄게 많습니다. 2등 보다 두 배 이상 입니다.
SK텔레콤은 서비스인구 데이터셋을 시군구별, 월별로 쪼개서 등록하기 때문에 이렇게 많은 데이터셋이 나온 것입니다. 대한민국의 시군구는 약 250개이며, 2021년 12월 현재 약 4년치의 데이터를 제공하기 때문에 250(시군구) X 46(개월) = 11500 라는 것을 알 수 있습니다.
gimi9에서 기관 필터를 "유통 빅데이터 플랫폼" 으로 지정하고, "SK텔레콤 종로구"를 검색하면 46건의 데이터셋이 등록된 것을 알 수 있습니다. (11,327개 데이터셋을 찾았지만 "SK텔레콤"과 "종로구"를 모두 포함하는 결과는 46건)
유통 빅데이터 플랫폼의 "바이브컴퍼니"가 4위를 기록하고 있는데, 유통업체와 소비품목 관련 키워드를 38개 분류로 세분화하여 월별로 제공하고 있습니다.
상품을 쪼개서 판매하는 것은 유통 빅데이터 플랫폼의 특징으로 보입니다. 그래서 20위 안에 빌트온, 식신, 코리아크레딧뷰로, MBN, 온누리에이치엔씨 까지 포함하여 총 7개사가 포함됩니다.
"공공데이터포털"에서 "동북아역사재단 쉬쉬카" 를 검색하며 44개의 데이터셋을 찾을 수 있습니다. 모두 JPEG 이미지 파일입니다. 즉 44개의 이미지를 각각 데이터셋으로 등록한 것입니다.
쉬쉬카 바위그림 설명: 러시아의 하카스코-미누신스크 분지와 투바공화국 내의 바위그림. 우리의 선사 및 고대문화와 직간접적으로 관련이 있는 지역의 바위그림을 통해서 한국 민족문화의 기원을 계통을 파악할 수 있는 주요한 자료이다.
44개의 이미지를 모두 보려면 44개의 데이터셋에서 하나씩 다운로드 해야 합니다. 사용자의 편의를 고려한다면 44개의 이미지를 한 번에 다운로드 할 수 있도록 하는 것이 낫습니다.
"강서대묘"(50건), "덕흥리 고분벽화"(231건) 등 다른 유적지 데이터셋도 마찬가지입니다.
유통 빅데이터 플랫폼의 데이터셋이 매우 많습니다. 민간 기업이 상품을 세분화 하여 판매하는 것은 고유의 정책이라고 볼 수 있으나, 월별로 쪼개는 것은 지나친 면이 있습니다.
"우리가 판매하는 데이터 종류가 이렇게 많다"고 자랑하고 싶은걸까요?
동북아역사재단은 사용자 편의를 위해 데이터셋을 줄여야 합니다.
유적지별로 묶으면 117개 묶음으로 줄일 수 있습니다.
댓글
댓글 쓰기