기본 콘텐츠로 건너뛰기

데이터셋 제공 건수로 본 상위 20개 기관

데이터셋 제공 건수로 본 상위 20개 기관


순위제공 기관서비스데이터셋 갯수
1SK텔레콤유통 빅데이터 플랫폼11,342
2국립암센터헬스케어 빅데이터 플랫폼4,094
3대구광역시4.대구 D-데이터허브3,944
4바이브컴퍼니유통 빅데이터 플랫폼3,834
5부산광역시4.부산 공공데이터 포털2,543
6서울특별시2.서울특별시2,513
7인천광역시3.인천데이터포털2,224
8빌트온유통 빅데이터 플랫폼2,046
9경상남도4.경상남도1,874
10식신유통 빅데이터 플랫폼1,253
11코리아크레딧뷰로유통 빅데이터 플랫폼1,088
12동북아역사재단1.공공데이터포털1,028
13경기도1.공공데이터포털991
14MBN유통 빅데이터 플랫폼963
15제주특별자치도1.공공데이터포털940
16대전광역시1.공공데이터포털931
17국토교통부1.공공데이터포털922
18경상남도1.공공데이터포털741
19경기도3.경기도726
20온누리에이치엔씨유통 빅데이터 플랫폼725

유통 빅데이터 플랫폼

SK텔레콤이 제공하는 데이터셋의 건수가 눈에 띄게 많습니다. 2등 보다 두 배 이상 입니다.

SK텔레콤은 서비스인구 데이터셋을 시군구별, 월별로 쪼개서 등록하기 때문에 이렇게 많은 데이터셋이 나온 것입니다. 대한민국의 시군구는 약 250개이며, 2021년 12월 현재 약 4년치의 데이터를 제공하기 때문에 250(시군구) X 46(개월) = 11500 라는 것을 알 수 있습니다.

gimi9에서 기관 필터를 "유통 빅데이터 플랫폼" 으로 지정하고, "SK텔레콤 종로구"를 검색하면 46건의 데이터셋이 등록된 것을 알 수 있습니다. (11,327개 데이터셋을 찾았지만 "SK텔레콤"과 "종로구"를 모두 포함하는 결과는 46건)

유통 빅데이터 플랫폼의 "바이브컴퍼니"가 4위를 기록하고 있는데, 유통업체와 소비품목 관련 키워드를 38개 분류로 세분화하여 월별로 제공하고 있습니다. 

상품을 쪼개서 판매하는 것은 유통 빅데이터 플랫폼의 특징으로 보입니다. 그래서 20위 안에 빌트온, 식신, 코리아크레딧뷰로, MBN, 온누리에이치엔씨 까지 포함하여 총 7개사가 포함됩니다.



공공데이터 포털 1등은 동북아 역사 재단

12위에 랭크된 동북아 역사 재단이 눈에 띕니다.

"공공데이터포털"에서 "동북아역사재단 쉬쉬카" 를 검색하며 44개의 데이터셋을 찾을 수 있습니다. 모두 JPEG 이미지 파일입니다. 즉 44개의 이미지를 각각 데이터셋으로 등록한 것입니다.
 
쉬쉬카 바위그림 설명: 러시아의 하카스코-미누신스크 분지와 투바공화국 내의 바위그림. 우리의 선사 및 고대문화와 직간접적으로 관련이 있는 지역의 바위그림을 통해서 한국 민족문화의 기원을 계통을 파악할 수 있는 주요한 자료이다.

44개의 이미지를 모두 보려면 44개의 데이터셋에서 하나씩 다운로드 해야 합니다. 사용자의 편의를 고려한다면 44개의 이미지를 한 번에 다운로드 할 수 있도록 하는 것이 낫습니다.

"강서대묘"(50건), "덕흥리 고분벽화"(231건) 등 다른 유적지 데이터셋도 마찬가지입니다.


INSIGHT

유통 빅데이터 플랫폼의 데이터셋이 매우 많습니다. 민간 기업이 상품을 세분화 하여 판매하는 것은 고유의 정책이라고 볼 수 있으나, 월별로 쪼개는 것은 지나친 면이 있습니다.
"우리가 판매하는 데이터 종류가 이렇게 많다"고 자랑하고 싶은걸까요? 

동북아역사재단은 사용자 편의를 위해 데이터셋을 줄여야 합니다.
유적지별로 묶으면 117개 묶음으로 줄일 수 있습니다.


댓글

이 블로그의 인기 게시물

[gimi9] 디지털 산업혁신 빅데이터 리소스 미리보기 수정

디지털 산업혁신 빅데이터 의 리소스 미리보기가 안 나오는 문제를 수정했어요. 과기부와 NIA가 제공하는  통합 데이터지도 서비스 를 통해 수많은 데이터의 메타데이터를 수집할 수 있는데요, 잘못 된 정보가 꽤 많더라고요. 디지털 산업혁신 빅데이터 의 경우 리소스 URL 중간에 공백 문자가 들어간 것이 많이 있으니  통합 데이터지도 서비스 를 활용할 때 주의 하세요.

[활용 사례] 꽃 가격 실시간 공개 서비스 '플로웨이'

http://www.kyeongin.com/main/view.php?key=20220802010000390 2022년 8월 3일 경인일보 기사 [인터뷰] '인천시 공공데이터 창업 경진대회' 대상 안중석 씨 "플로리스트들 정보 격차 해소시켜줄 플랫폼 구현" 기사 요약: 농수산식품유통공사가 꽃 경매가를 제공하는 공공데이터 있음. 그러나 경매 다음 날에 꽃 가격이 올라오므로 현장에서 활용 불편함. 플로웨이 는 이 단점을 보완하여 실시간 경매가를 제공하는 서비스로 인천시 공공데이터 창업·분석 경진대회 대상 수상.

[gimi9] 엑셀 뷰어로 보기

기미나인에서 조회 되는 엑셀 파일이 약 1만 7천여개 인데요, 데이터 공개하는 곳에서 CSV를 데이터 제공하는 용도로 쓰고, 엑셀 파일은 문서를 제공하는 용도로 쓰는 경우가 많아요. 그래서 엑셀 문서를 20건 미리보기로 보면 어색하게 보여요. 그래서 엑셀 뷰어로 보기를 추가했어요. 파일을 다운로드 받지 않아도 미리 엑셀 뷰어로 볼 수 있게 되었어요. 짝짝짝~ 모든 엑셀 파일을 미리 볼 수 있으면 좋겠지만, 제한 사항이 있어요. 먼저, 25MB 파일 크기 제한이 있어요. 일반적으로 공공데이터는 엑셀 뷰어로 볼 수 있어요. 하지만 공공데이터포털 ,  경기도 ,  국가공간정보포털 ,   전라북도 ,  서울 ,  강원 ,  농림축산식품 공공데이터  의 엑셀 파일은 볼 수 없는 것들이 섞여 있어요. D-데이터허브 (대구광역시) 의 엑셀 파일은 볼 수 없는 것들이 많아요. 빅데이터 플랫폼들 중에서,  소방안전 빅데이터 플랫폼 ,  금융데이터거래소 의 엑셀 파일은 일부만 볼 수 있어요. 그 외의 빅데이터 플랫폼은 엑셀 파일을 제공하지 않는 경우가 많아요. 최악의 빅데이터 플랫폼은  교통데이터거래소(교통 빅데이터 플랫폼) 인데요. 엑셀 파일을 보려면 회원 가입을 하고, 데이터 구매하고, 장바구니에서 다운 받아서 봐야 해요. 무료인 파일도 그렇게 봐야 해요. 하지만 원본 페이지에서 미리보기가 있으니 참고하세요.