공공데이터포털 국내외 동향 분석
한국정보화진흥원 이재원 수석
1차 산업혁명은 사람의 일을 증기기관 기반의 기계가 대신하였고, 2차 산업혁명은 전기로 기계가 대량 생산을 시작하였다. 3차 산업혁명에서는 컴퓨터를 통해 기계가 자동화되었다. 4차 산업혁명은 기계가 지능화되는 것을 의미한다. 즉, 모든 사물이 지능화되고, 사람을 중심으로 기계와 사람, 산업과 산업이 초연결(hyper-connected)된다. 이러한 변화의 한가운데에는 데이터가 있다. 즉, 모든 사물들이 생성하고 수집한 데이터를 기반으로 연결되고, 데이터를 활용하여 새로운 가치를 만들게 된다.
이에 따라, 인공지능·빅데이터 기반의 지능정보서비스 기업들은 다량, 양질의 융·복합 데이터 및 분석 데이터를 지속적으로 요구하고 있으며, 세계 각국은 제4차 산업혁명 시대의 가치 창출 원동력으로 양질(良質), 다량(多量)의 데이터 확보 및 활용으로 인식하고 있다. 이에, 세계 각국이 운영 중인 공공데이터 개방포털을 중심으로 데이터 확보·공급 역량 강화 및 활용 확대를 위한 각 국의 동향을 분석하도록 한다.
공공데이터 재가공을 통한 개방 필요
국내 공공데이터포털(data.go.kr)은 「공공데이터의 제공 및 이용 활성화에 관한 법률」에 따라, 각 기관별로 생성·보유하고 있는 공공데이터의 통합 관리 및 민간 개방을 위한 범정부 통합 단일 창구로 구축되어 운영 중인 시스템이다.
[ 공공데이터포털 서비스 개념도]
공공데이터포털은 파일 데이터, 오픈API, 표준데이터, 국가 중점개방 데이터 등을 민간에 제공하고 있으나, 각 기관이 제공하는 원문 데이터의 단순 개방 역할에 한정되어 있다. 이에 따라, 민간은 지속적으로 가공 데이터의 개방 필요성을 제기하고 있는 실정이다. 예를 들어, 지능형 관광 서비스를 제공하고자 하는 업체는 사용자가 선택한 관광지 정보와 연관성이 높은 데이터를 가공하여 함께 제공한다면 사용자의 만족도를 향상시킬 수 있을 것이다. 이를 위해서는 관광지 정보 이외에 주변 숙박시설, 식당, 교통 정보가 필요하다. 하지만, 데이터 전공자 혹은 개발자가 아닌 대부분의 일반 국민은 데이터 가공에 대한 어려움 및 추가적인 비용·시간 소요를 호소하고 있으며, 정부 주도의 공공데이터 가공을 요구하고 있다.
반면, 해외 주요국은 원문 데이터의 단순 개방 역할이 아닌, 정부 주도로 공공데이터를 가공하여 정책에 반여하거나, 민간 협업을 통해 공공데이터를 가공하여 이용자 맞춤형 데이터 개방을 추진하고 있다. 예를 들어, 독일은 공공데이터 중 구직자의 이력, 구직 시간, 고용주 정보 등을 가공 분석하여 구직자와 고용주 사이의 고용 중재에 활용하고 있다. 미국은 공공데이터 중 지도 데이터를 제공하여 오픈지도 OpenStreetMap을 민간과 협업으로 구축·운영하며, 이를 공공데이터로 다시 미국 공공데이터포털(data.gov)에 개방하고 있다.
이용자가 원하는 공공데이터 서비스 제공 필요
공공데이터포털을 통해 제공되는 각 기관의 원문 데이터를 쉽게 활용하고, 국민 생활에 도움이 될 수 있도록 공공데이터 이용자가 원하는 공공데이터 서비스를 지속적으로 발굴할 필요가 있다. 이를 위해, 세계 각국은 LOD 개방 및 활용 확대를 적극적으로 추진 중이다. LOD는 오픈API에 비해 자유로운 데이터 접근 및 활용이 가능하고, 데이터 매쉬업(Mash-up)이 용이한 데이터 구조로 인식되고 있다. 하지만, 국내 공공데이터포털은 LOD 개방 및 활용 플랫폼으로서 인프라가 미비하다. 반면, 영국은 자국의 공공데이터포털(data.gov.uk)를 구축할 때부터, LOD 데이터 개방과 활용을 고려하여 구축하였다. 이를 위해 ‘5별점 오픈포맷 단계’에 맞춰 데이터 개방성을 점검하고 있으며 민간의 활용성이 높은 오픈포맷 3단계(CSV, XML 등) 이상 개방을 추진하고 있다. 또한, 환경·재정·법령·지리·교통 등의 분야를 중심으로 LOD 개방·활용 프로젝트를 우선적으로 추진하고 있다.
이외에도, 해외 주요국은 시각화 서비스 강화를 통한 공공데이터 이용자의 이용 편의성을 향상하고 있다. 국내 공공데이터포털은 공공데이터 개방 표준 데이터(전국주차장, 전국도시공원 등)에 대하여 시각화 서비스 (차트, 그리드, 지도)를 제공하고 있다. 또한 최근 포털에 개방 중인 데이터를 중심으로 국민이 원하는 시각화 데이터 차트 생성(14종) 및 데이터 분석(군집 분석 등)을 할 수 있는 서비스를 제공하기 시작하였다.
[ 국내 - 공공데이터 시각화 예시 ]
미국과 영국은 공공데이터의 민간 이용편의성 제고를 위해 국가 데이터 지도 구축 및 지도 기반 데이터 검색 서비스(Map-based Data Search) 서비스를 제공하고 있다. 특히, 미국은 민간(MIT, Data Wheel, Deloitte)를 중심으로 분석 데이터를 중심으로 전문 시각화 채널(datausa.io)를 구축·운영하고 있다. 이 사이트를 통해 미국 각 주(state) 정보(인구, 경제, 교육, 거주 등)에 대한 시각화 데이터(차트, 지도 등)을 제공하고 있다.
[ 미국 - datausa.io 예시 ]
호주는 전문 시각화 채널(National Map)을 구축하여 사용자가 선택한 공공데이터를 3D 지도상에서 시각화하여 정보를 제공하고 있다. 최근 공공데이터포털을 개편한 싱가포르의 경우, 실시간 데이터를 자동으로 수집하여 시각화 정보(차트, 지도)를 생성하고 있다. 특히, 분야별 대표 시각화 데이터를 선정하여 제공하고 있어 민간의 만족도가 높다.
[호주 - National Map ] [ 싱가포르 - data.gov.sg 예시 ]
지능정보사회의 핵심은 양질, 다량의 데이터 개방에서 활용까지 생태계 구축
한국정보화진흥원 서병조 원장에 따르면, 지능정보사회는 데이터가 중심이 된다. 즉,
양질, 다량의 데이터를 생산·개방하고, 이를 기반으로 다양한 지능정보서비스가 창출될 때 지능정보사회의 주도권을 갖게 될 것이다. 이를 위해 무엇보다 필요한 것은 데이터 개방에서 분석·활용까지 지원할 수 있는 데이터 플랫폼 기술을 선점하고, 이를 기반으로 데이터 생태계를 구축하는 것이다. 이를 위해, 이미 해외 주요국들은 LOD 데이터 개방 및 활용 확대, 다양한 시각화 서비스 강화 등 자국의 공공데이터포털을 중심으로 데이터 플랫폼의 기술을 점차 확보 및 강화하고 있다. 이에, 국내 공공데이터포털도 데이터의 생산·저장·유통·활용까지 생애주기(Life Cycle)를 고려한 데이터 생태계 조성을 통해 국가 전반의 경제적, 산업적 파급효과를 극대화할 때이다. 세계 각국은 공공데이터를 통한 ‘정부 투명성(Transparency) 제고’에서 데이터 생태계 구축을 기반으로 하는 ‘경제효과창출(Creating Value)’로 정책 방향을 바꾸고 있으며, 지능정보사회의 주도권 확보를 위해 경주(競走) 중이다.
참고자료
1. https://datausa.io
2. https://data.gov.uk
3. https://nationalmap.gov.au
4. https://data.gov.sg
5. [리더스포럼] 지능정보사회의 핵심, 데이터에 있다. (http://www.etnews.com/20160226000180)