‘경기데이터드림’서 데이터 28종 공개…AI 접목으로 편의성 제고

[아이티데일리] 데이터는 삶의 흔적이다. 사람들의 일상은 통신 정보, 카드 결제, 대중교통 이용 내역과 같은 데이터로 기록된다. 기업과 기관은 개인들의 축적된 데이터에 비용을 치르고 적법한 절차를 거쳐 효과적 의사결정에 활용한다. 다만 개인이 이들 데이터를 활용하기에는 한계가 있다. 많은 비용이 들어가는 것은 물론 시스템이 필요하기 때문이다.

경기도는 도민들이 데이터를 활용할 수 있도록 적극적으로 나서고 있다. 그 일환으로 지난 5월 통신, 카드 등 데이터 28종을 공공데이터포털인 ‘경기데이터드림’에 무료로 개방했다. 인구 이동 데이터를 쉽게 활용할 수 있도록 시각화한 웹 서비스인 ‘생활이동인구 상황판’도 제작했다. 이를 통해 도민이면 누구나 데이터를 이용해 더 나은 삶을 일굴 수 있도록 돕는다는 목표다.

경기도청 광교 신청사 전경
경기도청 광교 신청사 전경

공공데이터 개방에 앞장서 온 경기도

경기도는 지난 2015년부터 31개 도내 시·군, 공공기관이 보유한 데이터를 누구나 이용할 수 있도록 공공데이터포털 ‘경기데이터드림’을 운영하고 있다. 초기에는 주민 대피시설, 어린이보호구역, 캠핑장 현황 등 도민 관심도가 높은 생활밀착형 데이터 316종을 공개했다.

이후 데이터 개방을 계속 확대해 현재는 경기데이터드림을 통해 96개 제공기관의 데이터 2,073종을 소방재난안전, 교통건설환경, 관광문화체육 등 9개 카테고리로 분류해 제공하고 있다. 또 보유 정보 중 민간 수요가 많은 공공 데이터를 오픈 API로 개방, 모바일 애플리케이션 등으로 개발이 용이하도록 했다.

특히 지난해 3월에는 지자체 최초로 도내 478개 터널의 방재시설 현황 정보 등을 무료 공개해 큰 관심을 받았다. 터널이 있는 노선명과 규모·위치 등 기본 정보를 비롯해 소화전, 긴급전화, 비상 경보설비, 피난대피소 등 방재시설 설치 여부까지 제공하고 있다.

2020년부터는 경기도 반려동물 등록 현황을 공개했으며, 지난해 2월 도내 반려동물 출입공원, 복지시설, 편의시설 등 관련 시설 데이터를 개방했다. 이에 따라 경기데이터드림에서 누구나 무료로 반려동물 관련 시설 2만 649곳의 위치 정보를 지도 형태로 볼 수 있게 됐다.


민간 데이터 개방 및 생활이동인구 상황판 운영

이에 그치지 않고, 경기도는 올해 5월 전국 최초로 카드 소비, 생활이동인구 데이터를 무료 개방했다. 도내 11개 시군과 함께 ‘민간 데이터 공동구매’ 사업을 진행, 구매한 데이터 중 28종을 경기데이터드림을 통해 공개했다.

개방된 데이터는 △이동 목적이나 수단별 인구 이동 현황을 알 수 있는 통신 데이터 21종 △카드사 가맹점, 매출 정보가 포함된 카드 데이터 2종 △도내 기업 현황을 알 수 있는 기업 통계 데이터 2종 △대출 이용자 수와 대출 잔액 합계 등이 담긴 신용 통계 데이터 3종 등 총 4개 분야 28종이다.

5개 카드사(KB국민, 비씨, 롯데, 삼성, 하나)로부터 제공받는 카드 소비 데이터는 성별, 연령별 소비 패턴 분석이나 요일별 매출액 합계 등으로 활용할 수 있다. 통신사에서 제공받는 데이터로는 시간대별 이동 인구 규모 파악이 가능하다.

개방된 28종 데이터는 월별 업데이트된다. 또 기업 분야 및 신용정보 관련 데이터 4종을 순차적으로 추가 개방, 최종적으로 32종의 데이터를 제공할 계획이다.

아울러 인구 이동 데이터를 쉽고 효과적으로 활용할 수 있도록 시각화한 ‘생활이동인구 상황판’을 제작해 민간 데이터와 함께 공개했다. 생활이동인구 상황판은 도내 시군의 이동 목적 및 시간대별로 유입·유출 인구 정보를 그래프와 같은 시각화 자료로 제공한다.

경기도 생활이동인구 상황판 대시보드 메인화면 (사진=경기도청)
경기도 생활이동인구 상황판 대시보드 메인화면 (사진=경기도청)

도민 생활 개선이 최우선 목표

경기도는 민간 데이터 개방 및 생활이동인구 상황판 제작에 있어 도민을 위한 환경 조성을 가장 우선시했다. 시스템이 마련된 기업에서 이뤄지는 ‘데이터 기반 의사결정’을 일반 도민도 활용할 수 있도록 한다는 목표였다.

경기도청 AI미래행정과 최정환 팀장은 “이번 사업은 도민이 첫째였다. 사람들은 자신이 사는 도시가 어떻게 돌아가는지 몸소 느끼지만, 이를 실제 수치로 확인하는 일은 또 다른 차원이다. 민간 데이터를 공개함으로써 더 나은 삶을 위한 밑바탕을 도민들에게 제공하고 싶었다”고 설명했다.

이어 최 팀장은 “데이터만으로도 이전보다 더 나은 상황을 만들 수 있다. 가령 출퇴근 버스 시간표가 불편했던 사람은 공공데이터포털에서 유동인구 수치를 살펴봄으로써 지자체에 정책을 제언하는 근거를 찾을 수 있다. 소상공인의 경우, 가게를 차릴 때 해당 지역에 인구가 얼마나 모이는지, 소비는 어느 정도로 이뤄지는지만 알아도 성공 확률을 보다 높일 수 있을 것이다”라고 덧붙였다.

경기도청에 따르면, 실제 경기데이터드림 방문자 수는 민간 데이터 개방과 생활이동인구 상황판 공개 후 약 20% 증가했다. 경기도는 앞으로 생활이동인구 상황판을 도민들에게 알리고자 홍보 활동도 적극 진행할 예정이다.


관건은 예산 확보…“설득 위해선 실효성 보여야”

물론 경기도가 이들 사업을 추진하는 과정은 순탄치 않았다. 우선, 민간 데이터를 공공에 무료로 개방하는 일이기에 제공기관을 설득해야 했다. 기존에도 경기도 차원에서 민간 데이터를 구매해 왔으나 이는 내부 활용에 국한됐다.

최정환 팀장은 “이전부터 공공기관에서 민간 데이터를 확보해 사업 추진 등에 활용해 왔다. 하지만 내부 활용에만 사용됐기 때문에 관계기관이나 도민들이 이를 확인할 길은 없었다. 도민들에게 민간 데이터를 공개하려 했으나, 공공의 이익만을 이유로 한정된 예산으로 데이터 제공기관을 설득하기는 힘들었다. 데이터를 민간에 공개하기 위해서는 충분한 예산을 마련해야 했다”고 말했다.

예산 확보를 위해서는 내부 설득이 필요했다. 정해진 규모 내에서 사업을 위한 예산을 확보해야 했기 때문이다. 예산 확보를 위해 도청 내 담당 부서에서는 사업 효과를 시각적으로 보여주는 데 중점을 뒀다.

최정환 팀장은 “공공기관 업무는 문서를 중심으로 이뤄져 사업 효과를 한눈에 확인하기 어렵다. 개념 검증(PoC)이든 컨설팅이든 사업을 가시화함으로써 실효성을 보여줘야 한다. 비슷한 유형·사례를 확보하고 이에 대한 대중 반응을 소개하는 것도 한 가지 방법이다”라고 조언했다.

최종적으로 경기도는 도내 시군들과 공동구매를 추진, 예산을 기존 대비 5배 이상 늘렸다. 이를 통해 통신사, 카드사, 신용평가사의 협조를 끌어내는 데 성공한 것이다.


위세아이텍, 데이터 통합 및 AI 검색 개발 지원

기업과의 협력도 원활한 사업 추진에 기여했다. 이번 사업에 참여한 위세아이텍은 지난 2015년 경기도가 경기데이터드림 운영을 시작할 때부터 오랜 기간 협력을 이어왔다. 경기데이터드림 내 관리 시스템에 데이터 품질진단 도구(WDQ)와 메타데이터 관리 도구(WiseMeta) 등을 공급하기도 했다.

위세아이텍은 이번 사업에도 적극 협력했다. 우선, 분산된 자료를 도민이 쉽게 확인할 수 있도록 통합 작업을 수행했다. 최정환 팀장은 “데이터를 사람들이 손쉽게 활용하기 위해서는 정제하고 통합하는 과정이 필요하다. 위세아이텍은 데이터 작업 요청 시 약속한 기간을 정확히 준수하면서도 우수한 결과물을 제공했다”고 말했다.

경기데이터드림과 외부 데이터 간 연결도 위세아이텍이 담당했다. 위세아이텍은 경기데이터드림과 데이터 제공기관 간 시스템 구조 차이를 고려해, 상황판에 데이터를 연결하기 전부터 제공기관과 긴밀히 협력하며 API 연계 작업 등을 준비했다. 이를 통해 생활이동인구 상황판 운영을 원활히 시작할 수 있었다.

아울러 위세아이텍과 경기도는 지난 8월 자연어 검색 서비스 ‘찾아드림’을 경기데이터드림 홈페이지에 공개했다. ‘찾아드림’은 생성형 인공지능(AI) 기술을 활용, 사용자가 입력한 질문에 가장 적합한 공공데이터를 추천해 주는 서비스다.


다음 과제는 AI 기반 행정 통합 플랫폼

현재 경기도는 행정 서비스 전체를 AI 기반으로 전환하는 사업을 기획 중이다. 보도자료 작성과 같은 내부 업무 효율성을 개선하는 서비스뿐 아니라 도서 추천 검색, 말로 하는 키오스크(Kiosk), 정책·데이터 찾아주기 등 도민이 쉽고 편하게 이용할 수 있는 서비스도 개발할 예정이다.

궁극적으로는 다양한 서비스와 함께 경기도가 보유한 데이터를 한데 모아 AI 기반 통합 플랫폼을 구현한다는 계획이다. 이를 위해 경기도는 오는 2025년 사업 추진을 목표로 개념 검증을 진행 중이다.

최정환 팀장은 “경상북도는 보도자료 및 공문용 이메일 작성을 돕는 행정업무 특화 AI를 내부 컴퓨터에 탑재했으며, 법제처는 생성형 AI 기반 법령정보서비스 구축을 추진 중”이라며 “공공기관 내 AI 도입 흐름에 발맞춰 경기도 역시 내부 시스템을 AI 기반 플랫폼으로 개편하기 위한 준비를 진행하고 있다”고 밝혔다.

[인터뷰] “모든 IT 사업의 기본은 데이터 관리에서부터”
경기도청 AI미래행정과 데이터플랫폼팀 최정환 팀장
경기도청 AI미래행정과 데이터플랫폼팀 최정환 팀장

Q. 민간 데이터 개방 사업 추진 과정에서 어려웠던 점은.

“최우선 과제는 예산 확보였다. 이전에도 데이터를 제공기관으로부터 받아 왔으나, 내부 업무 용도로만 활용했다. 이번 사업은 민간 데이터를 외부에 공개하는 일이었다. 통신사, 카드사 등이 보유한 데이터는 그 가치와 중요도가 높은 만큼, 대중에 공개하는 데에는 더 큰 비용이 소모될 수밖에 없었다. 도내 몇몇 시·군을 모아 공동구매 형태로 추진함으로써 사업 규모를 키우고 예산을 늘릴 수 있었다.”

“공공기관은 기업보다 예산 활용이 제한적이다. 어느 한 사업이 더 많은 금액을 받는다면, 어떤 다른 사업은 그만큼 예산이 줄어들 수밖에 없다. 따라서 추진하려는 사업이 얼마나 필요한지 최대한 설득해야 했다. 그 과정에서 실효성을 보여주는 데 집중했다. 공공기관 업무는 대개 문서 중심으로 이뤄져 사업 효과를 가시적으로 경험하기 어렵다. 개념 검증, 컨설팅 등 다양한 방법으로 사업을 시각적으로 보여주기 위해 노력했다.”

“데이터 그 자체로 들어가면 보안이 문제였다. 많은 데이터가 민감한 개인정보를 다루고 있다. 개인 단위로 세세한 정보까지 담는다면 데이터의 가치, 활용도는 높아지지만, 개인정보 유출 등 보안 문제를 피하기 어렵다. 결국 가명 처리된 데이터가 필요한데, 이는 너무 큰 비용이 요구됐다. 그래서 군집 단위로 구매하되 가능한 단위를 작게 잡아 정확도를 높이는 방향으로 해결했다.”


Q. 데이터 관련 사업을 추진하는 기업 및 기관에 조언한다면.

“데이터 관리가 중요하다. 데이터를 어떻게 관리하고 활용하는가는 기업, 기관의 성격을 떠나 모든 곳에 해당하는 문제다. 내부 데이터 상황을 파악하고, 다른 요소에 접목할 수 있도록 정제하는 등 꾸준한 관리가 뒷받침돼야 새로운 데이터 기반 시스템을 성공적으로 구현할 수 있다. 가능하다면 데이터 전문 조직을 마련하는 편이 좋다. 내부 조직을 마련하기 어렵다면, 적어도 전문 역량을 갖춘 기업으로부터 도움을 받아야 한다.”

“최근 AI가 유행으로 떠오르며 이를 도입하고자 하는 곳이 많아졌다. 하지만 AI에 많은 돈을 들인다 한들 품질 높은 데이터를 확보하지 못한다면 원하는 결과를 얻어내기 어렵다. AI를 개발, 구축하기 전에 내부 데이터 점검이 우선이다. 보유 데이터가 충분한 수준에 이르지 못한 경우 데이터 관리 사업이 선행돼야 한다. 제대로 된 데이터가 없는 AI는 그저 헛물을 켜는 일에 그칠 뿐이다.”

저작권자 © 아이티데일리 무단전재 및 재배포 금지