국가정보자원관리원·경찰청 함께 범죄위험도 예측·분석…정확도 90% 넘어

▲ 데이터 기반 범죄위험도 예측 개요

[아이티데일리] 범죄 발생 위험지역을 예측해 경찰관, 순찰차 등 치안자원을 미리 적재적소에 배치하는 인공지능 기반의 스마트 치안이 현실화될 전망이다.

28일 행정안전부 국가정보자원관리원(원장 김명희, 이하 ‘관리원’)과 경찰청(청장 민갑룡)은 치안정책의 패러다임을 전환하고 스마트 치안을 구현하기 위한 빅데이터 분석을 수행했다고 밝혔다.

분석은 송도, 청라 등 신도심과 국제공항, 국가산업단지 등 복합적인 도시 환경이 공존하는 인천지역을 대상으로 ▲살인·강도·성폭력·절도·폭력 등 ‘범죄’ 5종과 주취자·시비 등 관련 112 신고 10종 등 ‘무질서’ 위험도 예측모델을 설계해 ▲월(月), 일(日), 2시간 단위로 범죄·무질서 발생 위험지역을 예측하고 ▲범죄·무질서 발생에 영향을 미치는 주요 환경적 요인을 파악한 것이다.

이번 분석에는 경찰청의 112신고 및 범죄통계 등의 치안데이터를 중심으로 소상공인시장진흥공단의 소상공인 데이터(8만 건), 인천시의 항공사진(16.2GB)뿐만 아니라, SK텔레콤의 유동인구(530만 건)·신용카드 매출정보(521만 건) 등 민간과 공공의 다양한 데이터를 결합해 활용했다. 특히 SK텔레콤은 지난 2월 행정안전부와 양해각서(MOU)를 체결하고 유용한 민간 데이터를 무상으로 제공하는 등 사회적 가치 실현이라는 국가적 과제에 적극 동참했다.

먼저 관리원은 인천 지역을 가로 200m × 세로 200m 크기의 2만 3천여 개 격자로 나누고 ‘K-means’ 알고리즘을 통해 무질서·범죄 건수 및 비율을 기반으로 5개의 군집으로 자동 분류했다. 군집분석 결과, 범죄·무질서 발생 최상위 군집 지역은 주말과 심야 시간대에 112신고가 크게 증가하고, 유동인구는 매우 많지만 거주 인구는 적은 특징을 보였다.

특히, OO동의 경우 ▢▢역 주변에 유흥가가 있으며, 0~2시의 심야 시간에 112신고가 급증하고 거주인구 대비 유동인구가 매우 많은 지역으로 나타났다. 반면, 범죄·무질서 발생 하위 군집 지역은 ◊◊동과 같이 거주·유동인구가 모두 적고, 8~19시까지의 주간(晝間) 시간대에 신고가 많은 것으로 나타났다.

관리원은 신고·범죄 건수뿐만 아니라 환경적 요인을 결합하여 범죄 위험도 예측모델을 개발했으며, 이 과정에서 시계열 데이터를 처리하기 위한 LSTM(Long Short Term Memory) 딥러닝 알고리즘과, 약한 예측 모델을 결합해 예측도를 향상시키는 기계 학습 모델 ‘그래디언트 부스팅’ 기반의 ‘Catboost’ 알고리즘을 활용했다. 이를 통해 지역별, 월(月)·일(日)·2시간 단위의 범죄 발생 건수를 예측하고 범죄·무질서 위험도를 5점 척도로 나타낸 것이다.

일(日) 단위 기준으로 예측모델의 성능을 평가한 결과, 범죄 위험도는 98%의 예측 정확도를 보였으며 AUC(Area Under the Curve) 기반의 예측 모델 평가 방법에 기반한 예측 성능은 범죄 발생 건수만을 토대로 한 선형회귀 예측보다 20.1% 향상됐다. 또한 무질서 위험도의 경우 91.3%의 예측 정확도를 보였으며, 예측 성능은 5.1% 개선됐다.

인공지능 알고리즘은 약 2,600개의 요인 중에서 ‘유흥주점의 업소 수(數)’를 범죄 예측의 가장 중요한 환경적 요인으로 선정했다.

숙박시설의 경우 업소 수(數)뿐만 아니라 매출액도 같이 고려해야 하며, 유동인구의 요일별 편차도 범죄 예측에 중요한 요인으로 판단했다. 또한, 특정 지역의 범죄 예측에는 그 지역의 과거 범죄 건수 외에 인접 지역의 범죄 건수 또한 큰 영향을 미친다는 사실을 밝혀냈다. 이는 경찰관의 지식과 경험이 담겨있는 데이터를 인공지능 알고리즘이 학습함으로써, 요인 간 상관관계를 파악하고 사람이 미처 발견하기 어려운 환경적 요인을 찾아내어 범죄 가능성을 예측한 것이다.

예측 모델을 현장에 적용한 결과 실제 범죄 예방에 효과가 있는 것으로 나타났다. 경찰청은 지난 10월 14일부터 6주간 범죄 예측 결과를 기반으로 인천시의 16개 지역에 경찰관과 순찰차를 집중 배치했다. 그 결과 신고 건수는 2018년 같은 기간 대비 666건에서 508건으로 23.7%, 범죄발생건수는 124건에서 112건으로 9.7% 감소했다. 경찰청은 범죄위험도 예측 모델은 향후 인천 지역을 대상으로 시범 운영 후 전국으로 확대할 계획이다.

민갑룡 경찰청장은 “경찰의 업무는 국민의 안전과 직결되는 만큼 과학적인 데이터 분석과 활용이 매우 중요하다”면서, “이번 연구결과를 치안 현장에 적용해 효과를 검증하는 한편, 자체 연구와 폭넓은 기관 간 협업을 통해서 보다 효과적인 치안 활동을 전개해 나갈 것”이라고 밝혔다.

김명희 국가정보자원관리원장은 “이번 분석은 사회적 가치를 창출하고 확산하기 위해 경찰청(‘19.4.12), SK텔레콤(’19.2.18)과 전략적으로 협업한 아주 의미 있는 사례”라며, “향후에도 다양한 공공·민간 데이터를 활용해 국민이 체감할 수 있는 분석과제를 주도적으로 발굴·수행함으로서, 정부 정책에 대한 국민의 신뢰를 얻고 국민의 삶이 개선되도록 노력할 계획”이라고 밝혔다.

저작권자 © 아이티데일리 무단전재 및 재배포 금지