환자 데이터는 물론, 주요 전염병 및 백신 등 의료 통계 데이터도 포함해 활용도 높여

▲ 마인즈랩이 공개한 ‘코로나19 동선 추적 데이터셋’

[아이티데일리] 마인즈랩이 코로나19 환자 경로와 관련된 대규모 데이터셋을 지난 12일 오픈소스로 공개했다.

‘코로나19 동선 추적 데이터셋’은 확진자의 경로·연령·성별·진단날짜 등 기초적인 환자 데이터를 담았다. 또한 22가지의 주요 전염병과 16개의 백신, 의료 시설 등 의료 통계 데이터를 포함하고 다양한 변수에 따라 시각화 된 데이터로, 인공지능(AI) 모델 개발 등 기계학습에 필요한 요소들을 갖췄다.

마인즈랩 측은 기존의 코로나19 관련 오픈 데이터셋들에 비해 데이터의 양과 품질, 시각화 부분에서 높은 차별성을 갖췄다며, 미국의 커뮤니티 사이트 레딧(Reddit)에서 개발/딥러닝 부문 1위에 오르는 등 해외 네티즌들 사이에서도 큰 관심을 끌고 있다고 설명했다.

이중건 마인즈랩 브레인팀 선임 연구원은 “공익적 가치를 고려해 누구나 쉽게 사용할 수 있도록 소셜 코딩 플랫폼 깃허브(Github)에 오픈소스로 공개했다”며, “빠르게 확산하고 있는 코로나19를 막기 위해 질병의 최전선에서 사투를 벌이는 의료진과 관계자들에게 마인즈랩이 구축한 데이터셋이 큰 도움이 되기를 바란다”고 말했다.

최홍섭 마인즈랩 연구 개발 조직 부문대표는 “이번 데이터셋 공개는 마인즈랩 연구 개발 조직의 연구역량이 세계적 수준에 이르고 있음을 보여주는 획기적 성과”라며, “이번 데이터셋은 코로나19뿐만 아니라 다른 감염병에도 적용할 수 있어 추후 위기 사태에서도 모델링해 활용할 수 있을 것”이라고 밝혔다.

저작권자 © 아이티데일리 무단전재 및 재배포 금지