사이버보안 AI 학습 데이터셋 8억 건 구축…추진성과 및 활용사례 공유
[아이티데일리] 과학기술정보통신부(장관 이종호, 이하 과기정통부)와 한국인터넷진흥원(원장 이원태, 이하 KISA)은 국내 기업들이 지능화·고도화되는 사이버 공격에 AI를 활용해 효율적으로 대응할 수 있도록 ‘사이버보안 AI 데이터셋 구축 성과 공유회’를 21일 개최했다.
그동안 국내 보안기업들은 AI 기술 도입 및 학습을 위한 양질의 학습용 데이터셋이 없어 어려움을 겪어 왔다. 과기정통부와 KISA는 이와 같은 문제점을 해결하기 위해 지난 2021년부터 사이버보안 분야 학습용 AI 데이터셋 구축사업을 추진, ‘AI 기반의 안전한 디지털 강국’ 도약 실현을 목표로 사이버보안 데이터 선순환 환경 조성에 앞장서왔다. 이를 통해 구축된 데이터셋은 2개월간의 실증기간을 거쳐 이번에 성과를 공유하게 됐다.
과기정통부와 KISA가 공개한 데이터셋은 악성코드와 침해사고 등 2개 분야로 나뉘어 마련됐다. 악성코드 분야(약 4억건) 데이터셋은 △백신 진단명(Anti-virus) △속성정보(제작도구, 유포‧경유지 등) △사회적 관심사항(코로나, 랜섬웨어, 비트코인 채굴 등) 등을 중심으로, 침해사고 분야(약 4억건) 데이터셋은 △침해 행위(시스템, 네트워크, 장비 등) △침해사고 단계별(정보수집, 실행, 정보유출 등) △최신 침해사고 각본(시나리오) 등을 중심으로 구축됐다.
한편 이번 성과공유회는 사이버보안 분야 AI 데이터 활용 및 관련 기술 연구 등에 관심이 있는 보안·AI관련 기관‧기업들에게 데이터셋 활용방안 모색 기회를 공유하고자 마련된 자리로, △AI기반 사이버 보안전망 발표(고려대 김휘강 교수) △사이버보안 AI데이터셋 구축 전략과 사업 소개(KISA 이정민 팀장) △AI데이터셋 우수활용 사례 발표(실증기업·기관) △AI데이터셋 활용 소개(실증 참여기업) 등이 진행됐다.
과기정통부 김정삼 정보보호네트워크정책관은 “지능화‧고도화되는 사이버 위협에 대응하기 위해 사이버 보안 분야에도 AI기술 활용 증가가 예상되는 상황으로, 이번에 구축된 데이터셋이 민간 부분의 사이버 대응능력을 한 단계 도약 시킬 수 있는 마중물이 될 것”이라며, “앞으로도 정부는 양질의 사이버보안 분야 AI 데이터셋을 확대 구축할 계획이며, 타 산업분야 적용확대 및 미래 보안기술 개발 촉진으로 이어질 수 있도록 더욱 노력하겠다”고 말했다.


