자연어처리 기술 활용해 비정형 텍스트 및 문서 내 개인정보 탐지 가능

[아이티데일리] 파수(대표 조규곤)는 자사의 개인정보 비식별 솔루션 ‘애널리틱디아이디(AnalyticDID, 이하 ADID)’에 인공지능(AI) 기반 자연어 처리 기술을 탑재했다고 2일 밝혔다.

파수의 ADID는 개인정보 비식별화 솔루션으로, 재식별 위험 및 개인정보 유출 우려 없이 데이터를 안전하게 가명‧익명 처리한다. 이번 업데이트로 ADID는 AI 기반의 자연어 처리(NLP, Natural Language Processing) 기술을 사용해 비정형 텍스트나 문서에 포함된 개인정보를 탐지가 가능해졌다.

ADID에 적용된 자연어 처리 기술은 높은 정확도를 보이는 트랜스포머 기술 기반의 언어 모델을 한글의 특성과 개인정보의 특성에 맞게 학습해 데이터에 포함된 개인정보를 문장 속 맥락 이해에 기반해 식별할 수 있다. 예를 들어 주소가 포함된 데이터의 경우 행정구역 체계를 광역시도, 시군구, 동읍면리, 상세주소 등으로 단계를 구분해 탐지할 수 있다. 또한 개인의 키나 몸무게를 개인 정보가 아닌 다른 길이나 무게와 구분하는 등 까다로운 문장 속에서도 높은 인지 정확도를 보여준다.

아울러 파수는 ADID가 데이터 유형과 사용 목적에 맞는 최적의 비식별화도 적용해 데이터 안전성과 효용성도 보장한다고 설명했다. 가명 정보 처리 관련 최신 가이드라인 개정안 및 데이터 3법 등 국내 개인정보 처리와 관련한 법률 및 가이드라인을 100% 지원해 컴플라이언스에서 요구하는 기능을 제공한다.

파수 조규곤 대표는 “올해 하반기에는 ADID에 개인정보처리를 위한 주요 통계치를 자동 계산해주는 기술을 추가하고, AI 기반의 문서 스캔 이미지 마스킹 기술을 발표할 예정”이라며, “결합전문기관, 데이터전문기관, 빅데이터 업체 등과 함께 하며 시장을 선도해온 파수의 ADID는 향후에도 지속적인 혁신을 통해 새로운 데이터 가치를 창출하고자 하는 기업과 기관을 적극 지원할 것”이라고 말했다.

저작권자 © 아이티데일리 무단전재 및 재배포 금지