고재정 와이즈스톤 SW시험센터장

[아이티데일리] “쓰레기를 넣으면 쓰레기가 나온다(garbage-in, garbage-out)”, 데이터 사이언스의 특징을 단적으로 보여주는 문장이다. 인공지능(AI)과 머신러닝 등 최신 IT 기술들이 올바른 결과를 출력하기 위해서는 무엇보다 먼저 정확한 데이터가 입력돼야 한다. 오늘날 전 세계 기업들은 최신 IT 기술을 자사의 비즈니스에 적용하기 위해 고품질의 정제된 데이터 확보에 나서는 이유이다.

최근 SW테스팅 서비스 전문기업 와이즈스톤은 이러한 정제된 데이터 수요에 대응하기 위해 국내 산업계의 데이터 품질 향상 및 관리를 위한 서비스 제공에 나섰다. 와이즈스톤은 지난 10월 한국인정기구(Korea Laboratory Accreditation Scheme, 이하 KOLAS)로부터 데이터 품질 분야의 국제공인시험기관으로 인정받았다. 이를 바탕으로 ISC/IEC 25024를 통해 데이터를 시험·평가하고 공신력 있는 공인시험성적서를 발행함으로써 국내 데이터 품질 관리의 기준을 마련하겠다는 방침이다.

고재정 와이즈스톤 SW시험센터장으로부터 와이즈스톤이 구상하는 데이터 품질 관리의 미래에 대해 들어봤다.

▲ 고재정 와이즈스톤 SW시험센터장

명확한 데이터 품질 측정 기준 마련해야
지난 12월 17일, 제53회 국무회의에서 문재인 정부의 인공지능(AI) 국가전략이 발표됐다. 이는 AI 기반의 경제적·사회적 혁신을 이룩하기 위한 구체적인 실행방안을 담은 것으로, 지난 10월 문재인 대통령이 발표한 기본안을 바탕으로 과학기술정보통신부를 비롯한 20개 부처가 참여해 마련했다. AI 기반의 경제적·사회적 혁신을 위해 네거티브 규제 로드맵을 제시하거나 AI 관련 교과과정과 학과를 증설하는 등 범정부적인 행동에 나서겠다는 설명이다.

한편 산업계에서는 AI 기반의 혁신을 위해 가장 근본이 되는 올바른 데이터 확보에 혈안이 돼있다. AI는 물론이거니와 최근 몇 년 사이 전 세계의 화두로 떠오른 ICBM(IoT, Cloud, Big data, Machine leaning) 등 최신 IT 기술들의 대부분이 데이터와 상당한 관계를 맺고 있기 때문이다. 각각의 기술들이 양질의 대고객 서비스를 제공하거나 정확도 높은 의사결정을 지원하는 등 실제 산업계에서 효과를 발휘하기 위해서는, 정부의 지원이나 규제 개선도 필요하지만 무엇보다 양질의 데이터의 확보가 우선돼야 한다.

그렇다면 양질의 데이터란 무엇이며, 이는 어떻게 구분할 수 있는가? 기업 입장에서는 분석이나 AI 학습에 사용할 수 있도록 정제된 데이터가 필요한데, 폭발적으로 증가하고 다양해지는 데이터들을 검사해 좋은 데이터를 선별해내는 것은 쉽지 않다. 특히 새롭게 수집되는 데이터만이 아니라 그동안 축적된 데이터에서도 유의미한 것들을 추려내기 위해서는 데이터 하나하나를 검사하기 위한 공통된 기준이 필요하다.

와이즈스톤은 지난 10월 KOLAS로부터 데이터 품질과 관련된 국제공인시험기관으로 인정받았다. KOLAS로부터 인정받은 기업·기관은 전 세계에서 공통적으로 적용되는 데이터 품질 국제표준 ISO/IEC 25024에 따라 기업이 보유한 데이터의 품질을 평가하고, 그에 맞는 시험성적서를 발행할 수 있다. 필요에 따라 얼기설기 만든 데이터 관리 규정이 아니라 사전에 논의된 국제표준에 따라 데이터 품질을 평가하므로 객관성 확보가 가능하다.

특히 와이즈스톤이 발행하는 시험성적서는 KOLAS가 맺은 국가간 상호인정협정(Mutual Recognition Arrangement, MRA)에 따라 다른 국가에서도 그 가치가 인정된다. 해외에서 데이터 기반 사업을 추진하려는 경우 와이즈스톤의 데이터 품질 시험성적서가 활용될 수 있다. 현재 국내에서 데이터 품질 관리 분야에서 KOLAS 인정을 획득한 것은 와이즈스톤이 유일하다.

▲ 데이터 품질 시험·평가 진행 절차

“전 산업 분야에서 데이터는 지속적으로 방대하고 다양해지는데, 그게 정말 제대로 된 데이터인지 검증할 수 있는 절차는 아직 마련되지 못한 상태다. 이에 와이즈스톤은 데이터 품질 분야의 KOLAS 공인시험기관으로써 국내 데이터 품질 검증 분야의 기준을 세우고자 한다.”

다음은 고재정 와이즈스톤 SW시험센터장과의 인터뷰를 문답식으로 정리한 것이다.


Q. 데이터 품질 시험·평가가 필요한 이유는?
국내에서 데이터 품질 검사 및 관리라고 하면 아직까지 데이터 정책에 대한 것으로 이해하는 경우가 많다. 이는 양질의 데이터를 확보하기 위해 어떤 전략을 세우고 어떻게 관리해야 하는지를 논의하는 분야다. 궁극적으로 양질의 데이터 확보라는 목표는 같지만, 와이즈스톤이 제시하는 데이터 품질 시험과는 포커스가 다르다.

와이즈스톤은 데이터 품질 분야의 KOLAS 국제공인시험기관으로, 양질의 데이터를 확보하기 위한 방법론이나 전략이 아닌 데이터 그 자체에 대한 시험과 검사를 목표로 한다. 기존에 경험이나 노하우에 의존하는 검사 방법이 아닌, 전문화된 도구와 검증인력들이 ISO/IEC 25024라는 국제 표준에 의거해 활용 가능한 데이터인지를 검증한다. 이렇게 검증된 데이터는 해당 데이터를 기반으로 구축된 AI·머신러닝 서비스들의 성능을 향상시킬 수 있는 것은 물론, 정확도에 대한 신뢰도 높일 수 있다.

특히 지난해 정부와 산업계에서 공통적으로 강조한 데이터 유통 활성화에도 도움이 될 것이다. 우리가 어떤 물건을 구입할 때 해당 제품의 상세한 제원이나 품질을 확인하는 것은 당연하다. 구매자 입장에서는 이러한 정보가 공개되지 않은 제품에 대해 불신이 생기게 마련이다. 이는 데이터 역시 마찬가지다. 하지만 아직까지 데이터 분야에서는 유통되고 있는 데이터의 품질을 객관적으로 확인할 수 있는 방법이 없었다.

이러한 가운데 와이즈스톤이 발행하는 데이터 품질 시험성적서는 유통되는 데이터의 품질을 객관적으로 판별할 수 있는 기준이 될 것이다. 판매자는 자신의 데이터가 우수한 품질을 가지고 있다는 것을 증명하고, 구매자는 마켓에 올라와있는 다양한 데이터 중 원하는 내용과 품질을 갖춘 데이터를 취사선택할 수 있게 된다. 여타 제조산업의 품질인증 표시와 같이, 데이터 품질 시험성적서가 해당 데이터의 객관적인 가치 판단 기준으로 작용하는 것이다.


Q. 기존의 데이터 품질 측정과의 차이점은?
그동안 국내 기업·기관들이 데이터 품질 검사를 아예 하지 않았던 것은 아니다. 그들 역시 나름대로 각자가 가진 데이터를 검사할 수 있는 체계적인 방법론을 갖추고 있었을 것이다. 특히 와이즈스톤이 갖춘 데이터 품질 검사 시험이나 각 기업이 보유한 데이터 검사 체계나 아주 기본적인 부분에서는 큰 차이가 없을 것으로 본다. 가령 같은 데이터 내에서 날짜를 표기하는 방법이 다르다든가 하는, 상식적인 수준에서 오류로 판별해야 하는 것들은 각 기업·기관의 데이터 품질 검사에서도 마찬가지로 찾아낼 것이다.

하지만 이는 각 기업·기관의 자체 기준인 만큼 전 산업계, 나아가 전 세계에서 공통적으로 통용될 수 있는 객관성을 가지지 못했다. 해당 기업·기관의 업무 특징이나 업계 상황에 영향을 받아 편중된 평가가 이뤄질 수도 있다. 따라서 외부에서는 해당 기업·기관의 자체적인 데이터 품질 검사 결과를 신용하기가 쉽지 않다.

와이즈스톤은 ISO/IEC 25024를 기준으로 가장 객관적인 데이터 품질 검사 시험을 제공하며, 이를 통해 발행되는 시험성적서는 ILAC MRA가 맺어진 전 세계 60여 개 국가 70여 개 기구에서 동일한 효력을 인정받을 수 있다. 실제로 한 블록체인 기업은 우리가 발행한 시험성적서를 미국에서의 사업 추진 및 확장에 활용한 바 있다.

▲ 데이터 품질 시험·평가 항목 및 방법

Q. KOLAS 공인시험기관으로 선정된 이유는?
KOLAS 인정을 획득하기 위해서는 KOLAS가 지정하고 있는 규칙이나 시험센터 운영방식, 보유하고 있는 기술 역량 등에 대해 포괄적인 심사를 받아야 한다. 어느 하나라도 기준치에 미달한다면 인정을 획득하기는 어렵다. 게다가 매년 시행되는 감사와 4년마다 시행되는 재인정심사에서 기준치에 미달한 결과를 낼 경우 기존에 발행한 시험서 인정이 취소될 수도 있고, 심할 경우 KOLAS 인정 자체가 취소될 수도 있다.

실제로 와이즈스톤이 SW품질인증 기관으로 KOLAS 인정을 획득할 때는 사전 준비 기간만 약 2년여가 소요됐다. 지금도 여전히 KOLAS 국제공인시험기관 자격을 유지하기 위해 체계적인 관리를 수행하고 있다.

다만 이번 데이터 품질 관련 KOLAS 인정의 경우, 와이즈스톤이 기존에 SW품질인증 기관으로 활동하고 있었기 때문에 상대적으로 준비 기간이 적게 소요됐다. 와이즈스톤은 2018년부터 준비를 시작해 2019년 10월 공인시험기관으로 인정받았다. 이는 이미 KOLAS 인정을 획득하기 위해 준비해야 되는 환경이나 인력 등의 요소들을 이미 갖추고 있었기 때문에 가능했다. 특히 KOLAS 인정에서 가장 어려운 점이 해당 기술에 대한 공인 자격증을 갖춘 인력들을 확보해야 한다는 것인데, 이러한 부분에서 와이즈스톤은 경력과 노하우를 갖춘 인재들이 풍부해 큰 문제없이 심사를 통과할 수 있었다.


Q. 데이터 품질 시장과 관련해 향후 계획은?
아직은 국내 시장에서 데이터 품질을 객관적으로 검증해야 한다는 인식이 낮지만, 장기적으로는 이러한 인식을 개선해나가야 한다고 생각한다. 와이즈스톤은 KOLAS 인정을 통해 공인된 민간 기업으로써 데이터 품질 시험성적서에 대한 인지도와 신용도를 높여 나가려고 한다. 국내 기업 및 기관들과 지속적으로 만나 데이터 품질에 대한 인식을 향상시키고, 이를 정확히 측정해 얻을 수 있는 실질적인 혜택 등을 소개할 계획이다. 특히 데이터 관련 협회 등과 협업해 공공성 있는 활동들을 전개하려고 한다.

한편 정부 측에서도 데이터 품질 관리 및 측정을 권장 혹은 의무화함으로써 민간과 서로 협조해나가야 한다고 생각한다. 우수한 민간 기업의 역량과 정부의 제도 개선을 통한 투 트랙 전략이 필요하다는 얘기다. 앞서 말한 바와 같이, 데이터 품질을 객관적으로 측정하는 것은 현 정부가 추진하는 데이터 중심 사회나 AI 기반의 혁신을 위해서도 매우 중요한 일이다. 현 정부가 IT 혁신 정책의 목표를 달성하기 위해서는 적극적으로 데이터 품질 시험·평가에 관심을 가질 필요가 있다.

저작권자 © 아이티데일리 무단전재 및 재배포 금지