김병훈 메가존 AI 센터 ML팀 이사

[아이티데일리] 클라우드 시대가 무르익고 있다. 기업 및 기관들은 모두 클라우드라는 새로운 물결에 몸을 싣고 비즈니스 혁신에 나서고 있다. 그러나 초기 퍼블릭 클라우드 열풍을 넘어 이제 멀티·하이브리드 클라우드라는 한층 복잡한 IT환경을 마주하면서 당초 기대와는 달리 원하는 만큼의 성과를 거두지 못하고 있다. 이에 대해 클라우드 업계 전문가들은 “클라우드 구축 이전 기업의 비즈니스에 맞도록 확장성에 중점을 둔 설계와 전략이 부족했기 때문”이라고 분석하고 있다.

컴퓨터월드/IT DAILY는 기업들이 실패하지 않고 멀티·하이브리드 클라우드를 구축할 수 있도록 방안을 제시하고자 지난달 26~27일 양일간 ‘2021 클라우드 웨비나’를 개최했다. 국내 클라우드 업계 발전을 위해 바쁘게 뛰고 있는 산업계·학계의 전문가들로부터 멀티·하이브리드 구축 전략과 인공지능(AI)·데이터 활용 방안 등에 대해 들어본다.


성공적인 AI 도입을 위한 7가지 가이드

김병훈 메가존 AI센터 이사는 ‘성공적인 AI 도입을 위한 7가지 가이드’라는 주제로 발표했다. 김병훈 이사가 주장한 성공적인 AI 도입 방안 7가지 가이드는 ▲작게 시작하라 ▲측정 가능한 기준을 만들어라 ▲복잡한 업무를 쉬운 업무로 나눠 적용하라 ▲반드시 AI/ML 파이프라인을 만들어라 ▲공개된 알고리즘/모델 적극 활용하라 ▲‘알고리즘 개선’, ‘데이터셋 개선’ 둘 다 고려하라 ▲가능하면 클라우드 네이티브 제품을 활용하라 등이다.

김병훈 이사는 성공적으로 AI를 도입하기 위해선 작게 시작해야 한다는 점을 강조했다. 3~4명으로 구성된 작은 팀을 구성할 것을 주문했다. 전‧방위적으로 어떤 새로운 기술을 도입할 때 전사적으로 팀을 꾸리고 조직을 개편하기보다 구체적이고 작은 일을 소규모 팀을 통해 먼저 추진해보는 것이 중요하다. 이를 통해 개선해야 할 사항을 찾을 수 있다.

다음으로는 측정 가능한 기준을 만들어야 한다. 김병훈 이사에 따르면 AI 도입과 상관없이 비즈니스 및 업무 성과를 측정하는 기준은 기업마다 반드시 필요하다. 일부 기업들은 기존 업무를 지속적으로 해왔기 때문에 별다른 성과를 측정하지 않는다. 하지만 AI 도입의 경우에는 개선 여부를 확인해야하기 때문에, 반드시 측정 가능한 정량적인 기준이 필요하다. 아울러 현재 기업의 업무 수준에 타당한 현실적인 성공 기준을 설정해야 한다. 김 이사는 현실적인 AI 성공 기준으로 사람이 하고 있는 일과 비교하는 것을 권장했다.

세 번째로는 복잡한 업무를 쉬운 업무로 나눠 적용해야 한다. 복잡한 업무에 AI를 적용하기는 쉽지 않다. AI 모델을 개발하기 어려울 뿐만 아니라 데이터셋을 설계하는 것도 쉽지 않다. 김병훈 이사는 “복잡한 업무를 세분화 하기도 한다. 또한 순차적으로 나눠서 처리하는 것도 좋은 방법이다. 복잡한 업무를 기본적인 업무 몇 개로 세분화 한다면 최종적으로 하고자 하는 AI 솔루션을 얻을 수 있을 것”이라고 설명했다.

네 번째로 AI와 ML 파이프라인을 개발해 사용해야 한다는 점을 강조했다. 김병훈 이사에 따르면, AI 프로젝트는 단순 반복 작업이 많다. 단순 반복 작업을 코드화해 저장하게 되면 추후 다시금 반복 작업이 발생할 때 불러와 활용할 수 있다. 이러한 코드를 묶어 파이프라인 코드를 구성하고 다시금 대규모 반복 실험을 수행한 후 안정화를 진행한다. 실제 대부분 성능이 좋다고 알려진 AI 모델은 이러한 일련의 과정을 적용하고 있다.

다섯 번째는 공개된 알고리즘 혹은 모델을 적극 활용하는 것이다. 김병훈 이사는 모델을 직접 개발하기 이전 공개된 알고리즘과 모델을 우선적으로 검토하는 것을 추천했다. 현재 AI 및 ML 업계에는 많은 기업의 AI 및 ML 전문가들이 개발한 모델들이 존재한다. 이처럼 공개된 모델 간의 성능을 비교해 AI 프로젝트에 적용한다면 시간과 비용을 절약할 수 있다.

여섯 번째 좋은 AI 모델을 만들기 위해선 ‘알고리즘 개선’, ‘데이터셋 개선’에 집중해야 한다. 데이터셋 품질을 개선하면 모델의 정확도를 높일 수 있다. 알고리즘을 개선 역시 마찬가지다. 다만 데이터셋의 품질을 높일 수가 없는 경우도 종종 존재한다는 점을 알아들 필요는 있다.

마지막으로 김 이사는 클라우드 네이티브 관련 솔루션을 적극 활용해야 한다고 강조했다. 현업에서는 구축된 서버나 PC에 존재하는 데이터셋만으로도 문제가 없는 경우도 있지만, 대부분은 상당한 컴퓨팅 파워를 필요로 한다. 이러한 경우 클라우드 서비스 제공사들이 제공하는 서비스를 활용하는 게 효율적이다.

김병훈 메가존 AI센터 이사는 “대규모 병렬처리 코드를 직접 개발하기보다 구글의 ‘빅쿼리’, ‘오토ML’, AWS의 ‘레드시프트’, MS의 ‘시냅스 애널리틱스’ 등을 활용하는 게 좋다”면서, “이러한 수요를 AWS와 MS, 구글 등과 같은 기업들도 인지하고 단순한 AI‧ML 제품 수준을 넘어 토털 플랫폼 서비스 형태로 솔루션을 고도화하고 있다”고 설명했다.

관련기사

저작권자 © 아이티데일리 무단전재 및 재배포 금지