플리토 강동한 최고기술책임자(CTO)

플리토 강동한 최고기술책임자(CTO)

[아이티데일리] 언어 데이터 및 전문번역 서비스 기업 플리토(대표 이정수)가 ‘언어의 제약 없이 자유롭게 소통하는 세상을 만들겠다’는 목표에 한 걸음 다가섰다. 플리토는 언어 장벽을 없애기 위한 다양한 언어 관련 서비스를 아마존웹서비스(AWS)의 클라우드 기반 앱과 웹을 통해 제공하고 있다. 플리토의 비즈니스 핵심은 언어 데이터를 수집하고 검수하며, AI 학습 및 전문번역가의 검수를 통해 고품질의 데이터를 구축하는 프로세스에 있다. 플리토는 이 같은 일련의 데이터 비즈니스 프로세스를 AWS의 클라우드에서 구현했다. 플리토의 강동한 최고기술책임자(CTO)를 만나 플리토 서비스, AWS와의 협력 체계, 이용 중인 AWS 서비스 등에 대해 들어봤다.


AWS 위에서 비즈니스 첫 출발

2012년 8월 설립된 플리토는 ‘언어의 장벽을 넘어 세상을 자유롭게 하는 기업’을 목표로 설립된 기업이다. 언어 인공지능(AI) 개발과 학습용 데이터 생성 및 영상, 웹툰 및 웹소설 번역, 기업 전문 번역 등 언어와 관련된 다양한 맞춤 서비스를 제공하고 있다. 강동한 CTO는 SK텔레콤 재직 당시 이정수 대표, 김진구 CDO와 함께 사내 벤처 프로그램에 참여했으며, 이후 의기투합해 2012년 플리토를 설립했다.

플리토 창립 멤버인 강동한 CTO는 “창립 멤버는 대표님을 포함해 총 3명이다. 대표님을 제외한 2명은 외국어에 대한 스트레스가 상당했다. 이에 다국어 커뮤니티, 언어 서비스 등 비즈니스 모델을 고민했고, 언어 데이터를 대량으로 수집해두면 데이터를 바탕으로 좋은 언어 서비스를 개발할 수 있을 것으로 기대했다”면서, “처음에는 소셜 네트워크 서비스(SNS) 번역 작업을 진행하며 언어 데이터를 수집했다. 당시 AI에 대한 관심도 적었고, 수요도 없었던 시기였기에 비즈니스가 확대되지 못했다. 하지만 점차 유저도 확보하고 집단 지성 번역을 통해 사세를 확대했고, AI가 IT 트렌드의 주류로 자리 잡자 비즈니스 모델도 확대됐다”고 말하며 창립 당시를 술회했다.

플리토는 처음 서비스를 개발할 당시 인프라를 국내 유명 호스팅 업체인 A 기업의 서비스를 이용하고자 했다. 하지만 플리토는 다양한 외국어 데이터를 수집하고 활용해야 하기에 전 세계에서 발생하는 데이터를 국내 기업의 호스팅 서비스만으로 처리할 수 없다고 판단했고, 강동한 CTO는 글로벌 데이터 수집에 용이하고 다양한 개발 서비스를 이용할 수 있는 AWS의 클라우드로 눈을 돌렸다. 강 CTO는 AWS 계정을 만든 후 싱가포르 리전에서 ‘아마존 EC2’ 서비스를 이용했다. 당시 서버 3대 분량의 EC2 서비스를 이용해 애플리케이션을 개발했다.

아울러 그는 “플리토 창립 이전 SK텔레콤을 비롯해 중소기업에서도 근무했었다. SK텔레콤은 자본이 넉넉하니 HPE, IBM 등의 HW 장비를 구매해 이용했다. 하지만 중소기업에서는 용산전자상가를 찾아가 조립 서버를 구매해 사용했었다. 플리토 창립 이후 처음 애플리케이션을 개발할 때 과거와 같이 자원과 비용에 효율이 떨어졌던 방식을 답습하고 싶지 않았다”면서 클라우드 도입 이유를 덧붙였다.

플리토는 처음 비즈니스를 시작했을 때 영국의 테크스타 런던 인큐베이팅(TechStars London Incubating) 프로그램에 아시아 기업 최초로 선정되며 8억 원의 시드 투자를 받았다. 또 AWS 클라우드를 이용할 수 있는 크레딧 7,000달러도 함께 받으며, 보다 다양한 AWS 클라우드를 이용할 수 있었다.

현재 플리토는 ‘AI 번역’, ‘아케이드’, ‘집단지성 번역’, ‘전문 번역’, ‘1:1 전문가 매칭’, ‘플레이스’ 등 다양한 기능을 추가하며 비즈니스를 확대하고 있다.


언어 AI, 언어 데이터, 전문 번역 등 3가지 비즈니스 주력

플리토는 ‘플리토’라는 플랫폼을 기반으로 △언어 인공지능(API 솔루션) △언어 데이터 △전문 번역 등 3가지 비즈니스를 중심으로 영위하고 있다. 먼저 언어 인공지능 측면에서 플리토는 인공지능 번역, 집단지성 번역, 기업특화 번역 등 3가지 종류의 API를 통해 사업을 영위하고 있다. 인공지능 번역은 플리토가 자체 개발한 인공신경망 기술을 활용해 2,000만 문장 이상 학습한 AI 번역 API다. 주로 기업 솔루션 내에서 번역문을 요청할 경우 플리토 AI 번역 엔진이 API 형태로 번역문을 실시간 전송하는 방식이다.

다음은 집단지성 번역 API 서비스다. 이 서비스는 AI가 제대로 번역하지 못하는 문장을 전 세계 언어 전문가들에게 요청하고, 상황에 맞는 자연스러운 번역 결과를 호출할 수 있다. AI 번역 엔진이 번역한 결과를 고객사가 확인하고, 집단지성 플랫폼에 수정요청을 보낸 후 고객사 서버로 번역물을 송출하는 구조다.

마지막으로 기업특화 번역 API 서비스는 기업 전용 서버에 맞춤형 AI 번역 엔진을 구성하는 방식이다. 기업 및 업계 특화 용어집을 학습한 후 기업 서버에 구성된 AI 번역 엔진은 플리토 플랫폼과 통신하며 정제된 데이터를 실시간으로 받는다. AI 번역 시 완벽하지 않은 문장은 집단지성을 통해 수정된 데이터로 재학습할 수 있다. 클라우드 개방형 API와 연동하거나 기업 자체 온프레미스에 번역 엔진을 구축하는 등 2가지 방식으로 제공된다.

아울러 플리토는 언어 데이터 비즈니스에도 총력을 기울이고 있다. 플리토는 한국어 데이터뿐만 아니라 전 세계 언어 데이터를 취급한다. 강동한 CTO는 “천만 명 이상이 사용하는 자체 플리토 플랫폼에서는 매일 수많은 고품질의 학습용 언어 데이터가 생성된다. 이렇게 생성된 언어 데이터는 고객사에 설치된 AI 엔진 고도화에 적용되거나 특정 분야의 언어 데이터 구축 프로젝트에 적용하고 있다”면서, “다국어 병렬 코퍼스(말뭉치), 다국어 음성 데이터, 이미지 데이터 등을 다루고 있다. 이 같은 데이터를 적절한 가격에 고객사에 판매하기도 한다. 특히 3단계의 집단지성 검수 및 내부 전문가 추가 검수 작업을 통해 언어 데이터의 품질이 높으며 저작권 문제도 없다”고 설명했다.

이어 그는 “플리토는 ‘플리토 플레이스’와 ‘아케이드’를 통해 언어 데이터를 수집하고 있다. 플리토 플레이스는 QR 코드를 활용한 다국어 번역 서비스이다. OCR 기술을 활용해 다국어 메뉴판, 안내판 이미지에서 텍스트를 추출한 후집단지성을 통해 정제되는 과정을 거쳐 고품질의AI 학습용 데이터로 변환된다. 아케이드는 집단지성을 통한 언어 퀴즈형 리워드 서비스다. 크라우드소싱으로 언어 관련 데이터를 수집‧가공하며 번역, 교정, 받아쓰기 등 언어와 관련된 다양한 퀴즈를 푼 유저에게는 보상으로 플리토 포인트를 지급하고, 지급된 포인트는 플리토 스토어 내에서 현금처럼 사용할 수 있다. 플리토는 해당 데이터를 정제해 AI 학습용 데이터로 활용하고 있다”고 부연했다.

 플리토의 비즈니스 체인 (출처: 플리토)
플리토의 비즈니스 체인 (출처: 플리토)

한편, 플리토는 전문 번역 서비스에도 역점을 두고 있다. 전문 번역 서비스는 기업 문서, 게임, 영상, 웹툰, 웹소설 등 다양한 분야의 전문 번역 서비스를 제공하고 있다. 플리토 전문번역실에는 전문번역가 뿐만 아니라, 번역 프로젝트 전반을 관리하는 프로젝트 매니저, 식자작업자 등이 상주하고 있으며, ‘플리토 엔터프라이즈’라는 이름의 고객 전용 번역 관리 플랫폼을 운영하며 B2B 대규모 번역 프로젝트 효율적으로 운영한다. 다음은 플리토 강동한 CTO와의 대담을 일문일답 형식으로 구성한 것이다.

플리토 강동한 CTO는 “스타트업은 비즈니스가 폭발할 수 있도록 집중해야 한다. 새롭고 혁신적인 클라우드 서비스가 비즈니스를 강화할 수 있다면, 적극 도입해 비즈니스를 확대해야 한다. 스타트업이라면 약간의 비용을 절감하고자 기존 서비스를 고수하기보다, 혁신적인 클라우드 서비스와 관리 서비스를 적극적으로 도입해 비즈니스에 집중할 수 있는 환경을 만들어야 한다”고 조언했다.


“다양한 AWS 클라우드 서비스로 비즈니스 혁신 꾀한다”

Q. AWS의 어떠한 클라우드 서비스를 어떤 기능을 위해 이용하고 있나.
A. 자사는 플리토의 API 서비스, 추가 서비스, 보안 및 시스템 엔지니어링, 관리 등 크게 4가지 부문에서 AWS 클라우드 서비스를 이용하고 있다. 먼저 API 서비스를 위해 이용하고 있다. 지역에 구분을 두지 않고 전 세계 어디서나 균등하게 서비스를 제공해야 하며, 갑작스러운 트래픽 변화에도 쉽게 대응해야 한다. 이에 ‘AWS 람다(Lambda)’와 ‘아마존 다이나모(Amazon Dynamo) DB 글로벌 테이블’을 이용하고 있다. 아울러 최근 추가하고 있는 기능을 위해서는 ‘아마존 EKS(Amazon Elastic Kubernetes Service)’를 이용하고 있다. 쿠버네티스를 기반으로 플리토 플랫폼에 기능들을 추가해 효율적으로 리소스를 관리하고, 유연하게 대응할 수 있는 환경을 구성했다.

다음으로 가장 중요한 보안 및 시스템 엔지니어링 부문에서도 AWS의 클라우드를 이용하고 있다. ‘AWS WAF v2’, ‘가드듀티(GuardDuty)’, ‘데브옵스구루(DevOpsGuru)’ 등이 대표적이다. 마지막으로 관리 업무를 줄이고 핵심 비즈니스 개발에 집중하기 위해 AWS의 관리형 서비스들도 이용 중이다. 대표적으로 ‘아마존 RDS’, ‘아마존 엘라스틱캐시(Amazon ElastiCache)’, ‘AWS 오픈서치(Open Search)’, ‘AWS 도큐먼트DB(DocumentDB)’ 등이다.

Q. 현재 플리토 플랫폼에 대해 MSA화를 진행 중이라고 들었다.
A. 그렇다. 최근 추가되는 기능과 서비스부터 기존 기능까지 마이크로서비스 아키텍처(MSA)화하고 있다. 플리토는 2017년도에 쿠버네티스(Kubernetes)를 도입하면서 도메인을 마이크로서비스 단위로 분리하는 작업을 진행하고 있다. 기존 모놀리식(Monolithic) 아키텍처 형태에서는 배포에 큰 부담이 있었고, 장애가 발생할 경우 서비스 전체를 멈춘 후 장애를 수습했다. 대부분의 스타트업들이 그렇듯 MSA 전문가가 없었기에 처음에는 걱정이 앞섰다. 해서 기존의 서비스와 기능을 MSA화 하기보다는 새로 추가하는 기능을 중심으로 MSA화했다. 이 과정에서 MSA화 작업에 엔지니어들이 익숙해졌고, 기존 서비스와 기능의 MSA 작업을 원활히 할 수 있는 계기가 됐다. 물론 현재 MSA 과정이 6년차에 접어든 상황에서 MSA로 100% 전환했다고 평가하지는 못하지만, 꾸준하게 MSA 기반 플랫폼으로 진화하려 노력 중이다.

Q. 쿠버네티스가 부상하기 전부터 이용을 했는데, 어려운 점은 없었는가.
A, 물론 어려운 점이 있었다. 플리토는 K-옵스(kOps)라고 하는 컨테이너 관리 프로젝트가 등장한 2017년부터 AWS 클라우드 위에 쿠버네티스를 직접 설치해 이용했다. K-옵스는 쿠버네티스를 AWS 클라우드에서 클러스터를 생성하고 EC2 노드 개수 증감을 관리할 수 있는 오픈소스다. 우리는 AWS EC2 위에 K-옵스를 설치해 쿠버네티스를 이용했다.

괴로운 작업이 많았다. 쿠버네티스 업데이트에 대한 공부는 물론 업데이트에 따른 타 서비스와의 호환성 연계 작업 등 관리에 대한 이슈가 컸다. 그러던 찰나 AWS가 당시 리인벤트를 통해 아마존 EKS를 공개했다. 자사에서는 아마존 EKS를 적극적으로 도입해 이용했다. 아마존 EKS는 콘솔에서 업데이트만 선택하면 손쉽게 패치를 적용할 수 있다. 물론 일부 노드에 대한 버전업 작업은 수행해야 하지만, 그래도 K-옵스에 비해 1/10 수준으로 공수가 줄었다.

또 해당 서비스를 도입하는 과정에서 AWS코리아 측에서 1~2일 워크숍 등 스터디 세션도 제공해줬다. 이 덕분에 서비스에 대한 역량도 확보할 수 있었다. 새로 플랫폼에 추가하는 서비스의 경우 쿠버네티스를 기반으로 개발, 배포, 관리하고 있으며, 모니터링을 위한 서비스도 쿠버네티스로 이용하고 있다.

Q. 최근 클라우드 비용 효율을 높이는 방향이 중요하다고 한다. 추천하는 방식이 있다면.
A. 전 세계적으로 경제가 흔들리면서 기업들에서 가장 많이 나오는 말 중 하나가 바로 클라우드를 비롯한 IT 비용을 절감하는 것이다. 이와 관련해 플리토가 직접 경험하며 쌓아온 팁이 있다. 바로 AWS가 보유하고 있는 리전을 적절히 이용하는 것이다. 서비스마다 비용이 다르지만 통상 클라우드 서비스 중 가장 많은 비용을 차지하는 부분은 EC2 GPU 인스턴스다. 플리토를 예로 들어 설명하겠다. 플리토는 AI 모델 정확도를 높일 수 있는 양질의 데이터를 수집해야 한다. 또 데이터의 양이 늘어나면 날수록 AI 모델을 훈련할 때 들어가는 GPU 인스턴스 비용도 많이 든다. 이에 플리토는 서울 리전보다 저렴한 미국 서부 오레곤 리전을 이용하고 있다. 물론 이 과정에서 실시간 작업이 필요할 경우 이 방법을 추천하지는 않는다. 거리상 네트워크 레이턴시가 존재하기 때문이다. 주변 업계 관계자들 말로는 오레곤 리전 외에도 미국 동부의 노스 버지니아도 저렴하다고 한다.

이 외에도 예약 인스턴스(RI)를 활용하거나 세이빙 플랜(SP)을 통해 클라우드 이용 약정을 걸고 요금을 한일 받을 수 있다. 전문 MSP의 도움을 받는 것도 비용을 절감할 수 있는 좋은 방법이다. 플리토는 메가존클라우드의 도움을 받아 비용을 절감하고 있다.

Q. 향후 도입을 고려 중이거나 검토하고 있는 AWS의 서비스는 무엇이 있는가.
A. 최근 인공지능(AI) 부문에서 화두로 떠오른 챗GPT와 같은 생성형 AI 서비스 도입을 고려하고 있다. AWS에서도 최근 ‘베드락(Bedrock)’이라는 서비스를 출시했다. 베드락은 기업들이 아마존의 파운데이션(기반) 모델을 활용해 생성 AI 애플리케이션(앱)을 구축할 수 있는 서비스다. 이를 통해 아마존의 자체 초거대언어모델(LLM) ‘타이탄(Titan) FM’을 비롯해 AI21 랩스(Labs), 앤트로픽(Anthropic), 스태빌리티(Stability) AI 등을 사용할 수 있다.


“AWS로 비즈니스 핵심에만 집중할 수 있는 환경 마련”

Q. AWS의 클라우드 서비스가 비즈니스에 어떠한 가치를 줬는가.
A. 플리토의 비즈니스에 AWS의 클라우드 서비스는 복잡한 일들을 대신해 주는 조력자가 되어줬다고 정의할 수 있겠다. 스타트업의 특성상 비즈니스 핵심에 집중해야 하지만, 환경적인 제약이 존재한다. 그 중 가장 큰 이슈는 바로 인력이다. 대기업이나 중견기업의 경우 인력에 대한 부담이 없진 않겠지만, 적은 편이다.

플리토는 데이터를 기반으로 비즈니스를 영위한다. 그렇기에 DBA(DB 관리자)와 데이터 사이언티스트가 비즈니스의 중추다. 기업이 이러한 고급 인력을 보유하면 좋지만, 그렇게 하기 어려운것이 현실이다. 이러한 문제를 플리토에서는 AWS의 완전 관리형 서비스로 대체했다. 가령 DBA의 DB 이중화, 백업, 성능 분석 등 업무를 아마존 RDS로 대체했다.

특히 보안과 관련된 전문가를 확보하기는 더더욱 어렵다. 플리토는 보안 전문가가 해야 할 업무를 AWS의 클라우드 서비스를 통해 대체하고 있다. 실제로 AWS의 WAF v2를 이용하고 있다. 한 사건을 소개한다면, 플리토의 플랫폼에는 리워드를 제공하는 기능이 있다. 이 서비스에 대해 특정 국가에서 해킹이 많이 들어온다. 그러던 중 회원 아이디와 패스워드가 담긴 DB를 불법적으로 구매해 한 번씩 찔러보는 방식의 브루트 포스(Brute Force)라는 공격이 있었다. 쉽게 말해 네 자리 자물쇠를 일의 자리부터 천의 자리까지 하나하나 다 맞춰보는 방식이다. 실제로 플리토의 리워드 서비스에 대해 AWS의 보안 서비스로 공격 IP를 확인한 결과 대구의 한 제조업의 서버에서 일어나고 있었다. 직접 제조 기업에 전화해 서버가 해킹됐다고 말해 점검 받으라고 조언했다. 실제로 해당 전산실에 오래된 서버가 있었고 그 서버의 포트를 통해 공격이 발생했었다.

이처럼 보안 전문가나 DBA가 필요한 작업을 AWS의 클라우드 서비스로 대체함으로써 애플리케이션 개발과 관리에 더 많은 공수를 들일 수 있었고, 비즈니스에 집중할 수 있었다.

Q. AWS와의 협업은.
A. AWS와 기술, 비용, 교육 등 부문에서 도움을 받고 있다. 기술, 비용 측면에서 AWS코리아의 어카운트 매니저, 솔루션즈 아키텍트들로부터 많은 조언을 받고 있다. 새로운 서비스나 자사 플랫폼에 적용하면 효율성이 높아질 것 같은 서비스들을 제안해주곤 한다. 아울러 플리토 역시 AWS의 다양한 서비스를 이용해보고 피드백을 주기도 한다. AWS의 서비스 개발 방향이 고객사의 피드백을 반영하는 것인 만큼 피드백에 귀를 귀울인다. 최근에는 ‘AWS 베드락’이라는 생성형 AI 서비스를 써보고 싶다는 의사도 전달하기도 했다. 또한 AWS는 고객사가 클라우드를 잘 이용할 수 있도록 많은 정기‧비정기 교육 프로그램들도 제공하고 있다. 플리토로 솔루션즈 아키텍트가 찾아와 해당 서비스에 대한 교육, 아키텍처 교육부터 비즈니스에 대한 부분까지도 세심하게 신경 써주고 있다.

Q. 데이터 비즈니스를 하려는 스타트업에게 조언한다면.
A. 데이터를 기반으로 비즈니스를 하기 위해선 가장 먼저 양질의 데이터를 확보하는 것이 핵심이며, 또 확보한 데이터를 클라우드 위에서 데이터 비즈니스 프로세스를 만들어야 한다. 고품질 데이터를 토대로 AI 모델의 완성도를 점수로 평가하자면 60~70점 수준의 데이터는 인터넷 상에서 수집하거나 공개된 모델을 이용해 쉽게 도달할 수 있는 수준이다. 하지만 그 위부터는 데이터가 아무리 고품질이라도 1점 올리기 어렵다. 데이터를 정제하기 위해선 데이터 사이언티스트만 수행할 수 있는 작업도 요구된다. 그 다음에는 AI 모델을 훈련하기 위해 필요한 인프라도 갖춰야 한다.

쉽게 말해 데이터 비즈니스는 비용과 노력이 상당히 많이 요구된다. 조금이라도 비용 효율성을 갖추고 개발 공수를 줄이기 위해 클라우드를 이용하길 권장한다. CSP들이 제공하는 클라우드 서비스는 데이터 전문가의 작업을 대체할 수 있어 개발에 필요한 노력을 줄일 수 있으며, AI 모델 훈련에 필요한 인프라도 필요할 때만 이용할 수 있어 비용 효율적이다. 이렇게 클라우드 위에서 AI 모델 훈련을 수행하고 비즈니스를 만들 수 있는 일련의 프로세스를 한시라도 빠르게 완성하고 비즈니스에 몰두해야 한다. 그래야 생존할 수 있을 것이다.

저작권자 © 아이티데일리 무단전재 및 재배포 금지