[기획특집] 클라우드, DBMS 시장의 변곡점 될까

클라우드 전환 가속화…오픈소스 진영 반격도 거세

[컴퓨터월드] 클라우드 환경으로의 전환은 DBMS(DataBase Management System) 시장의 가장 큰 트렌드다. 기업별로 조금씩 차이를 보이기는 하지만, 대부분의 DBMS 공급 기업들은 고객들의 클라우드 전환 요구에 발맞춰 효과적인 클라우드DB 서비스를 공급하고자 노력하고 있다. 이는 공급기업들이 클라우드 전환으로 확보할 수 있는 효과에 대해 인식한 것은 물론, 고객들의 비즈니스 영역이 클라우드로 이동하면서 자연히 클라우드 DB에 대한 요구가 발생했기 때문으로 풀이된다. 본격적인 클라우드 전환을 앞둔 DBMS 시장의 변화를 분석해본다.

클라우드에 집중…매출로 드러나지는 않아
일반적으로 엔터프라이즈 시스템이 클라우드로 전환되는 경우 필요에 따라 유연하게 IT 리소스를 확장해 갑작스런 시스템 부하에 대비할 수 있으며, 빠른 구축과 저렴한 초기 도입 비용, 유지보수 인력 절감 등의 효과를 볼 수 있다. 이를 바탕으로 어느 정도 규모가 갖춰진 기업에서 구입이 가능했던 DBMS 제품들을 스타트업이나 중소기업에서도 사용할 수 있게 됨으로써 이들의 비즈니스 변화를 가속화한다.

DBMS는 특히 클라우드 상에서 확보할 수 있는 고가용성이 큰 장점으로 거론된다. 다른 시스템도 가용성을 따지는 것은 마찬가지지만, DBMS는 안정성과 가용성, 무결성 등이 성능보다도 중요하게 여겨지는 분야다. DBMS에 장애가 발생한다는 것은 모든 비즈니스가 중단되는 것과 마찬가지이기 때문이다. DBMS 시장에서 오라클의 RAC(Real Application Clusters)나 DB 복제 방식(Replication)과 같이 가용성을 높이고 장애 발생에 신속하게 대처할 수 있는 기술들이 발달해온 것도 이런 이유 때문이다.

물론 클라우드도 시스템 장애에서 100% 안전한 공간은 아니다. 여전히 트랜잭션 과부하 등 SW나 네트워크 상에서 장애를 일으킬 수 있는 요소는 존재하며, 하다못해 데이터센터에 화재가 발생해 물리적으로 서비스가 중단될 수도 있다. 그러나 기업에서 별도의 HW 관리를 요구하지 않는 클라우드로의 전환은 가장 최소한으로 잡아도 HW 이상으로 발생할 수 있는 DBMS 장애의 위협에서는 벗어날 수 있게 됐다. 또한 클라우드 단에서 장애가 발생하더라도 온프레미스 환경보다 신속하게 대처 가능하다는 점은 DBMS의 클라우드 전환을 더욱 가속화 하는 이유이다.

다만 DBMS 공급 기업들의 적극적인 클라우드 전환 행보와 고객들의 빗발치는 클라우드 요구와는 상반되게, 모두의 주목을 한 눈에 받고 있는 클라우드 DBMS의 시장 매출은 아직까지 미진한 편이다.

이에 대해 한 글로벌 DBMS 공급업체 관계자는 고객들이 비즈니스의 가장 핵심적인 영역을 클라우드로 전환하는 것을 주저하고 있기 때문이라고 분석했다. 현재 클라우드로 빠르게 전환되고 있는 것은 대외 업무, 데이터 수집 관련 업무 등 비즈니스의 핵심과는 거리가 있는 영역들이다. 이들은 상대적으로 중요도가 떨어지기에 고성능의 DBMS나 값비싼 옵션을 적용할 필요가 없다. 기업 입장에서는 중요도에 비해 너무 많은 관리 인력을 필요로 했던 분야를 클라우드로 전환하면서 비용 절감 및 관리의 편의성을 확보하고 있는 셈이다.

기간계 시스템과 같이 비즈니스의 가장 핵심적이고 중요한 데이터는 아직까지 온프레미스로 운용하고자 하는 기업들이 많다. 이들은 클라우드가 제공하는 안정성과 편리함을 부정하는 것은 아니지만, 회사 밖으로 자사 데이터가 반출되는 것을 원하지 않거나 핵심적인 시스템을 외부에 맡기는 것을 어려워하는 등 전면적인 클라우드 전환에는 부정적이다. 이에 따라 온프레미스와 클라우드를 결합한 하이브리드 DBMS를 구축하는 사례 역시 확산되고 있다.

Built in Everything, 데이터 플랫폼
클라우드 전환이 가속화되면서 DBMS 시장의 판도에도 변화가 일어나기 시작했다. IBM이나 SAP와 같은 글로벌 DBMS 공급 기업들은 클라우드 시장을 선점하기 위해 온프레미스와는 다른 전략과 서비스 정책을 시행하고 있으며, 전통의 강자인 오라클은 상대적으로 클라우드 전환에 소극적인 것으로 보인다. 한편 국내 업계 관계자는 클라우드 DBMS 시장에서 가장 주목받고 있는 기업으로 마이크로소프트(MS)와 아마존웹서비스(AWS)를 꼽았다.

MS는 지난해부터 빌트 인 에브리씽(Built in Everything)이라는 모토 아래 단일한 데이터 플랫폼 상에서 모든 것들을 지원하겠다고 강조해왔다. 이는 단순한 DB 관리에서 벗어나 말 그대로 데이터와 관련된 모든 것들, 이를테면 정형·비정형데이터나 기업 내·외부에 있는 데이터의 수집·관리, 이를 저장하기 위한 DW(Data Warehouse) 구성, 인공지능(AI) 및 머신러닝을 위한 알고리즘, 비즈니스를 지원하기 위한 BI(Business Intelligence)와 분석 기능 등을 단일한 클라우드 플랫폼 상에서 지원하겠다는 전략이다.

MS 측에서는 이를 SQL서버 통합서비스(SQL Server Integration Services, SSIS)로 제공하고 있다. 이를 통해 고객들은 각각의 솔루션을 도입해 연동하고 있는 다양한 기능과 데이터들을 단일한 클라우드 플랫폼 상에서 통합하고 활용할 수 있다.

MS는 지난 3년간 전 세계 IT 산업에서 가장 주목을 받은 것은 “빅데이터로부터 얼마나 효과적인 인사이트를 만들어내는가”였다고 설명했다. 이는 일반적으로 감당할 수 없을 만큼 축적된 데이터에서 최적의 인사이트, 기존에는 알 수 없었던 정보를 찾아내는 작업이다. 따라서 데이터 마이닝을 수행할 수 있는 전문적인 데이터사이언티스트들이 각광받게 됐다.

이후 2017년부터 새로이 떠오르고 있는 것은 머신러닝·딥러닝에 기반한 AI 분야다. 과거의 데이터에서 새로운 정보를 발굴해내는 데이터 마이닝과 비교하면, 머신러닝·딥러닝은 데이터 분석을 통해 미래의 결과를 예측하는 작업이다. 이는 BI와 같이 기업의 비즈니스 결정을 내리는 데에 도움을 주는 것은 물론, 고객 서비스나 마케팅 전략 실행에도 광범위하게 사용된다. 따라서 향후 머신러닝·딥러닝을 DB가 얼마나 잘 수용하고 안정적인 서비스를 제공할 수 있느냐가 해당 벤더의 성장을 판가름할 것이다.

MS의 SQL서버(SQL Server)는 별도의 도구를 사용하지 않아도 플랫폼 내에서 AI 알고리즘을 수행할 수 있도록 지원한다. 이를 위해 우선 SQL서버2016에서는 R을, SQL서버2017에서는 파이썬을 탑재했다. 파이썬과 R은 현재 데이터사이언티스트들이 AI 알고리즘을 만들기 위해 가장 많이 사용하는 언어들이며, 향후 몇 년간은 AI 분야의 주력 언어로 자리매김할 전망이다. SQL서버는 파이썬과 R을 수용함으로써 자체적인 AI 알고리즘을 사용할 수 있게 됐으며, R의 한계로 지적되던 메모리 문제가 해결됐다.

▲ 2015~2017 데이터 사이언스 툴 Top 11 (출처: KD너겟)

일반적으로 R은 빅데이터 등을 다룰 때 메모리의 한계를 넘어설 수 없다는 문제가 있었으며, 물리적으로 메모리를 확장하더라도 곧 스토리지의 한계에 봉착했다. 이는 R이 가진 수많은 장점들에 의해 부각되지 않았을 뿐, R의 성능 향상에 한계를 가져왔다. 때문에 빠른 처리가 중요한 프로젝트에서는 C등의 일반 프로그래밍 언어로 포팅하거나, 복잡한 데이터 처리는 일반 프로그래밍 언어에서 해결하고 결과만 가져오는 방식을 사용하기도 했다.

SQL서버는 이러한 R의 메모리 문제를 DB엔진의 성능으로 해결했다는 설명이다. MS 관계자는 “SQL 상에서 SQL쿼리문을 작성하고, R이나 파이썬을 넣고, SQL로 마무리해 스토어드 프로시저(stored procedure)에서 바로 실행한다. 이로써 일반적인 R이나 파이썬보다 훨씬 빠른 성능을 가지게 되며, 개발 생산성을 획기적으로 향상시킨다”고 밝혔다.

또한 SQL서버는 단일한 플랫폼에서 모든 것을 지원하겠다는 모토에 따라 리눅스를 지원할 수 있도록 했다. 지난 1년간 약 2만 개의 상용 어플리케이션을 리눅스 상에 구축된 SQL서버에서 테스트함으로써, SQL서버가 리눅스 환경에서도 아무런 문제없이 사용 가능하다는 것을 입증했다.

이에 대해 가트너는 지난 9월 보고서를 통해 “이제 DBMS 담당자는 SQL서버를 경쟁력있는 리눅스DBMS로 평가해야 한다”고 밝혔다. 윈도우를 공급하는 MS의 특수성에 따라 그동안 SQL서버가 윈도우 환경에 고정될 것이라는 우려가 있었지만, 이제는 리눅스를 채택하는 기업이 SQL서버를 선택할 수 있도록 진입장벽을 제거함으로써 고객들에게 더욱 다양한 선택지를 부여했다는 설명이다.

한편 MS는 지난 5월 개최된 ‘빌드 2017(Build 2017)’에서 자사의 새로운 DBMS 패러다임을 제시할 코스모스DB(Azure Cosmos DB)를 공개했다. 코스모스DB는 단일한 솔루션으로 일반적인 관계형DBMS(Relational DBMS, RDBMS), 몽고DB(MongoDB), 그렘린(Gremlin) 등 어떤 DB든 연동하고 통합 관리할 수 있도록 한다. 연동과 관리에 더해 자체적으로 DW 역할도 수행할 수 있으며, 이는 온프레미스DB를 클라우드로 전환하기 위한 가장 쉬운 방법이 될 것이라고 관계자는 설명했다.

또한 전 세계 MS 데이터센터 중 내 데이터가 어디에 위치하고 있는지를 시각적으로 확인할 수 있으며, 필요에 따라 데이터셋에 별도의 변환과정을 더하지 않고도 어디로든 복제할 수 있도록 지원한다. 이는 클라우드DB의 규모가 커질수록, 비즈니스의 영역이 확장될수록 더욱 각광받게 될 것이다.

원하는 서비스를 원하는 시점에 제공한다
AWS가 제공하는 클라우드 서비스의 특징은 신속하고 편리한 구축과 고객이 요구하는 서비스를 지속적으로 확장해나간다는 데에 있다. AWS 상에는 다양한 서비스가 존재하고 각각의 서비스 연결이 자유로우며, 서비스 선택에서 구축까지 짧은 시간에 완료된다.

클라우드 DBMS 분야에서 이것이 가장 잘 드러나는 예시는 바로 RDS(Amazon Relational Database Service)다. RDS는 간단한 API 호출을 통해 수 분 안에 RDBMS를 활용할 수 있도록 한다. 사용자는 오로라(Amazon Aurora), 마이SQL(MySQL), 마리아DB(MariaDB), SQL서버 등을 비롯해 6개의 DB엔진 중 하나를 선택할 수 있으며, 필요한 규모와 성능을 선택하기만 하면 DB에 접근하기 위한 url을 받을 수 있다. 또한 비즈니스 확대에 따라 추가적인 컴퓨팅 성능 및 스토리지 확장이 필요할 경우에도 몇 번의 마우스 클릭만으로 이를 해결할 수 있다. 이 과정에서 사용자는 별도의 설정이나 관리를 수행할 필요가 없다.

또한 다이나모DB(Amazon DynamoDB)는 최근 각광받고 있는 노SQL(NoSQL)을 지원하기 위한 완전관리형 클라우드 DB다. 사용자가 DB 테이블을 생성하고 오토스케일링(Auto Scaling)의 목표 처리량을 설정하기만 하면 나머지는 시스템에서 자동으로 설정한다. 따라서 사용자는 HW나 SW 프로비저닝, 설정 및 구성, SW패치, 클러스터 운영, 데이터 파티셔닝 등 DB 구축과 관리를 위한 다양한 작업에 대해 전혀 신경 쓸 필요가 없다.

다이나모DB와 함께 사용 가능한 다이나모 액셀러레이터(Amazon DynamoDB Accelerator, DAX)는 다이나모DB에 인메모리 가속화를 더해 성능을 향상시킨다. 인메모리 가속화를 위해 필요한 모든 작업은 DAX가 알아서 수행하며, 사용자가 별도의 설정을 더하지 않아도 된다. 또한 기존의 다이나모DB와 완전히 호환돼 기존에 사용하던 애플리케이션 로직을 변경하지 않아도 된다는 장점도 갖는다.

AWS의 대표적인 클라우드 RDBMS인 오로라(Amazon Aurora)는 고가용성 하이퍼포먼스를 목표로 개발된 마이SQL 및 포스트그레SQL(PostgreSQL) 호환 DBMS다. 동일한 HW에서 일반적인 마이SQL보다 5배, 포스트그레SQL보다는 3배 많은 처리량을 제공하는 높은 성능을 보유하고 있다. RDS를 활용해 설정이나 패치, 백업과 같은 관리 작업을 자동화하며, 사용자는 클라우드워치(Amazon CloudWatch)나 퍼포먼스인사이트(Performance Insights) 기능을 통해 현재 사용 중인 DB 성능을 모니터링할 수 있다.

또한 3곳의 데이터센터에 위치한 가용영역(Availability Zone)에 각각 2개씩 데이터 백업을 보관함으로써 데이터 손실을 근본적으로 방지하고 높은 가용성을 확보했다. 마스터-슬레이브로 구성되는 저지연 읽기 복제본(Replica)을 최대 15개까지 생성해 트랜잭션 집중으로 인한 부하를 막을 수 있으며, 필요에 따라 멀티마스터(Multi-Master) 기능을 통해 다수의 가용영역에 읽기·쓰기가 모두 가능한 마스터 노드 역시 지원할 수 있게 됐다.

아울러 최근에 추가된 오로라 서버리스(Amazon Aurora Serverless)는 더 이상 고객이 서버나 엔진, 스토리지 조차 고민하지 않도록 한다. 관리 콘솔(AWS Management Console)을 통해 엔드포인트를 생성하고 애플리케이션에 필요한 용량을 지정하기만 하면 오로라 서버리스가 그 외의 모든 설정을 담당해 즉시 DB를 사용할 수 있도록 돕는다. 특히 애플리케이션 워크로드에 따라 DB가 자동으로 시작·확장·종료되기 때문에 보다 비용효율적인 이용이 가능하다는 설명이다.

AWS 관계자는 “AWS는 사용자가 좀 더 쉽게 클라우드 서비스에 접근할 수 있도록 돕는다. 사용자가 필요로 하는 것이 무엇인지 찾고 이를 서비스로 구축해 제공하는 것이 우리의 전략”이라며, “AWS는 사용자들이 클라우드의 장점을 과도기적으로 체감할 수 있는 계기가 될 것”이라고 말했다.

오라클, 왕좌를 위협받다
DBMS 시장에서 오라클이 가지고 있는 절대적인 권력을 부정하는 사람은 없다. DBMS의 태동기부터 지금까지 수많은 기업들이 새로운 기술을 개발하고 제품을 만들어왔지만, 오라클이 가지고 있는 아성과 독보적인 시장 점유율을 무너트리지는 못했다. 인터넷 환경이 대두되고 여러 사람이 동시에 DB에 접근할 수 있게 되면서 데이터 정합성과 안정성이 중요한 키워드로 떠올랐고, 이를 가장 잘 보장해줄 수 있었던 오라클은 지금까지도 국내외 기업의 핵심적인 시스템에 공고히 자리 잡고 있다.

하지만 최근 이러한 오라클의 독보적인 체계가 조금씩 위협받고 있는 추세다. DBMS를 제공하는 기업들의 기술력이 나날이 향상돼 전체적인 DBMS 성능이 상향평준화되고 오픈소스 DBMS의 성능이 안정화돼 이를 적극적으로 도입하려는 움직임이 일어나면서 오라클의 아성에 조금씩 금이 가고 있다.

업계 일각에서는 오라클의 시장 점유율이 지속적으로 감소하고 있다고 말한다. 오라클이 어느 때보다도 빠르게 변화하는 시장 변화에 능동적으로 적응하지 못하고 있으며, 그에 반해 다른 기업들은 신속하게 새로운 기술을 도입 및 개발하며 오라클과의 격차를 줄이고 있기 때문으로 보인다. AI와 ICBM(IoT, Cloud, Big data, Mobile)이 강조되는 시대에 전통적인 RDBMS만으로는 모든 시장에 대처할 수 없으며, 오라클이 지금의 자리에 올라설 수 있게 만든 기술 격차 역시 이미 다른 기업들의 사정권 내로 들어왔다. 이에 그동안 오라클이 다져온 입지가 흔들리고 있다는 설명이다.

오라클이 주춤하는 사이에 다른 기업들은 발 빠르게 시장 확대에 나서고 있다. MS나 SAP, AWS, IBM 등의 글로벌 기업들은 물론, 국내에서 오라클의 대항마로 포지셔닝하고 있는 티맥스, 큐브리드 등은 앞 다투어 새로운 기술을 도입하고 신제품을 내놓으며 입지를 넓혀가는 중이다.

오라클을 뒷받침한 기술들
DBMS 태동기에 오라클이 전 세계 DBMS 시장의 절대 강자로 자리매김할 수 있었던 것은 독보적인 기술력 덕분이었다. 특히 다중 버전 동시성 제어(MultiVersion Concurrency Control, MVCC)나 행 단위 잠금(Row-Level Locking), RAC 등은 오라클이 지금의 위치에 올라가도록 하고 그 자리를 유지하게 만들어준 일등 공신들이다.

동시성 제어(Concurrency Control)는 DBMS의 입력·수정·삭제·조회 시 데이터 무결성을 확보하기 위한 기술이다. 하나의 데이터에 동시에 여러 트랜잭션이 몰려 혼선을 빚는 사태를 방지하기 위해 모든 DBMS는 동시성 제어 기술을 활용하고 있으며, 하나의 트랜잭션이 처리되는 동안 다른 트랜잭션이 같은 데이터에 대해 입력·수정·삭제를 시도하는 것을 막는다.

이는 하나의 데이터 테이블에 대해 동시에 여러 개의 읽기(read)는 가능하지만, 쓰기(write)는 동시에 하나만 가능하도록 락(lock)을 걸어 제한하는 방식이다. 따라서 하나의 데이터에 여러 개의 트랜잭션이 동시에 실행되더라도 데이터 무결성을 유지할 수 있다. 오라클의 MVCC는 하나의 데이터에 대해 시간대별 DBMS에 동시에 접속하는 트랜잭션 수를 최대화하면서도 데이터 무결성을 유지한다.

행 단위 잠금 역시 동시성 확보를 위한 기술이다. 기존에 데이터에 대한 트랜잭션이 발생하면 테이블 단위로 락을 걸던 다른 기술과 달리, 접근이 발생한 행(row) 단위로 락을 걸어서 하나의 데이터에 동시에 접속함으로써 발생할 수 있는 지연을 없앴다.

오라클9i에 처음 도입된 RAC는 오라클 DBMS를 대표하는 기술 중 하나다. 모든 것을 공유하는 단일한 공유디스크(DB)를 두고 복수의 서버를 설치함으로써 각 서버에 가해지는 부담을 나누고 신속한 서비스를 보장한다. 각 서버는 액티브-액티브(Active-Active) 상태로 유지돼 한 쪽이 다운되더라도 다른 한 쪽이 트랜잭션을 처리함으로써 데이터 손실이 일어나지 않으며, 사용자 입장에서는 아무런 차이를 느낄 수 없다. 이로써 고객에게 무정지 서비스 제공이 가능해짐은 물론 신속한 장애 복구 및 서비스 정상화가 가능하다.

각 서버별로 별도 디스크를 두고 서로 정기적으로 복사함으로써 데이터 손실을 방지하는 복제 방식(Replication)이 가용성과 안정성을 확보하는 또 다른 수단으로 주목받긴 했지만, 스케일업(scale-up) 형태로 뛰어난 성능과 독보적인 가용성을 확보하던 RAC는 당시 오라클만의 뛰어난 역량과 컨셉을 보여주는 기술이었다.

MVCC, 행 단위 잠금, RAC 등은 그동안 오라클이 온프레미스 DBMS 시장에서 좋은 평가를 받을 수 있는 원동력이 됐다. 그러나 오늘날, 오라클이 보유하고 있는 이와 같은 기술들은 예전만큼 독보적이지 않다.

가령 오라클 DBMS의 대표적인 기술인 RAC는 이미 다른 기업에서도 비슷한 수준의 액티브-액티브 클러스터링 기술을 갖추고 있으며, 복제디스크 방식이나 샤딩(sharding)과 같은 분산 저장 방식 역시 사용자 입장에서는 RAC와 큰 차이를 느끼지 못할 정도로 우수한 성능을 자랑하고 있다. 특히 샤딩을 활용한 분산 DB는 데이터 스케일에 있어서 더욱 유연하며, 보다 저렴한 가격의 서버를 다수 설치해 ROI를 높이기에 유리하므로 도입 사례가 늘어나고 있다.

업계 관계자는 또한 “오라클의 가장 강한 무기는 RAC 등이 갖춘 고가용성이었는데, 기본적으로 온프레미스에 비해 높은 가용성을 제공하는 클라우드의 특징이 오라클에게는 악재일 것”이라고 주장했다.

오라클 윈백 확대로 국산 점유율 확대
오라클이 주춤하는 사이 많은 기업들이 해당 시장을 노리고 있지만, 특히 국내시장에서 오라클 DB에 대한 윈백(win-back)에 집중하는 것은 단연 티맥스다. 티맥스는 오래전부터 오라클 고객이 많은 금융·공공 시장에 역량을 집중하고 있다. 국내 DBMS 시장은 이미 글로벌 기업 제품들이 90%를 차지하는 등 국내 기업들이 발 디딜 틈이 없지만, 오라클 DB에 대한 적극적인 윈백을 바탕으로 점유율을 확대해 나가겠다는 방침이다.

티맥스의 티베로(Tibero)는 SQL 등을 포함해 오라클 DB와 거의 유사한 호환성을 제공하며, 오라클의 RAC에 대항해 TAC(Tibero Active Cluster)라는 독자적인 클러스터링 기술을 개발하며 국내 시장에서만큼은 오라클의 대항마로써 자리매김하고 있다. 실제로 티맥스가 보유하고 있는 윈백 사례 중 70% 이상은 오라클 고객에 대한 윈백으로 구성돼 있다는 설명이다.

아울러 티맥스는 2018년부터 클라우드 사업에 보다 집중하겠다고 밝혔다. 이미 SK·KT·LG 등은 물론, 공공기관 전용의 G클라우드 등 국내에서 서비스 중인 거의 모든 퍼블릭 클라우드에서 서비스됨으로써 기존 고객 및 신규 고객의 클라우드·하이브리드 전환을 가속화하고 있다.

인메모리 컴퓨팅·단일한 액세스 포인트로 데이터 폭증 대비
한편 SAP는 인메모리 컴퓨팅 기반 DBMS로 높은 성능을 내세워 폭발적으로 증가하는 데이터에 대응하겠다고 밝혔다. 인메모리 기술은 디스크·네트워크 입출력에서 발생하는 부하와 지연을 최소화하고 CPU와 가장 밀접한 메모리 기반 프로세싱을 활용함으로써 성능을 향상시킨다. 단순히 메모리를 저장공간으로 삼는다는 개념보다는 CPU와 메모리 사이의 프로세스를 최적화해 CPU의 리소스가 최대한으로 활용될 수 있도록 지원하는 것에 가깝다.

SAP하나(HANA) 이후 SAP의 모든 비즈니스 솔루션 및 서비스들은 인메모리 환경에서 작동하며, 기존의 디스크 기반 DB들에 대해서도 인메모리 기반으로 전환하는 작업을 진행하고 있다. 아울러 인텔이나 삼성과 같은 HW 제조사와 메모리와 관련된 R&D를 함께 진행함으로써 인메모리 컴퓨팅에 대한 선도적인 입지를 만들어나가겠다는 방침이다.

SAP 관계자는 인메모리 기술로 확보한 성능과 다양한 데이터와 서비스 유형에 대응할 수 있는 확장성이 향후의 DBMS에 가장 중요한 지표라고 설명했다. 확장성은 여러가지 데이터를 지원하는 것에 한정되지 않고, 다양한 데이터와 서비스에 대응해 공급업체 쪽에도 서비스의 영역과 유형을 폭넓게 제공하겠다는 의미다. 이를 위해 SAP는 메모리·디스크·하둡 등을 모두 아우를 수 있는 운영 환경을 만들어나가고 있으며, 빅데이터·IoT·블록체인 등을 아우를 수 있는 플랫폼을 마련하고 있다.

SAP하나 역시 다양한 분석 엔진이나 데이터 처리 엔진이 탑재된 플랫폼으로 진화하고 있다. 사용자가 필요로 하는 기능들을 SAP하나 인터페이스 안에서 제공하고 이를 확장해 나감으로써, 데이터만이 아니라 애플리케이션이나 서비스까지 중앙집중화(Centralize)하고 싱글 데이터 프로세싱을 위한 아키텍처를 제공한다.

또한 SAP하나가 제공하는 엔진을 활용하든, 혹은 별도의 엔진을 활용하든 분산된 데이터에 접근할 수 있는 접점을 단일화함으로써 사용자 편의성을 도모한다는 방침이다. 비즈니스 영역이 확장되고 새로운 기술이 등장하면서 기업이 관리해야할 데이터 유형은 점점 더 다양해지고 있으며, 이를 제각각 관리하게 되면 복잡도가 증가하는 것은 물론 관리나 개발에 필요한 업무 역시 중복될 수밖에 없다.

지난 9월 공개된 SAP 데이터 허브(SAP Data Hub) 솔루션은 데이터레이크(Data Lake), 데이터웨어하우스, 클라우드 스토리지 등에 광범위하게 분산돼 있는 데이터들에 단일한 액세스 포인트로 접근할 수 있는 데이터 파이프라인(Data Pipeline)을 구축한다. 이를 통해 기업은 다양한 유형의 데이터 보관 체계를 보다 쉽게 관리할 수 있으며, 궁극적으로는 원하는 데이터가 어디에 있는지 고려하지 않고도 단일한 접점에서 해당 데이터에 접근할 수 있도록 제공하겠다는 방침이다.

모든 플랫폼에 대한 최적화된 제품 제공
DB의 개념이 생겨나던 시절부터 관심을 보여 온 IBM 역시 최근 클라우드 환경에 맞춘 제품 개발에 집중하고 있다. IBM 관계자는 “특정한 환경이나 플랫폼을 선택한다는 것은 그것이 어울리는 비즈니스를 수행하고 있다는 의미다. 따라서 클라우드와 온프레미스는 완전히 다른 환경으로 인식돼야 하며, 단순히 온프레미스로 제공되던 서비스를 클라우드로 옮기는 것만으로는 충분하지 않다. 클라우드로 이식되는 서비스는 고객이 클라우드를 선택한 이유를 고려하고 그에 적합한 형태로 제공돼야 한다”고 강조했다.

IBM은 이에 따라 클라우드 환경에 적합한 데이터 스토어와 서비스를 다수 출시하고 있으며, 기존에 보유하고 있던 DB 역시 클라우드에 적합한 형태로 수정해 제공하고 있다. 이는 단순히 클라우드에 대한 이식만이 아닌, 모든 플랫폼에 대한 이식성을 고려한 전략이다. IBM DB2 역시 비즈니스의 목적에 따라 클라우드·온프레미스·하이브리드·OLTP 등 여러 개의 버전으로 나누어 출시됐다.

실제로 IBM DB2는 오라클의 RAC기술에 대응하는 공유DB 클러스터링 기술 퓨어스케일(pureScale)이나 번들로 제공되는 인메모리 분석 전용 기능 등 다양한 기능들을 갖추고 있다. IBM 측은 이러한 기능들이 적재적소에 활용될 수 있도록 비즈니스 목적에 따라 제품을 분할하고 최적화함으로써 DBMS는 물론 IBM이 제공하는 모든 데이터서비스가 어느 서비스, 어느 플랫폼에서건 높은 성능을 제공할 수 있도록 하겠다고 밝혔다.

아울러 지난 2007년부터는 타 DB와의 호환 기능에도 집중하고 있으며, 오라클 DB에 대해서는 98% 이상의 코드 호환이 가능한 수준이다. 또한 마이SQL과 같은 오픈소스DB에 대해 다양한 기술 지원을 수행하는 한편 오픈소스DB의 쿼리를 DB2에 포함하는 행보를 보인 바 있다. 이를 통해 IBM DB2가 갖춘 압축이나 확장성에 대한 장점은 물론, 다른 상용DB의 장점이나 오픈소스DB의 장점을 적극적으로 받아들이겠다는 방침이다.

오픈소스 DB가 갖는 한계
한편 전반적인 DBMS 기술의 상향평준화에 힘입어 오픈소스 DB에 대한 관심도 뜨겁다. 앞서 밝힌 바와 같이 마이SQL이나 포스트그레SQL은 MS이나 AWS과 같은 상용DB 공급업체들 역시 적극적으로 수용하고 있다.

과거 값비싼 DBMS를 도입할 수 없었던 스타트업이나 중소기업에서 도입하던 경우와 달리, 이제는 이미 사용하고 있는 상용DB를 대체하는 경우도 일어나면서 많은 주목을 받고 있다. 심지어 지난 7월 대고객 서비스를 개시한 카카오뱅크는 자사 시스템 일부에 마이SQL을 도입, 금융권에서 오픈소스 DB를 도입한 사례로 화제가 되기도 했다.

▲ 오픈소스 DB는 상용DB만큼이나 많은 관심을 받고 있다. (출처: DB-Engines)

한 글로벌 기업 관계자는 “일부 오픈소스DB는 성능이나 안정성, 가용성 등에서 충분한 성능 향상을 이뤘다”며, “제공하는 기능 면에서만 따진다면 기업의 핵심 시스템에 도입돼도 무방할 정도”라고 말했다.

그러나 대부분의 업계 관계자들은 오픈소스 DB가 기업의 핵심적인 업무에 도입될 수 있으리라는 전망에 대해 부정적이다. 오픈소스 DB의 성능이 많이 상향된 것은 맞지만, 단순히 성능이 강화됐다고 해서 상용DB와의 격차를 좁히기에는 무리라는 설명이다. 성능이나 기능이 상용DB와 같은 수준에 도달했는지는 차치하더라도, 오픈소스 DB는 다른 대부분의 오픈소스 기술과 마찬가지로 많은 문제점을 안고 있다.

오픈소스 DB는 서드파티에서 제공하는 다양한 제품과의 호환성도 보장받을 수 없으며, 장애가 발생했을 때 이를 복구하기 위한 신속한 업무지원을 받을 수도 없다. 가령 기업의 핵심적인 업무에 적용되는 DBMS에는 자체적인 보안 외에도 서드파티에서 제공하는 DB전용 보안 솔루션을 도입하는 경우가 잦은데, 해당 제품이 오라클과 같은 상용DB만큼 오픈소스 DB에도 완벽한 호환을 제공할 것이라고는 확신하기 어렵다. 또한 기업이 자체적으로 구축한 오픈소스 DB에 장애가 발생했을 경우에도 이를 해결하고 손실된 데이터를 복구하기 위한 작업을 직접 진행해야 한다.

비용에 있어서 자체 개발 인력을 보유해야 한다는 점 역시 고려해야 할 부분이다. 클라우드로 인해 상용DB 도입에 필요한 비용이 감소하기는 했지만, 여전히 오픈소스 DB는 비용효율성이라는 측면에서 장점을 갖고 있다. 하지만 기업에서 별도의 개발 인력을 유지하는 데에는 적지 않은 비용이 발생한다. 새로운 DB 개발·관리 직원을 채용하지 않고 기존 IT 인력에게 업무를 일임하는 경우 추가적인 인건비 지불은 막을 수 있겠으나, 해당 직원에 대한 비즈니스 의존도가 높아진다는 문제점은 그대로 남는다. 향후 그 직원이 퇴사 의사를 밝혔을 경우 이를 붙잡아두기 위한 별도의 비용을 지불하거나 퇴사 이후에 발생할 업무 공백을 감수해야 한다.

오픈소스 커뮤니티에서 명확한 개발 로드맵을 제시할 수 없다는 점도 문제로 꼽힌다. 오픈소스 DB는 상용DB에 비해 상대적으로 새로운 기술 적용이 빠르다는 장점을 갖고 있지만, 사용자가 원하는 기술이 적용되지 않을 가능성도 고려해야 한다. 다시 말해 지금 당장의 비즈니스에 적합한 규모와 성능을 제공할 수 있다고 해서 향후에도 그러리라는 보장은 없다는 것이다. 비즈니스 규모가 확장돼 더 뛰어난 성능을 요구했을 때, 혹은 향후 비즈니스에 꼭 필요한 DB 기술이 존재할 때, 이들을 사용 중인 DB가 지원할 수 없다면 문제가 될 수밖에 없다.

이는 오픈소스를 선택할 때 항상 겪는 리스크이지만, DBMS와 같이 쉽게 교체할 수 없는 경우에는 심각한 문제가 된다. 따라서 오픈소스 DB 도입을 고려하는 기업은 트렌드에 앞서는 기술을 택하느냐, 성숙하고 안정적인 기술을 택하느냐에 대해 충분한 사전 검토를 거쳐야 한다. 이러한 문제점들을 감안했을 때 기업의 핵심적인 분야에 오픈소스 DB를 적용하는 것은 아직 이르다는 게 관련 업계의 공통된 인식이다.

DBMS 선택, 비즈니스에 대한 명확한 분석이 우선
반면 비즈니스의 핵심적이지 않은 영역에서는 오픈소스 DB의 도입에 대해 호의적이다. 업무 복잡도가 낮고 장애가 발생했을 때 추가적인 문제가 발생하지 않는 영역에서는 일부 리스크를 감수하고서라도 오픈소스 DB를 도입할 만한 가치가 있다. 결국 오픈소스 DB의 성능이 상당부분 향상된 것은 사실이나, 한동안은 기업의 핵심적이지 않은 업무에서 오픈소스 DB가 어느 정도의 시장을 확보하느냐가 중요할 것이다.

앞서 언급한 카카오뱅크 역시 핵심적인 기간계 시스템에는 오라클 DB를 도입했지만 그 밖의 대외계 시스템 등에 마이SQL을 활용한 사례이며, 많은 기업들에서 자사의 일부 서비스를 오픈소스 DB로 교체하는 사례가 늘어나고 있다.

DBMS 기술은 과거에 비해 전반적으로 상향평준화됐다. 그렇다고 해서 아무 DBMS나 선택해도 되는 것은 아니다. 도심에서 천천히 주행하기 위해서는 스포츠카보다 경차를 선택하는 것이 합리적이지만, 먼 지역으로 많은 화물을 옮겨야 하는데 경차를 구입해서는 안 된다. 이와 마찬가지로 DBMS 역시 기업의 비즈니스 목적에 따라 충분한 검토를 거쳐 선택돼야 한다.

몇 초의 업무 중단이 치명적일 수 있는 금융기관의 핵심 시스템에는 여전히 고가용성을 보장하는 상용DB가 좋은 선택이 될 수 있겠지만, 장애가 발생하더라도 타격이 크지 않고 간단한 업무에는 굳이 값비싼 제품과 서비스를 구매할 필요가 없다. 공급업체의 네임밸류에 혹하거나 오픈소스 DB의 신선함을 맹목적으로 추구하기보다, 자기 비즈니스에 요구되는 성능과 규모, 향후 확장 가능성을 정확히 파악하고 이에 가장 적합한 제품을 선택하는 게 중요하다.

김성수 기자 kimss56@itdaily.kr

다른기사 보기

상단영역

본문영역

[기획특집] 클라우드, DBMS 시장의 변곡점 될까

클라우드 전환 가속화…오픈소스 진영 반격도 거세

기사 댓글 0

비회원 로그인