슈퍼컴퓨터, 국가 R&D 역량 척도…국내외 기업들, HPC 대응 분주

[컴퓨터월드] 빅데이터와 인공지능(AI) 시대를 맞아 고성능 컴퓨팅(High Performance Computing, HPC)이 떠오르고 있다. 특히 AI가 4차 산업혁명의 핵심으로 지목되면서, AI 발전을 가능하게 했던 HPC 인프라에 대한 관심이 증가하고 실제 수요도 늘어나고 있다. 이제 HPC는 국가 주도의 연구 과제를 수행하는 슈퍼컴퓨터뿐만 아니라, 기업 및 각종 산업계가 요구하는 다양한 과제를 빠르게 해결할 수 있도록 지원하며 활용을 넓히고 있다. 슈퍼컴퓨터로 불리는 하이엔드 HPC의 국내외 시장 동향과 각 업체별 HPC 전략을 살펴본다.

 

인공지능 발전, 고성능 컴퓨팅이 뒷받침

디지털 트랜스포메이션(Digital Transformation), 혹은 4차 산업혁명으로 표현되는 변화의 물결이 전 세계를 집어삼키고 있다. 그리고 이러한 변화의 한가운데에는 IT기술 발전의 지향점이자 동시에 윤활유라고 할 수 있는 인공지능(AI)이 자리한다. AI는 4차 산업혁명을 이루기 위한 핵심 원동력으로 꼽히고 있다.

오늘날 AI의 부상에는 디지털 저변 확대로 인한 빅데이터와 그 분석 기술의 등장, 머신러닝 알고리즘 연구의 고도화, 그리고 관련 기술 및 소프트웨어(SW)의 오픈소스화 등이 기여했다. 여기에 하드웨어(HW)의 꾸준한 성능 발전과 가격 안정화로 인한 컴퓨터 보급 확대가 뒷받침됐다는 점도 빼놓을 수 없다. 특히, 오늘날 AI 기술 발전이 가능했던 데에는 머신러닝 및 딥러닝 알고리즘이 요구하는 방대한 데이터를 빠르게 계산해낼 수 있는 고성능 컴퓨팅(HPC) 인프라의 역할이 컸다.

▲ 이미지 인식을 위한 딥러닝에는 방대한 양의 계산이 요구된다.

HPC라고 하면 일반적으로 과학 분야에서 방대한 계산을 빠르게 수행하는 ‘슈퍼컴퓨터’로 이해되곤 한다. 슈퍼컴퓨터는 대규모 클러스터링을 통한 병렬컴퓨팅 환경을 구성함으로써 연산 성능을 극대화한 당대 세계 최고 수준의 시스템을 일컫는다. 1960년대 전후로 처음 등장한 이래, 슈퍼컴퓨터는 주로 정부 주도 아래 과학기술 및 군사 관련 연구에서 계산과 시뮬레이션에 활용돼 왔다.

▲ ‘알파고’는 병렬 컴퓨팅을 통해 연산 능력을 높인 HPC다.
그러나 최근 빅데이터 분석이 떠오르고 AI 기술까지 이슈가 되면서 슈퍼컴퓨터, 즉 HPC 인프라는 전 세계적으로 민간 기업에서의 수요 확대와 함께 새롭게 주목받고 있다.

지난해 3월, 전 세계 AI 발전사에 한 획을 그은 후 현재까지 수없이 회자되고 있는 구글 딥마인드(Google DeepMind)의 ‘알파고(AlphaGo)’ 역시 슈퍼컴퓨터 수준의 HPC 인프라가 있었기에 가능했다.

당시 알파고는 1920개의 CPU와 280개의 GPU를 갖춘 구글 클라우드 컴퓨팅 플랫폼(GCP)을 사용한 것으로 알려지며 주목받았다. 이후 알파고는 GPU가 아니라 구글이 자체 개발한 ASIC(주문형반도체)인 TPU(Tensor Processing Unit)를 50개 사용한 것으로 밝혀지긴 했다. 알파고는 지난달 치러진 중국 커제 9단과의 대결에서는 단 4개의 2세대 TPU 프로세서와 1/10 수준으로 줄어든 수의 CPU를 탑재한 ‘알파고 2.0’ 버전으로 한층 성능이 업그레이드됐다.

이처럼 ‘알파고 쇼크’로 대변되는 AI 기술의 급격한 발전 뒤에는 일반 컴퓨터와는 비교할 수 없을 만큼 뛰어난 연산능력을 보여주는 HPC 인프라의 도움이 자리하고 있다.


2020년 전 세계 HPC 시장, 369억 달러 규모 예상

인터섹트360리서치(Intersect360 Research)에 따르면, 2016년부터 2020년까지 전 세계 HPC 시장은 연평균 5.2% 성장하며 2020년 말까지 369억 달러(약 41조 2,900억 원) 규모를 형성할 것으로 예상된다. 또한 IDC는 글로벌 HPC 시장이 2015년 221억 달러(약 24조 7,400억 원)에서 2019년에는 312억 달러(약 34조 9,300억 원) 규모에 도달, 연평균 약 8%대의 성장을 보일 것이라고 지난해 예측한 바 있다.

참고로 두 조사의 차이점은 IDC가 서버, 스토리지, 미들웨어, 애플리케이션, 서비스 등의 항목을 집계한데 비해 인터섹트360리서치의 조사 항목은 서버, 스토리지, 서비스, 소프트웨어, 네트워크, 클라우드, 기타 등으로 조금 더 자세히 분류돼 있다는 것이다.

▲ 제품 분류별 전체 HPC 시장 매출 (단위: 백만 달러, 자료: 인터섹트360리서치)

국내 HPC 시장은 2015년 IDC의 조사에서 약 2천 6백억 원 규모를 형성, 세계 시장에서 약 2.5%를 차지한 것으로 나타났다. 이후 현재까지 국내 HPC 시장 규모가 대폭 성장하지는 못한 것으로 추산되지만, 최근 빅데이터에 이어 AI까지 이슈가 되면서 산업계 전반에서 활용이 늘어날 것으로 보여 업계는 HPC 시장 확대를 기대하고 있다.

신홍일 델EMC코리아 이사는 “IDC는 2018년이 되면 전체 서버의 약 28%가 HPC 관련 용도로 사용될 것이라고 예측한 바 있다. 현재 국내 시장은 주로 공공기관에서 HPC 수요를 이끌고 있지만, 향후 기존 범용 인프라가 GPU 및 매니코어 제품을 기반으로 한 시스템의 발전으로 인해 HPC 환경으로 변화될 것으로 본다”면서, “앞으로 HPC가 실시간 데이터분석 및 예측, AI, 위험분석, 모델링 등 광범위한 분야로 확산될 것으로 예측한다”고 밝혔다.

정석원 한국HPE 부장은 “국내외 시장 트렌드는 현재 머신러닝 및 딥러닝 시장이 급격하게 팽창하고 있다는 점에서 거의 동일하다고 말할 수 있다. 다만 차이점이라면 해외의 경우 공공시장, 즉 주요 공공기관이나 연구소에서 슈퍼컴퓨팅을 도입 및 개발하는 비중이 높은 반면 국내는 제조사 및 서비스 프로바이더 등 다양한 업체들에서 HPC 활용도가 넓게 포진돼 개발 중이라는 특징이 있다”고 설명했다.


슈퍼컴퓨터, 전 세계 국가 R&D 역량 척도


HPC 인프라 중에서도 최고 사양의 시스템인 슈퍼컴퓨터 시장은 전 세계적으로 국가 주도의 도입이 주를 이루고 있다. 대형 국책 연구기관을 중심으로 기초과학 및 응용과학 부문에서 우주 및 지구 시뮬레이션, 핵무기 개발 시뮬레이션, 기상분석, 유체역학, 구조역학, 위험분석 등 다양한 연구개발(R&D)에 활용된다.

각종 연구를 위한 인프라로써 슈퍼컴퓨터는 R&D 역량을 재는 척도라고 할 수 있다. 이에 미국과 일본, 유럽 등의 선진국은 물론이고 최근 몇 년간은 중국까지 가세해 HPC 인프라 확보에 천문학적인 금액을 투자하고 있다. 특히, 자본과 추진력을 갖춘 중국은 이제 미국을 제치고 세계 1위와 2위 규모의 슈퍼컴퓨터를 보유하고 있다.

슈퍼컴퓨터 순위는 매년 6월과 11월에 유럽 ISC(International Supercomputing Conference)와 미국 SC(Supercomputing Conference)에서 번갈아 발표하며, 결과는 ‘톱500(www.top500.org)’ 홈페이지에서도 확인할 수 있다. 2016년 11월 발표를 기준으로 중국과 미국은 전 세계 ‘톱500’ 슈퍼컴퓨터 중 각각 171대씩을 차지하며 양강 구도를 형성하고 있다.

▲ ‘톱500’ 슈퍼컴퓨터 1위~10위

‘톱500’에서 1위를 차지하고 있는 중국 국립슈퍼컴퓨팅센터의 ‘선웨이 타이후라이트(Sunway TaihuLight)’는 중국이 자체 기술력으로 개발한 ‘SW26010’ 260코어 프로세서를 탑재하고 있다. 전체 코어 수를 합하면 무려 1,064만 9,600개에 달하며, 실측성능(Rmax) 기준 93PFlops(페타플롭스)의 연산속도를 자랑한다.

2위는 33.8PFlops를 기록한 ‘텐허-2(Tianhe-2)’로, 인텔 ‘제온(Xeon) E5-2692’ 12코어 프로세서와 ‘제온 파이(Xeon Phi) 31S1P’ 가속기를 탑재한 총 312만 코어 구성의 시스템이다.

▲ 전 세계 1위 슈퍼컴퓨터인 중국의 ‘선웨이 타이후라이트’

이처럼 중국이 최근 몇 년간의 집중적 투자로 슈퍼컴퓨터 1, 2위를 모두 차지하고 ‘톱500’ 내 시스템 수도 동률을 이루고 있긴 하지만, 미국은 여전히 HPC 세계 최강의 자리를 유지하고 있다. 애초에 프로세서 관련 기술과 생산력 측면에서 중국과는 비교 불가능한 압도적 역량을 보유했음은 물론, 일부 국립연구소를 제외하면 주로 ISP(Internet Service Provider) 위주인 중국과는 달리 미국은 각종 연구소와 대학은 물론이고 다양한 분야의 기업까지 HPC 활용 저변이 매우 넓다.

미국은 에너지부 산하 오크리지 국립연구소(Oak Ridge National Laboratory)가 지난해 11월 기준 세계 3위 슈퍼컴퓨터인 ‘타이탄(Titan)’을 보유하고 있으며, 성능은 17.5PFlops에 달한다. 또한, 에너지부 산하의 로렌스 리버모어 국립연구소(Lawrence Livermore National Laborarory)는 17.1PFlops의 4위 슈퍼컴퓨터 ‘세콰이어(Sequoia)’를 보유하고 있다. 여기에 ‘타이탄’은 2018년까지 200PFlops 수준의 시스템으로 교체할 계획을 갖고 있다.

▲ 세계 3위 슈퍼컴퓨터인 미국 오크리지 국립연구소의 ‘타이탄’

일본 역시 중국의 부상 이전까지는 세계 2위 수준의 역량을 보유하고 있었으며, 현재 도쿄대학과 쓰쿠바대학이 공동 운영하는 ‘최첨단 공동 HPC 기반시설(JCAHPC)’의 ‘오크포레스트 팍스(Oakforest-PACS)’ 슈퍼컴퓨터는 전 세계 6위의 ‘제온 파이’ 기반 시스템이다. 지난 2011년 6월 전 세계 1위를 차지하기도 했던 일본 이화학연구소(RIKEN)의 ‘K컴퓨터(K Computer)’는 유닉스 기반으로 7위에 자리하고 있다. 두 시스템 모두 후지쯔(Fujitsu)가 제작했다. 2016년 11월 기준 ‘톱500’ 내 일본의 슈퍼컴퓨터 수는 27대다.

▲ 일본의 세계 6위 슈퍼컴퓨터 ‘오크포레스트 팍스’

한국IBM 관계자는 “이처럼 각국 정부에서 슈퍼컴퓨팅에 엄청난 예산을 투자하는 이유는 데이터 증가 속도가 컴퓨팅 기술의 발전 속도를 추월하고 있기 때문이다. 예를 들어, CPU 클럭 속도의 발전은 거의 멈춘 상태이며 I/O 성능이나 용량, 네트워크 대역폭의 발전도 사실은 데이터 증가 속도에 비해 현저하게 뒤떨어져있는 상태라고 할 수 있다”고 설명했다.


한국, ‘톱500’에 단 4대 포함…갈 길 멀어

한편 우리나라는 ‘톱500’에 4대의 시스템이 이름을 올리고 있다. 먼저 미국 크레이(Cray)의 ‘XC40’ 시스템을 채택한 기상청의 누리(Nuri) 및 미리(Miri)가 각각 2.4PFlops의 성능으로 46, 47위를 기록하고 있다. ‘누리’와 ‘미리’는 인텔 ‘제온 E5-2690v3’ 12코어 프로세서를 바탕으로 총 69,600코어를 갖춘 동일 성능의 시스템이다.

▲ 대한민국 기상청 슈퍼컴퓨터 ‘누리’

다음으로는 대구경북과학기술원(DGIST)이 엔비디아 ‘테슬라(Tesla) K40’ GPU 가속기를 장착한 14,400코어의 467.4TFlops(테라플롭스) 슈퍼컴퓨터 ‘아이렘(iREMB)’으로 351위를 기록하고 있으며, 이름을 밝히지 않은 제조기업이 421TFlops 성능의 HPE 시스템으로 404위에 이름을 올렸다. 이 밖에 ‘톱500’에 들진 못했지만 기상청이 345TFlops 시스템 ‘우리(Uri)’를, ISP 기업이 2대의 295.8TFlops 시스템을 운영하고 있다.

이처럼 우리나라의 ‘톱500’ 내 슈퍼컴퓨터가 4대에 불과하며, ‘누리’의 성능이 중국 ‘선웨이 타이후라이트’ 대비 2.4% 수준이라는 점은 그동안 국가경쟁력 측면에서 관계자들로부터 많은 우려와 지적을 받아왔다. 이미 우리나라는 2011년 6월 국가초고성능컴퓨터 활용 및 육성에 관한 법률이 제정된 바 있으며, 2012년 말에는 ‘국가초고성능컴퓨팅 육성 기본계획(2013~2017)’이 수립되기도 했다. 이에 한국과학기술정보연구원(KISTI)을 중심으로 산업 전반에서의 HPC 활용을 촉진한다는 계획을 추진 중에 있지만, 아직 갈 길이 멀다.
KISTI는 현재 국가초고성능컴퓨팅센터를 통해 국내 대학과 정부출연 연구소, 산업체 연구자들은 물론 중소기업들의 HPC 활용을 돕고 있다. 그러나 이미 2014년에 컴퓨팅 자원 이용이 포화상태에 달했다는 보고가 나온 바 있으며, 10~15PFlops 이상의 시스템을 요구하는 연구과제들이 늘어나는 등 세계 10위권 이내 HPC 인프라에 대한 요구가 커지고 있는 상황이다. 이에 KISTI는 실측성능 기준 274.8TFlops 수준인 슈퍼컴퓨터 4호기 ‘타키온II(Tachyon II)’에 이어, 현재 슈퍼컴퓨터 5호기 도입 사업을 진행하고 있다.

▲ KISTI가 보유한 슈퍼컴퓨팅 자원 (자료: 국가슈퍼컴퓨팅연구소 홈페이지)

KISTI 5호기는 실측성능 기준 27.5PFlops의 시스템이 될 것으로 예상되며, 이는 2016년 11월 기준으로 세계 3위에 해당하는 시스템이다. 약 534억 원 규모인 해당 사업은 비록 도입 완료되는 시점에 10위권 밖으로 떨어질 공산도 있지만, ‘누리’ 및 ‘미리’ 에 비하면 10배 이상 향상된 성능을 통해 사용자들의 요구를 어느 정도 충족할 수 있을 것으로 기대된다.

또한, 지난해 4월 미래창조과학부는 ‘초고성능컴퓨팅(HPC) 사업단(법인)’을 설립하고 사업단에 매년 100억 원 내외의 연구개발비를 지원할 계획을 밝히기도 했다. 슈퍼컴퓨터는 단순한 병렬구조의 시스템 조립만이 아니라 이를 대규모로 적용하고 운영해야 하므로, 확장형 아키텍처의 안정성과 저전력 측면에서의 기술적 어려움이 있다.

이에 원하는 성능을 최소한의 투자로 뽑아낼 수 있는 시스템 설계 기술은 물론이고, 최근 확대되는 GPU 및 ‘제온 파이’ 가속기 등 매니코어(Many Core) 아키텍처를 고려한 프로세서 및 메모리 관리 기술, I/O 최적화를 위한 계층형 스토리지 파일시스템, 인터커넥트 네트워크(interconnect network) 기술, 네트워크 라우팅 및 관리, 프로그래밍 툴, 라이브러리, 시스템 운영 관리, 운영체제 최적화 등까지 다양한 기술이 요구된다. 현실적으로 개발에 막대한 비용이 투자되고 성공을 장담할 수도 없는 프로세서 및 하드웨어 개발을 차치하고서도 이처럼 많은 도전 과제가 존재하는 것이다.

이러한 상황에서 미래부는 지난해 재난·환경 분야 조사 결과 9개 부처에서 해양예보나 산불·산사태 예측 등의 용도로 1PF(페타플롭스, 초당 1천조 번 내외의 부동소수점 연산이 가능한 처리 속도) 내외의 수요를 형성하고 있다는 점을 고려, 우선 1단계로 2020년까지 1PFlops 이상의 슈퍼컴퓨터를 자체적으로 개발하겠다는 계획을 밝혔다.

1단계의 기술적 목표로는 ▲기존 상용제품 전력소모량의 1/4 수준인 80kW/PFlops 이하의 ‘저전력’ ▲이후 5~10PFlops 이상 규모로 확장할 수 있는 ‘확장성’ ▲HW·SW가 통합된 완성형 시스템 개발을 통한 ‘범용성’ 등을 고려한다는 계획이다.

▲ 지난해 4월 발표됐던 미래부의 슈퍼컴퓨터 개발 로드맵

여기에 이후 2025년까지 추진되는 2단계에서는 30PFlops 이상 규모의 슈퍼컴퓨터 자체 개발을 추진할 방침이라고 밝혔다. 이러한 미래부 계획의 일환으로 KISTI는 우선 1PFlops 급의 프로토타입 시스템을 자체 구축하고, 이 과정에서 확보한 기술을 활용해 차세대인 6호기 시스템 도입을 직접 수행한다는 방침을 세워놓고 있다.

이는 미래부가 매년 100억 원 내외의 연구개발비를 지원하는 ‘초고성능컴퓨팅사업단’을 통해 이뤄지며, 인력 양성과 기업으로의 기술이전, 공동연구 등을 수행하게 된다. 이처럼 KISTI의 슈퍼컴퓨터 프로토타입 및 6호기 자체 도입을 통해 우리나라도 세계 수준의 슈퍼컴퓨터 구축 기술을 확보할 수 있을지 관심이 모이고 있다.


■ HPC 시장에 대응하는 국내외 기업 동향

HPC는 과거 연구소나 대학, 정부 차원에서 인류가 직면한 문제를 해결하는데 사용됐지만, 현재는 기업 시장으로까지 영역을 확장하고 있다. 제트엔진 및 자동차 설계 등 공학(CAE), 주식거래와 위험분석 등 금융 서비스, 생명과학, 나노 규모의 동작 시뮬레이션, 신규 유전 발견, 딥러닝 및 AI, 실시간 데이터 분석 등 다양한 분야에서 기업이 맞닥뜨린 문제를 해소한다.

또한 IDC 보고서에 따르면 기업이 HPC에 1달러를 지출하면 이를 기반으로 다양한 과제를 해결, 결과적으로 515달러의 수익을 거두는 결과를 만들어 내는 것으로 나타났다. 이 밖에 국내의 경우 최근 보험업계에서 새로운 국제회계기준(IFRS)을 충족하기 위해 HPC 인프라 도입을 검토하고 있기도 하다.

정석원 한국HPE 부장은 “글로벌 HPC 서버 시스템 시장은 가장 빠르게 성장하는 IT 시장 중 하나다. IDC에 따르면 HPC 서버 부문 매출은 2001년 48억 달러에서 2015년 114억 달러로 2배 이상 성장했으며, 2020년에는 151억 달러가 될 것으로 예상하고 있다”면서, “여기에 소프트웨어, 스토리지 및 서비스 부문을 합하면 사실상 2020년까지 2배 성장할 것으로 보고 있다”고 밝혔다.


01 델EMC | “전 세계 ‘톱500’ 12개 레퍼런스, 17위 슈퍼컴 구축”

 
지난해 델과 EMC의 합병으로 탄생한 델EMC는 ‘톱500’ 내 총 12개 레퍼런스를 보유하고 있다. 2005년부터 델이 제공해온 미국 텍사스 주립대학 ‘텍사스첨단컴퓨팅센터(Texas Advanced Computing Center, TACC)의 ‘스탬피드(Stampede)’가 대표 사례로, 2016년 11월 기준 ‘톱500’에서 17위를 기록했다.

‘스탬피드’는 인텔 ‘제온 E5-2680’ 2.7GHz 8코어 프로세서 기반의 델EMC ‘파워에지(PowerEdge) C8220’ 서버와 인피니밴드(Infiniband) FDR 인터커넥트 네트워크, 인텔 ‘제온 파이 SE10P’ 가속기를 탑재해 5.1PFlops의 실측성능을 기록했다. 이 밖에도 델EMC는 글로벌 기관들과 협력해 전 세계적으로 ‘HPC 이노베이션 센터’를 운영 중이다.

▲ 델EMC HPC 서버 라인업

국내에서는 현재까지 총 23개 정부출연 연구소에 중·소규모 HPC 인프라를 제공하고 있으며, 최근에는 기상분석 시스템, 연구소 HPC 및 금융 위험분석, 상품 시뮬레이션 및 대규모 HPC를 운영하는 제조회사 등으로 영업을 확대하고 있다. 또한 국내 최대 규모 차세대 염기서열분석(Next Generation Sequencing, NGS) 회사의 서버, 네트워크, 스토리지 통합 솔루션 초기 도입 후 확장 증설에 제품을 공급했다.

▲ 델EMC HPC 시스템 포트폴리오

델EMC는 HPC에 최적화된 솔루션으로 GPU 및 매니코어 CPU를 지원하는 파워에지 ‘C4130’, 및 ‘C6320P’ 플랫폼과 고직접 최적화(Density Optimized) 플랫폼인 ‘FX2 FC430’을 제공한다. 범용 ‘파워에지’ 라인 중에서도 더블와이드(Double Wide) GPU를 장착할 수 있는 ‘R730’과 고용량 메모리를 지원하는 ‘R930’ 등 다양한 요구사항을 지원하는 포트폴리오를 갖추고 있다. 이 밖에 HPC 솔루션으로 리서치, 생명과학, 제조 등 각 분야에 적합한 컨버지드 시스템과 NFS 및 러스터(Lustre) 파일시스템에 최적화된 ‘레디 번들(Ready Bundle)’을 통해 알맞은 프레임워크를 제공한다.


02 레노버 | “중국 1위, 글로벌 2위 슈퍼컴 벤더”

 
레노버는 최근 ‘톱500’ 벤더 중 토털시스템 부문에서 중국 1위와 글로벌 2위를 각각 차지, HPC 분야에서의 입지를 한층 강화했다.

‘톱500’ 중 92대의 시스템을 공급하고 있는 레노버는 지난해 11월 이탈리아 최고 슈퍼컴퓨팅 센터인 시네카(Cineca)에 6.2PFlops 규모의 2단계 시스템 ‘마르코니(Marconi)’ 구축을 완료했다고 발표했다. 레노버와 시네카는 인텔 ‘제온 파이(Xeon Phi)’ 프로세서 3,600노드를 100Gb의 인텔 ‘옴니패스 패브릭(Omni-Path Fabric)’과 연결시킴으로써 이러한 성능을 달성했다.

레노버는 ‘마르코니’가 레노버 오픈소스 ‘익스트림 클러스터(Extreme Cluster)’ 및 클라우드 관리 툴킷(xCAT) 등 세계적 수준의 머신러닝 및 AI 시스템으로 기능할 수 있는 핵심 툴을 보유, 유럽 최대 규모의 슈퍼컴퓨터가 될 것으로 기대한다고 밝혔다. 또한, 시네카는 연구원들이 데이터를 물리, 화학, 천문학, 의약 및 도시계획과 같이 다양한 분야와 접목할 수 있도록 온라인으로 공개할 예정이다.

▲ 레노버가 구축한 이탈리아 시네카 슈퍼컴퓨팅 센터의 ‘마르코니’

이 밖에 레노버는 지난해 11월 차세대 HPC 솔루션으로 ▲HPC 시스템 관리를 오픈소스 그래픽 사용자 인터페이스(GUI) 기반으로 단순화하는 포털 사이트 ‘안틸레스(Antilles)’ ▲고집적 디스크 어레이 시스템 ‘D3284 JBO’ 스토리지 ▲IBM ‘스펙트럼 스케일’용 분산 스토리지 솔루션 ‘DSS’ 등도 공개했다.

또한, 레노버 ‘시스템 x(System x)’는 다양한 비즈니스와 기술, 응용 프로그램을 지원하도록 설계된 광범위한 x86 서버 포트폴리오를 제공하며, ‘시스템 x’ 랙마운트 서버는 HPC와 빅데이터 사용자를 위한 고성능 및 유연성을 지원한다.

특히, ‘시스템 x3550 M5’와 ‘시스템 x3650 M5’는 최고수준의 구성능력이 필요한 HPC의 요구사항을 충족시키며, ‘시스템 x3750’과 ‘X6’ 제품군인 ‘x3850 X6’ 및 ‘x3950 X6’는 미션 크리티컬한 데이터베이스 및 고성능 빅데이터 워크로드 요구사항을 처리할 수 있도록 대용량 메모리와 스토리지 용량을 제공한다.


03 IBM | “전통의 HPC 기업…‘오픈파워’ 협력으로 성능 극대화”

 
IBM은 전통적으로 전 세계 HPC 시장에 막대한 투자를 해왔고, 오늘날에도 이를 이어가고 있다.

최초로 1PFlops의 성능을 달성한 로드러너(Roadrunner)나 현재 ‘톱500’ 내 19대, 30위권 내에는 4대를 포함시키고 있는 ‘블루진(BlueGene)’ 같은 슈퍼컴퓨터는 유명하다. 앞서 소개한 로렌스 리버모어 국립연구소의 4위 슈퍼컴퓨터 ‘세콰이어’ 역시 IBM ‘블루진’ 브랜드로 2012년에는 1위 자리에 오르기도 했다.

IBM은 2017년 말을 목표로 하는 미국 에너지부의 코럴(CORAL, The joint Collaboration of Oak Ridge, Argonne and Lawrence Livermore) 프로젝트를 통해 오크리지 국립연구소와 로렌스 리버모어 국립연구소에 각각 1대씩 325만 달러 규모의 수퍼컴퓨터를 구축하고 있다. 이 컴퓨터들은 현재 시스템에 비해 5~10배의 애플리케이션 성능을 낼 것으로 예상된다.

또한, 영국 정부도 과학기술시설워원회(The Science & Technology Facilities Council, STFC)와 IBM이 주도하는 빅데이터 및 인지컴퓨팅 연구에 115만 파운드를 투자하기로 결정했다.

▲ IBM HPC 포트폴리오 요약

IBM은 노드, 클러스터, 스토리지, 소프트웨어 등 모든 측면에서 경쟁력 있는 솔루션을 공급한다. HPC 성능 강화를 위해 엔비디아 GPU, 멜라녹스(Mellanox) 인피니밴드, 자일링스(Xilinx) FPGA(프로그래밍 가능한 반도체) 등 인프라 전반에서 협력하며 기술 혁신을 이뤄나가고 있다. 특히 지난 2013년 구글, 엔비디아, 멜라녹스 등과 함께 설립한 ‘오픈파워 재단(OpenPOWER Foundation)’을 통해 ‘파워’ 프로세서의 아키텍처를 공개하고 관련 기술 혁신을 위해 협력해오고 있다.

특히, IBM은 지난해 엔비디아 ‘테슬라 P100’ GPU 가속기를 탑재한 리눅스(Linux) 서버를 출시하며 HPC 시장 공략에 나서고 있다. IBM의 ‘HPC용 IBM 파워 시스템즈 S822LC’ 서버, 코드명 ‘민스키(Minsky)’는 지난 2014년 발표했던 ‘파워(POWER) 8’에 엔비디아 ‘NV링크(NVLink)’ 지원을 추가한 ‘파워 8+(POWER 8 with NVLink)’ 프로세서를 탑재했다.

▲ ‘HPC용 IBM 파워 시스템즈 S822LC’, 코드명 ’민스키’ 내부

‘NV링크’는 PCI-E 3.0 대비 대역폭이 5배 이상 빠른 인터커넥트 기술이다. IBM은 x86 서버와는 달리 이를 GPU-GPU 구간뿐만 아니라 CPU-GPU 구간에도 적용함으로써 병목현상을 제거, 애플리케이션 성능을 30% 향상시킬 수 있다고 설명하고 있다. 이 밖에 FPGA와의 양방향 고속 연결을 지원하는 CAPI(Coherent Acceleration Processor Interface) 기술도 이용 가능하다.

이로써 IBM은 인공지능(AI), 딥러닝(Deep Learning), 빅데이터(Big Data) 분석을 비롯해 최근 강조하고 있는 인지컴퓨팅(Cognitive Computing) 영역에서 요구하는 HPC 성능을 충족하고 이를 바탕으로 혁신을 지원한다는 방침이다. IBM은 지난해 중국 텐센트(Tencent)의 초기 테스트 결과 새로운 IBM ‘오픈파워’ 서버들이 x86 서버보다 데이터 집약적 작업에서 3배 빠른 처리 능력을 보여줬으며, 이러한 결과는 서버 수를 2/3로 줄이고도 달성 가능했다고 밝혔다.


04 HPE | “2배 이상 격차로 점유율 1위…‘톱500’ 중 140대 차지”

 
HPE는 IDC의 2015년 HPC 서버 시장 조사에서 전 세계 114억 달러 시장 중 35.9%의 점유율을 확보했으며, 대당 50만 달러 이상에 팔리는 HPC 서버 시스템인 ‘슈퍼컴퓨터’ 부문에서는 33억 달러 중 41.1%의 점유율을 차지했다.

또한, 2016년 11월 ‘톱500’에서는 SGI 인수로 더한 28대를 비롯해 총 140대의 시스템을 순위에 올리며 28%로 가장 큰 점유율을 차지했다.

정석원 한국HPE 부장은 “이처럼 HPE는 HPC 시장 점유율과 슈퍼컴퓨터 순위, 두 가지 부문에서 2위 경쟁회사 대비 2배 이상의 점유율 격차를 보인 바 있다”면서, “또한 지난해 세계 최고의 슈퍼컴퓨팅 업체 중 하나인 SGI를 인수함에 따라, 빅데이터 및 딥러닝·머신러닝 분야에서 더욱 큰 성장을 이루기 위해 발 빠른 비즈니스 운영을 계획 중에 있다”고 설명했다.

▲ 정석원 한국HPE 부장
인터뷰 - 정석원 한국HPE 부장

“R&D 투자, 생태계 조성,
SGI 인수 후 신제품 출시 등으로 HPC 역량 강화”

 


HPC 시장에서 HPE의 노력과 전략은?

HPE는 HPC 시장을 위해 상당한 R&D 자금을 투자하고 있다. 산업 컨소시엄에 투자하고, 선도적인 여러 대학 및 기관은 물론 다른 벤더들과도 협력해 HPC와 빅데이터 등의 영역에서 최신 기술을 개발해 오고 있다.

HPE와 인텔 양사는 각각 프랑스 그르노블과 미국 텍사스 휴스턴 2곳에 HPC 우수연구센터(CoE)를 공동으로 설립하고, 깊이 있는 엔지니어링 전문 지식과 수직적 산업 지식, 성능 최적화 및 코드 현대화 전문 지식을 갖춘 직원들을 배치했다. 이 두 센터에서는 벤치마킹과 개념 입증 작업에 집중한다.

여기에 양사는 프랑스 브휴이예흐-르-샤뗄(Bruyeres-le-Chatel)에 위치한 테라텍(Teratec)에 또 하나의 CoE를 설립했다. 테라텍은 80개 이상의 회사, 실험실과 연구소, 대학교 및 엔지니어링 학교가 모여 있는 곳으로, HPC 및 빅데이터 분석 솔루션을 위한 신기술을 선보이고 개념 입증 및 성능 벤치마킹을 수행하며 교육용 백서와 참조 아키텍처를 개발하는 것을 목적으로 하고 있다.

또한, HPE는 NSCI(National Strategic Computing Initiative)에도 활발하게 참여하며 엑사스케일(Exascale) 컴퓨팅 기술을 미국 정부에 제공하는 등 미국의 미래 기술 방향을 형성하는 데에도 도움을 주고 있다. 지금까지 HPE는 ITIF(Information Technology and Innovation Foundation)가 후원하는 의회 패널, 미국 과학기술국(OSTP, Office of Science and Technology Policy) 워크숍 및 NSCI 관계자들과의 미팅 등 NSCI 활동에 참여해 왔다.

특히, HPE는 한국을 포함한 5개 국가에 딥러닝 연구개발을 위해 엔비디아와 함께 CoE를 설립할 예정이다. 한국HPE 역시 HPC 부문에서 최근 5년 내 7배 이상의 큰 폭으로 성장했으며, 이와 동시에 시장 여러 영역에서 협력 방안 및 기술 개발에 힘을 쏟고 있다.

HPE는 대 고객 및 협력 파트너를 위한 전 세계적 노력의 일환으로, 주요 고객을 대상으로 꾸준히 HP-CAST(High Performance Consortium of Advanced Scientific Technology) 컨소시엄을 진행하고 있으며 한국 고객들을 위해 국내에서도 매년 본사 전문 인력을 초빙해 이를 진행하고 있다. 또한 인텔, 엔비디아, 알테온 등 다양한 HPC 분야 벤더사와 함께 공동 행사 및 프로모션 등을 진행하고 있다.


HPE의 HPC 역량은?

HPE는 HPC에 특화된 최대 수의 제품 라인업을 보유하고 있다. HPC에 특화된 서버 라인인 HPE ‘아폴로(Apollo)’ 시스템은 가장 뛰어난 공간 효율성과 저전력·고효율을 구현한다. ‘아폴로’는 뉴질랜드 디지털 시각 효과 기업 웨타디지털(Weta Digital), 에어버스(Airbus), 보잉(Boeing), 포뮬러원(formula1) 등 다양한 글로벌 레퍼런스를 보유하고 있다. 국내에서는 최근 시각효과 전문기업 디지털아이디어가 렌더링 팜(Rendering Farm) 구축을 위해 HPE ‘아폴로’ 시스템을 도입했다.

또한, HPE는 HPC 플랫폼 벤더사 SGI 인수를 통해 올해 안에 딥러닝을 위한 신제품을 6종 이상 출시할 예정이다. 온프레미스 클라우드 구축을 위한 최적의 솔루션인 업계 최초 컴포저블(composable) 인프라 HPE ‘시너지(Synergy)’도 출시, 클라우드 기반 HPC 라인업을 확장했다.

이 밖에 업계 최대의 HPC 전문 인력을 비롯해 알테온, 인텔, 엔비디아, OEM 파트너, 서비스 프로바이더 등과의 긴밀한 협력 관계를 보유하고 있다. 특히 인텔 및 엔비디아와는 전 세계적으로 CoE를 통해 시스템을 공동 개발하는 환경을 조성 중이다.


05 슈퍼마이크로 | “가속기 서버 주력하며 HPC 시장 존재감 피력”

 
슈퍼마이크로는 ‘톱500’ 리스트에서 그다지 눈에 띄는 벤더는 아니다. 미국 러트거스 디스커버리 인포매틱스 연구소(Rutgers Discovery Informatics Institute)의 슈퍼컴퓨터 ‘칼리번(Caliburn)’이 242위에 등재돼 있다.

슈퍼마이크로 ‘팻트윈 슈퍼서버(FatTwin SuperServer)’ 플랫폼을 기반으로 인텔 ‘제온 E5-2695v4’ 2.1GHz 18코어 프로세서와 인텔 옴니패스 패브릭이 사용됐다.

이 밖에 462위에 올라있는 러시아 국립연구소(National Research Centre) 산하 쿠르챠토프 연구소(Kurchatov Institute)의 ‘HPC4’는 멜라녹스와 함께 구축한 시스템이다. 슈퍼마이크로 ‘트윈(Twin)’ 서버를 기반으로 인텔 ‘제온 E5-2680v3’ 2.5GHz 12코어, 멜라녹스 인피니밴드 FDR, 엔비디아 ‘테슬라 K80’ 등으로 구성됐다.

슈퍼마이크로는 최고 성능의 슈퍼컴퓨터 부문에서 존재감을 나타내기보다는 넓은 범위의 HPC 솔루션을 상대적으로 저렴한 가격에 제공하고 있는 것으로 파악된다. 대표 모델로는 ‘트윈’ 시리즈, GPU 및 ‘제온 파이’ 시스템, ‘슈퍼블레이드(SuperBlade)’가 있다.

‘트윈’ 시리즈와 ‘슈퍼블레이드’는 고집적 서버로 고밀도의 연산 클러스터를 통해 와트, 달러, 평방피트 당 병렬 컴퓨팅 성능을 극대화시킨다. GPU 및 ‘제온 파이’ 시스템은 최근 슈퍼마이크로에서 가장 주력하는 라인업이다.

▲ 슈퍼마이크로 슈퍼서버 ‘SYS-4028GR-TR2’

슈퍼마이크로 국내 총판인 디에스앤지의 솔루션팀장은 “슈퍼마이크로는 엔비디아 및 인텔과 긴밀히 협력해 관련 라인업을 선도적으로 출시하고 있다. 또한 기술 변화에 대한 민첩한 대응력도 주요 역량 중 하나로, 이는 글로벌 하드웨어 기업과 클라우드, 빅데이터, 소프트웨어 정의 스토리지(SDS) 등을 포함하는 솔루션 기업과의 기술적 교류를 통해 이뤄진다”면서, “대부분의 글로벌 IT기업이 자리 잡은 실리콘밸리에 본사가 위치, 테스트베드 제공 등의 관계 구축도 가능하다”고 소개했다.

슈퍼마이크로 공식 수입원인 넥스트와이즈의 유영주 대표는 “슈퍼마이크로 제품 중 최근 가장 인기 있는 제품으로 엔비디아 ‘파스칼’ GPU에 최적화된 ‘4028GR-TR2’와 ‘4028GR-TRT2’ 서버를 추천한다”면서, “이 서버의 단일루트 복합 PCI-E 디자인은 QPI(QuickPath Interconnect)와 PCI-E 링크들을 통해 GPU P2P(peer-to-peer) 커뮤니케이션의 효율성을 증진시키며, 이전 세대 제품 대비 최대 21% 높은 QPI 스루풋(Throughput)과 60% 수준의 저전력을 자랑한다”고 밝혔다.


06 코코링크 | “GPU 20대 장착 가능한 HPC 자체 개발”

 
코코링크는 2001년 설립된 후 2012년 서울대학교기술지주회사의 자회사로 편입된 슈퍼컴퓨팅 전문기업이다. 전 세계에서 유일하게 ‘PCIe 스위칭 패브릭(Switching Fabric)’을 적용해 20대의 GPU를 장착하는 초고성능 시스템을 생산하고 있다. 회사는 ‘서울대학교의 연구성과를 산업화’해 부가가치를 극대화는 것을 목적으로 한다고 밝히고 있다.

설립 이후부터 고성능컴퓨터 기술의 개발에 전념한 코코링크는 2007년 ‘GPGPU(GPU를 이용한 범용 계산)’ 기술이 공개된 후 한 대의 시스템에 많은 GPU를 집적해 초고성능의 컴퓨터를 구성하는 방법론의 개발에 집중했다.

그 성과로 지난 2011년 단일 스위칭 패브릭에 8대의 GPU를 장착할 수 있는 ‘클릭(CliC) 80000’을 최초로 개발, 2013년 독일 라이프치히에서 열린 유럽 ‘ISC’에서 공개했다. 이어 20대의 GPU를 장착할 수 있는 고집적 HPC ‘클라이맥스-210(KlimaX-210)’을 역시 2013년 말 미국 덴버에서 열린 ‘SC’에서 공개했으며, 이후로는 다양한 폼펙터의 고성능 시스템을 만들고 있다.

▲ 코코링크 20GPU 장착 HPC ‘클라이맥스-210’ 소개 슬라이드

코코링크는 ‘클라이맥스-210’가 이미 전 세계 HPC 업계에서 인정받고 있으며, 미국 해군연구소에서 함정 탑재용으로 활용하고 있다고 설명했다. 또한 프랑스 오렌지텔레콤은 AI 기반 음성 서비스용 서버용도로 운용할 예정이라고 덧붙였다.


07 태진인포텍 | “공공시장 검증받은 안정성의 HPC 스토리지·서버 보유”

 
태진인포텍은 2006년부터 R&D를 통해 DRAM을 저장장치화한 DRAM SSD를 개발, ‘젯스피드(Jet Speed)’ 서버 및 스토리지를 선보인 바 있다.

‘젯스피드’는 대규모 데이터를 빠르게 처리하지 못하는 HDD의 단점과 성능저하 및 수명 문제가 있는 SSD의 단점을 모두 극복한 제품으로, 회사는 HPC 환경에 적합한 서버 및 스토리지 제품이라고 소개하고 있다.

태진인포텍은 국내외 HPC 시장에서 크게 2가지 전략으로 접근한다는 방침이다. 먼저 지난해 정부통합전산센터, 서울시 데이터센터, 전국 시·군·구, 국민안전처 등 다양한 공공기관에 고성능 서버와 캐시 시스템을 구축하면서 검증받아온 제품 안정성과 성능을 바탕으로 B2B 시장 진출을 확대한다는 계획이다. 다음으로는 유전체 분석, 이동통신, 금융 등 각 분야에서 요구하는 HPC 성능과 환경에 맞춰 특화된 솔루션을 개발한다는 전략이다.

▲ 태진인포텍은 GPU 가속기 8대를 탑재할 수 있는 HPC 서버 ‘TJS208’을 선보일 예정이다.

회사는 GPGPU 서버가 주목받고 있는 추세에 맞춰 각 분야에 특화된 폼팩터와 사양, 라이프사이클 등을 고려해 ▲엔비디아 ‘테슬라’ GPU 가속기가 2대 탑재된 ‘TJS208-G2’ ▲GPU 가속기 2대에 ‘젯스피드’가 추가된 ‘HHA3824-G2’을 각각 1, 2분기에 출시 완료했다. 또한 ▲GPU 가속기 4대를 탑재할 수 있는 ‘TJS212-G4’를 3분기에 출시하고 ▲GPU 가속기 8대를 탑재 가능한 ‘TJS212-G8’을 4분기 선보이며 HPC 시장 트렌드에 대응해나간다는 계획이다.

신현삼 태진인포텍 사장은 “빅데이터를 기반으로 학습을 통해 체계화되는 딥러닝 AI를 활용하는 경우가 늘어나면서 HPC 제품 수요가 증가하고 있다. 또 최근에는 유전체분석 기업 고객을 통해서도 HPC에 대한 선호를 체감하고 있다. 유전체 분석의 경우 대량의 정보를 수집하고 분석해야 하므로 고성능 컴퓨팅 환경이 요구될 수밖에 없다”면서, “그러나 국내 HPC 시장은 아직 글로벌 시장에 비해 규모가 작고 R&D 투자가 활성화되지 않은 것으로 파악된다. 또한 사용자 측면에서 HPC 기술을 보유한 기업이 어디인지, 어떻게 활용해야 하는지에 대한 인식이 부족하다는 점도 극복해야 한다”고 밝혔다.

저작권자 © 아이티데일리 무단전재 및 재배포 금지