SSS, 퓨전 등으로 고성능 개발 인프라 제공
데이터 급증에 ‘콜드 아카이브’ 주목

IBM 스토리지 최고기술책임자 빈센트 쉬 부사장
IBM 스토리지 최고기술책임자 빈센트 쉬 부사장

[아이티데일리] “많은 기업이 인공지능(AI)에 관심을 두지만, 데이터 관련 비용 문제로 인해 실제 도입에 어려움을 겪고 있다. 폭발적으로 늘어나는 데이터를 생성형 AI에 맞게 관리하는 데 막대한 인프라가 소요되기 때문이다. IBM 스토리지 제품군은 모델 성능 향상 및 GPU(그래픽처리장치)를 최대한 활용할 수 있도록 지원하는 등 AI 워크로드에 최적화돼 있다.”

4일 한국IBM에서 열린 기자 간담회에서 IBM 스토리지 최고기술책임자(CTO)인 빈센트 쉬(Vincent Hsu) 부사장이 AI 프로젝트를 위한 자사의 스토리지 역량을 소개하며 이 같이 밝혔다.

데이터는 생성형 AI를 도입하고 활용하는 전 과정에 걸쳐 필요하다. 모델을 개발하기 위해 내외부 데이터를 취합하고 적절한 형태로 정제해야 한다. 그 다음 이를 고객 데이터와 결합해야 미세조정(파인튜닝)이나 RAG(검색 증강 생성), 추론 작업 등에 사용할 수 있다. 기업들은 이 모든 과정을 거치며 상당한 양의 데이터를 축적하게 된다.

빈센트 쉬 부사장은 “AI 개발 과정에서 기업이 수집하는 데이터는 페타바이트(Petabyte, PB) 규모에 달한다. 거대한 데이터를 활용할 수 있는 인프라를 갖춰야 불필요한 비용 소모를 줄일 수 있다”며 “IBM은 스토리지 스케일 시스템(Storage Scale System, SSS), 스토리지 퓨전(Storage Fusion) 등 학습, 미세조정 과정을 뛰어난 성능으로 소화할 수 있는 제품군을 마련했다”고 설명했다.

한국IBM 스토리지 사업총괄 박대성 상무
한국IBM 스토리지 사업총괄 박대성 상무

생성형 AI의 부상과 함께 데이터 보관 문제 역시 중요해졌다. 많은 데이터가 모델 개발에 쓰이는데, 이 데이터들은 학습, 미세조정 이후에도 향후 모델 관리를 위해 보관해야 한다. 따라서 기업들은 거대한 데이터를 저장할 수 있는 공간이 필요하게 됐다.

IBM은 콜드 스토리지에 주목했다. 콜드 스토리지란 자주 액세스하지 않는 데이터를 장기간 보관하는 목적의 저장 공간을 의미한다. IBM에서는 ‘다이아몬드 테이프 라이브러리(Diamondback Tape Library)’로 대규모 데이터 저장 수요에 대응한다는 방침이다.

한국IBM 스토리지 사업총괄 박대성 상무는 “모든 데이터를 값비싼 저장 공간에 보관할 수는 없다. 기업들은 폭발적인 데이터 증가 대비 한정적인 IT 투자를 고려해 스토리지 인프라 전략을 검토해 왔으며, 엔터프라이즈 고객군을 시작으로 콜드 아카이빙 솔루션을 본격적으로 도입했다”고 분석했다.

IBM은 AI를 위한 데이터 활용 전 과정을 아우르는 스토리지 제품군으로 시장 영향력을 확대할 계획이다. 높은 성능이 요구되는 분석·추론에는 SSS와 퓨전을, 장기 보관에는 다이아몬드 테이프 라이브러리를 활용한다는 것이다.

박대성 상무는 “분야를 막론하고 AI를 도입하는 기업에 있어 GPU는 필수적이다. 그러나 GPU의 빠른 속도를 다른 인프라가 따라가지 못해 비싼 장비를 제대로 활용하지 못하는 문제를 겪는 기업도 있다. IBM은 AI에 최적화된 스토리지 포트폴리오를 통해 기업이 GPU를 100% 활용할 수 있도록 지속적으로 지원할 것”이라고 밝혔다.

저작권자 © 아이티데일리 무단전재 및 재배포 금지