공동 엔지니어링 통해 엔비디아 GPU 장점 최대한 활용 가능하게 구성

▲ ‘카페2’는 단일 ‘DGX-1’ 슈퍼컴퓨터 상에서 최대 7배 향상된 트레이닝 속도를 제공한다.

[아이티데일리] 엔비디아(CEO 젠슨 황)는 페이스북이 오픈소스로 공개한 새로운 인공지능(AI) 딥러닝 프레임워크인 ‘카페2(Caffe2)’와 관련, 인공지능 발전을 위한 양사 협력 결과를 발표했다고 21일 밝혔다.

오늘날 전 세계는 매일 생성되는 수많은 텍스트, 이미지, 영상 등의 정보들로 넘쳐나고 있다. 페이스북은 이러한 정보의 관리를 돕는 새로운 인공지능 시스템을 개발하고 있으며, 이를 통해 사람들이 정보량이 대규모로 증가하는 상황에서도 보다 세상을 보다 잘 이해하고, 효율적으로 커뮤니케이션할 수 있도록 돕고 있다. 개발자 및 연구원들은 ‘카페2(Caffe2)’를 활용해 대규모 분산 트레이닝 시나리오를 구성하고, 사용자 디바이스용 머신러닝 애플리케이션을 개발할 수 있다.

모바일상에서 인공지능 기반 서비스를 제공하기 위해서는 복잡한 데이터 처리 작업이 순식간에 진행돼야 한다. 이와 같은 빠른 인공지능 서비스 처리는 페이스북의 ‘빅베이슨(Big Basin)’ 서버에서 제공되는 것과 같은 GPU 가속화 컴퓨팅은 물론, 가속화된 하드웨어의 전체 성능을 활용할 수 있을 만큼 높은 수준으로 최적화된 딥러닝 소프트웨어를 함께 요구한다.

엔비디아와 페이스북은 ‘카페2’ 딥러닝 프레임워크 상에서의 공동 작업을 통해 인공지능 가속화를 제공하고 있다. 양사는 공동 엔지니어링을 통해 ‘카페2’를 시작부터 끝까지 세밀하게 조정, 엔비디아 GPU 딥러닝 플랫폼의 장점을 최대한 활용할 수 있도록 구성했다.

‘카페2’는 엔비디아의 최신 딥러닝 SDK 라이브러리인 cuDNN, cuBLAS, NCCL을 활용해 고성능의 멀티 GPU 가속 트레이닝 및 추론을 제공한다. 엔비디아는 이에 사용자들이 자사 GPU 시스템에서 ‘카페2’가 최적의 성능을 제공한다는 사실을 인지하고, 인공지능 기반 애플리케이션 개발에 집중할 수 있다고 설명했다.

‘카페2’는 빠르고 확장 가능하며 이동이 용이한 딥러닝 프레임워크로 설계됐다. 이에 엔비디아 ‘테슬라 P100(Tesla P100)’ GPU 가속기 64개를 탑재한 8대의 네트워크화된 페이스북 ‘빅베이슨’ AI 서버 상에서 57배로 향상된 처리량 가속화를 보여주며, 이로써 딥러닝 트레이닝에 거의 선형에 가까운 확장성을 제공한다는 게 회사 측 설명이다. 즉, 개발자는 인공지능 모델을 전보다 빠르게 트레이닝하고 이를 반복할 수 있다.

엔비디아는 해당 협업의 일환으로 자사 ‘DGX-1’ 인공지능 슈퍼컴퓨터가 딥러닝에 최적화된 소프트웨어 스택에 ‘카페2’를 제공하는 최초의 인공지능 시스템이 될 전망이라고 밝혔다. ‘DGX-1’과 ‘카페2’ 모두 높은 성능 및 빠른 트레이닝을 제공하며, 향후 사용자들은 엔비디아 ‘DGX-1 컨테이너 레지스트리(DGX-1 Container Registry)’를 통해 ‘DGX-1’용 ‘카페2’를 이용할 수 있다.

한편, 그동안 엔비디아는 ‘엔비디아 딥 러닝 인스티튜트(Deep Learning Institute)’를 통해 전 세계 1만여 명 이상의 개발자들이 프레임워크를 활용해 다양한 지능형 애플리케이션과 서비스용 뉴럴 네트워크 기반 머신러닝을 설계, 훈련, 구축할 수 있도록 지원해왔다. ‘카페2’ 트레이닝은 미국 현지시간 기준으로 5월 8일부터 11일까지 샌프란시스코 산호세에서 개최되는 ‘GPU 테크놀로지 컨퍼런스’에서 ‘엔비디아 딥러닝 인스티튜트’를 통해 만나볼 수 있다. 

저작권자 © 아이티데일리 무단전재 및 재배포 금지