모바일 장치에서 초당 수 조의 머신러닝 연산 처리 가능

 
[아이티데일리] 영국 반도체 설계자산(IP) 기업 Arm이 향상된 머신러닝(Machine learning, ML) 및 신경망(Neural network, NN) 기능을 제공하는 새 IP 제품군 ‘프로젝트 트릴리엄(Project Trillium)’을 22일 발표했다.

‘프로젝트 트릴리엄’은 뛰어난 확장성의 새 프로세서들을 포함하는 Arm IP 제품군이다. Arm은 현재의 기술들이 모바일 시장에 중점을 두고 있지만, 최첨단 객체 인식(Object Detection, OD) 기능을 포함하는 첨단 컴퓨팅 기능을 통해 새로운 수준의 ML 탑재 디바이스를 구동시킬 수 것으로 기대하고 있다.

Arm은 현재의 ML 기술이 특정 디바이스 종류나 특정 요구사항에 집중하는 경향이 있으나, ‘프로젝트 트릴리엄’은 최상의 확장성을 제공함으로써 이러한 현상에 변화를 가져온다고 설명했다. 초기에 출시된 Arm ML 제품의 경우 모바일 프로세서에 초점을 맞췄지만 향후에는 센서, 스마트 스피커, 홈 엔터테인먼트, 그리고 그 이상을 아우르는 적절한 성능을 제공할 것이라는 기대다.

Arm은 특히 자사의 새로운 ML 및 객체 인식 프로세서가 기존 CPU, GPU, 가속기(accelerators)와 비교해 엄청난 효율 향상을 가져올 뿐만 아니라, 전형적인 DSP를 훨씬 능가한다고 주장했다.

먼저 Arm ML 프로세서는 처음부터 철저하게 ML 전용으로 설계돼, 확장성이 뛰어난 Arm ML 아키텍처를 기반으로 ML 응용 프로그램의 성능과 효율성을 극대화한다고 소개됐다. Arm ML 프로세서는 모바일 컴퓨팅의 경우 초당 4.6조 이상의 연산을 수행하며 지능형 데이터 관리를 통해 실제 응용 프로그램에서 2배에서 4배가량 높은 유효 처리량(TOPs)을 제공할 수 있다. 발열과 비용이 제한된 환경에서도 소비전력 당 초당 3조 이상 연산(TOPs/W) 효율성을 제공하는 탁월한 성능을 발휘한다.

또한 Arm OD 프로세서는 사람과 기타 사물을 효율적으로 식별하도록 특수 설계됐으며, 프레임 당 식별 가능한 사물의 수가 무한대에 가깝다고 소개됐다. 초당 60프레임의 속도로 풀HD 해상도를 실시간으로 식별할 수 있으며, 기존 DSP 대비 최대 80배까지 성능을 높여 이전 Arm 기술에 비해 식별 능력이 크게 향상됐다는 설명이다.

Arm의 ML 및 OD 프로세서는 기존보다 한층 더 뛰어난 성능을 자랑하며, 높은 성능과 전력 효율을 갖춘 사람 식별 및 인식 솔루션을 제공한다. 이는 스마트 디바이스에서 저전력, 고해상도의 상세한 얼굴 인식 기능을 실시간으로 가능하게 한다.

이와 함께 Arm NN 소프트웨어는 ‘Arm 컴퓨트 라이브러리(Arm Compute Library)’ 및 ‘CMSIS-NN’과 함께 사용될 경우 NN에 최적화되며, 텐서플로우(TensorFlow), 카페(Caffe), 안드로이드 NN과 같은 NN 프레임워크와 모든 Arm 코어텍스(Cortex) CPU, Arm 말리(Mali) GPU, ML 프로세서를 자연스럽게 통합해 준다.

개발자는 Arm 기반 하드웨어 기능을 최대한 활용해 ML 응용 프로그램에서 최고의 성능을 얻을 수 있다. 새로운 Arm ML IP 제품군은 2018년 4월에 시연 가능하며, 2018년 중순 출시될 예정이다.

르네 하스(Rene Haas) Arm IP 제품 그룹 대표는 “인공지능(Artificial intelligence)이 엣지 디바이스에 적용되는 속도가 빨라짐에 따라, 전력 효율성을 유지하면서 충분한 컴퓨팅 성능을 제공하는 것이 점점 어려워지고 있다. 이러한 요구를 충족시키기 위해, Arm은 새로운 ML 플랫폼인 ‘프로젝트 트릴리엄’을 발표했다”면서, “새로운 디바이스에는 이러한 최신 프로세서가 제공하는 고성능 ML 및 AI 기능이 필요할 것이고, 파트너사들은 Arm 플랫폼이 제공하는 높은 수준의 유연성과 확장성을 활용해 다양한 디바이스에서 구현 가능한 범위를 확장할 수 있을 것”이라고 덧붙였다.

저작권자 © 아이티데일리 무단전재 및 재배포 금지