알리바바 클라우드, AI 센터 신설 및 데이터센터 영역 확장…글로벌 경쟁 본격화

7일 싱가포르서 ‘알리바바 클라우드 글로벌 서밋’ 개최

2025-07-07     성원영 기자

[아이티데일리] 알리바바 클라우드(Alibaba Cloud)가 7일 싱가포르서 개최된 ‘알리바바 클라우드 글로벌 서밋(Alibaba Cloud Global Summit)’을 통해 인프라 투자 확대, 인공지능(AI) 역량 센터 신설, 첨단 클라우드 및 AI 기술 등을 새롭게 발표했다.

이번 서밋은 싱가포르 진출 및 현지 글로벌 본사 설립 10주년을 맞이해 개최됐으며, AI·클라우드 컴퓨팅 및 지속가능한 디지털 전환의 미래에 대해 논의하기 위해 마련됐다. 이 날 행사에는 전 세계 비즈니스·기술·공공 부문 리더 500여 명이 참석했다. 

알리바바 클라우드 인텔리전스 글로벌 사업 부문 셀리나 위안 회장이 ‘알리바바 클라우드 글로벌 서밋’에서 발표를 진행하고 있다. (사진=알리바바 클라우드)

말레이시아 및 필리핀에 신규 데이터센터 설립 발표

이번 서밋에서 알리바바 클라우드는 동남아시아 지역 내에서도 증가하는 클라우드 및 AI 서비스 수요에 대응하기 위해 지난 1일 말레이시아에 세 번째 데이터센터를 정식 개소한다고 밝혔다. 오는 10월에는 필리핀에 두 번째 데이터센터를 추가로 개설할 계획이다. 이번 확장은 2025년 상반기에 발표된 태국, 멕시코, 한국 내 인프라 투자에 이은 후속 조치다. 회사는 보안성, 안정성 및 확장성을 갖춘 클라우드 서비스에 대한 전 세계적 수요가 증가함에 따라 글로벌 인프라 네트워크 확장으로 효과적 대응 기반을 마련해나갈 것이라고 강조했다

또한 알리바바 클라우드는 싱가포르에 첫 번째 ‘AI 글로벌 역량 센터(AI Global Competency Center, AIGCC)’를 설립했다고 발표했다. 이는 중소기업부터 대기업까지 모든 규모의 기업을 지원함으로써 AI 도입을 가속화하고, 전 세계적으로 증가하는 AI 인재 수요에 대응할 전략의 일환이라고 설명했다. 

글로벌 AI 개발을 위한 클라우드 신제품 발표

이번 서밋에서 알리바바 클라우드는 인프라형 서비스(IaaS) 및 플랫폼형 서비스(PaaS) 제품을 업그레이드하고, 새로운 AI 도구를 추가한 클라우드 신제품도 공개했다. 이 중 실시간 데이터 스트리밍 서비스인 ‘알리바바 클라우드 데이터 전송 서비스(DTS)’에는 멀티모달 데이터 준비 과정을 간소화하는 ‘원 채널 포 AI(One Channel for AI)’ 기능을 새롭게 도입했다. 회사에 따르면 이 기능은 문서, 이미지, 비디오 등 비정형 및 정형 데이터를 자동으로 벡터 데이터베이스로 변환하는 엔드투엔드 파이프라인을 구성할 수 있다. 이를 통해 개발자들이 몇 번의 클릭만으로 실시간 지식베이스를 구축하고 검색증강생성(RAG) 애플리케이션을 손쉽게 개발할 수 있도록 지원한다고 덧붙였다. 

또 알리바바 클라우드는 AI 플랫폼(PAI)의 탄력적 알고리즘 서비스(EAS)에 핵심 기능을 추가했다고 밝혔다. 이에 따라 전문가 혼합(MoE)과 같은 복잡한 모델은 물론 대규모 배포 환경까지 보다 효과적으로 지원할 수 있도록 고성능 추론 기능을 강화했다는 설명이다. MoE는 신경망 아키텍처 패턴으로, 하나의 레이어나 연산을 여러 개의 하위 네트워크(전문가)로 분할해 계산하는 방식이다. 

MoE 아키텍처를 위해, PAI-EAS에는 프리필-디코드(prefill-decode) 분리 프레임워크와 함께 작동해 효율성을 높이는 고도화된 최적화 기능인 ‘EP(Expert Parallel)’가 도입됐다. 회사는 이 조합이 추론 효율을 크게 향상시켜, 대규모언어모델(LLM)의 처리량을 높이는 동시에 리소스 활용도 최적화할 수 있다고 설명했다. 예를 들어, LLM AI 모델 ‘큐원3(Qwen3) 235B’ 모델에 적용된 EP 기반 분산 배포는 초당 처리 토큰 수(TPS) 1만 5천 개 이상을 기록하며, 토큰당 평균 지연 시간도 50밀리초(ms) 미만으로 유지된다.

이어 알리바바 클라우드는 PAI-EAS에 새로운 ‘모델 웨이트 서비스(Model Weights Service)’를 도입했다. 이를 통해 모델 로딩 시간을 획기적으로 줄이며, 느린 콜드 스타트와 비효율적인 확장 문제를 해결했다고 강조했다. 기존에는 몇 분이 걸리던 인스턴스 구동을 수초 만에 실행할 수 있게 됐다는 게 핵심이다. 회사에 따르면 ‘큐원(Qwen)3-8B’의 모델 테스트에서는 콜드 스타트 속도가 89.8% 향상되고, 확장 속도는 97.6% 빨라진 것으로 집계됐다. ‘큐원(Qwen)3-32B’ 모델은 콜드 스타트가 91.4% 빨라지고 확장도 거의 즉시 이뤄졌다고 설명했다. 콜드 스타트란 컴퓨터나 인터넷 서비스를 오랫동안 사용하지 않았다가 다시 시작할 때의 상태를 의미한다. 

더불어 회사는 고객 수요에 대응해, 9세대 인텔 기반 ‘엔터프라이즈 엘라스틱 컴퓨트 서비스(ECS)’ 인스턴스를 오는 7월부터 일본, 한국, 말레이시아, 영국 등 글로벌 시장에 확대 출시할 계획이라고 밝혔다.

또한 올해 회계연도 내에 총 6,000만 달러 규모의 투자를 단행하겠다고 발표했다. 이번 투자는 글로벌 파트너 생태계 강화를 위한 공동 마케팅, 인센티브 리베이트 프로그램, 역량 강화 프로그램 등에 전략적으로 활용될 예정이다. 또한 파트너들이 LLM AI 모델 ‘큐원(Qwen)’과 같은 최신 AI 기술을 보다 쉽게 접하고, 글로벌 시장에서 디지털 전환을 가속화할 수 있도록 지원하는 데 중점을 둘 예정이라고 설명했다.