정규 세션 통해 연구 논문 4편 발표…비전·음성합성 챌린지 1위 기록하며 성과 인정받아

▲ 네이버랩스가 CVPR 2019 참가자들에게 컴퓨터 비전 및 딥러닝 분야의 연구성과를 소개하고 있다.

[아이티데일리] 네이버랩스(대표 석상옥)가 지난 16일부터 20일까지 개최된 ‘CVPR(IEEE Conference on Computer Vision and Pattern Recognition) 2019’에 참가해 인공지능(AI) 기술 공유 및 인재 영입에 나섰다.

CVPR은 글로벌 기술 전문 단체인 IEEE와 CVF가 1983년부터 공동 주최하는 컴퓨터 비전 및 딥러닝 분야 글로벌 컨퍼런스다. 세계적인 연구기관들이 참석해 매년 새로운 컴퓨터 비전, 딥러닝 등 AI 기술 연구 성과를 공유한다. 네이버는 이번 CVPR 2019의 정규 세션에서 컴퓨터 비전과 관련된 4편의 논문을 공개했다.

먼저 클로바 AI 연구원들의 논문 ‘텍스트 감지를 위한 문자 영역 이해(Character Region Awareness for Text Detection)’는 문자의 영역을 글자 존재 확률과 글자 간 동일 단어 확률을 예측하여 OCR 성능을 높이는 기술을 담았다. 해당 기술은 현재 ‘네이버’ 서비스에도 반영돼 있다.

네이버랩스 연구원들이 발표한 ‘맵 업데이트를 위해 관심 분야 변화를 감지하는 능동 학습 방법(Did it change? Learning to Detect Point-Of-Interest Changes for Proactive Map Updates)’에는 지난 1년여 간 네이버랩스 한국·유럽 연구진의 공동 연구 성과를 담았다. 해당 기술은 자율주행 로봇이 수집한 대규모 실내 공간 데이터를 분석해 바뀐 상호를 인식하고 지도 정보를 최신으로 업데이트한다. 로보틱스, 컴퓨터 비전, 딥 러닝 등 네이버랩스의 핵심 기반 기술이 뒷받침됐다는 설명이다.

한편 올해 네이버 클로바팀과 네이버랩스는 글로벌 기업들이 참여해 서로 기술을 겨루는 다양한 챌린지에서도 우수한 성과를 기록했다. 가령 ‘장기간 이미지 기반 측위(Long-Term Visual Localization)’ 챌린지의 ‘지역 특장점(local feature)’ 부문에서는 네이버랩스 유럽이 구글 및 MS와 같은 기술 기업들을 제치고 1위를 수상했다.

해당 챌린지는 특정 랜드마크의 주간 촬영 이미지와 촬영 위치를 기반으로 야간 촬영 이미지의 현재 위치를 찾아내는 것이다. 네이버랩스 유럽 연구진들은 딥러닝 기반의 고성능 신기술을 통해 해당 분야에서 근 15년간 활용되던 SIFT(Scale-Invariant Feature Transform) 알고리즘의 성능을 상회하는 결과를 이끌어냈다.

또한 구글과 아마존이 스폰서로 참여한 ‘i푸드(iFood) 2019’ 챌린지에서는 클로바 비전 팀이, 딥마인드와 구글이 스폰서로 참여한 ‘액티비티넷(ActivityNet)’ 챌린지에서는 클로바 스피치 팀이 각각 1위를 차지했다.

석상옥 네이버랩스 대표는 “이번 CVPR 컨퍼런스는 네이버랩스와 네이버랩스 유럽의 컴퓨터 비전 및 딥러닝 연구진들이 세계 최고 수준임을 다시 알릴 수 있는 좋은 기회였다”며, “향후 일상 공간의 고정밀 데이터들을 네이버 서비스와 연결해 새로운 경험과 정보를 제공할 수 있는 요소 기술들이 될 것”이라고 말했다.

김성훈 클로바AI 리더는 “그 동안의 꾸준한 기술 연구 투자가 OCR, 음성 인식, 음식 이미지 분류 등 다양한 챌린지에서의 성과로 이어져, 네이버 AI 기술 수준이 세계 최고 수준으로 성장했다는 것을 확인할 수 있었다”면서, “해당 기술들은 빠른 시일 내에 서비스에 적용돼 서비스 고도화에 기여하고 이용자들에게 더 많은 가치를 제공하게 될 것”이라고 밝혔다.

저작권자 © 아이티데일리 무단전재 및 재배포 금지