엑소브레인 SW: 인간과 기계의 지식소통을 위한 인공지능 기술 개발

[컴퓨터월드] 최근 빅 데이터를 대상으로 한 딥 러닝 기술의 급속한 발전에 따라 전 세계적으로 인공지능 관련 기술에 대한 폭발적인 관심과 경쟁적인 개발이 추진되고 있다. 인공지능은 지능적인 기계를 만들기 위한 SW와 HW를 포괄하는 과학 및 공학을 지칭하며, 인공지능이 인간의 지능을 뛰어넘는 시점을 특이점(Singularity)이라고 부른다.

영국의 BBC(Tomorrow’s world: A guide to the next 150 years)와 유엔 미래포럼(유엔 미래보고서 2045) 등은 2045년에 인간의 지능보다 뛰어난 슈퍼지능머신이 출현해 특이점이 도래할 수 있다고 예측했다. 또한, 인공지능이 인류의 일자리를 빼앗고, 나아가 인류의 멸망을 초래할 수도 있다는 부정적인 전망도 했다.

본지는 ICT 역사상 가장 혁신적인 기술로 주목받고 있는 인공지능과 관련, “인공지능 기술 개발 어디까지 왔나?”라는 주제로 국내 최고의 인공지능 전문가들을 필진으로 구성해 기획연재를 한다. 인공지능 필진과 게재할 주요 내용은 다음과 같다.

■ 엑소브레인(언어지능): ETRI 김현기 실장
■ 딥뷰(시각지능): ETRI 박종열 실장
■ 머신러닝 및 딥러닝: 포항공대 최승진 교수
■ 뇌공학: 고려대 이성환 교수
■ 음성처리: ETRI 박전규 실장

 

엑소브레인 SW
인간과 기계의 지식소통을 위한 인공지능 기술 개발


▲ 김현기 한국전자통신연구원 지식마이닝 실장

김현기 실장은 1995년-2000년 한국전자통신연구원 연구원, 2002년-2005년 플로리다 대학 연구원, 2005년-2011년 한국전자통신연구원 선임연구원을 거쳐 현재 한국전자통신연구원 지식마이닝 연구실장으로 근무 중이다. 기계학습, 자연어 심층 이해, 자연어 질의응답(Question Answering) 기술에 관심을 갖고 연구 중이다.


하워드 가드너(하버드대 심리학과 교수)에 의하면 인간은 언어지능, 공간지능, 논리수학지능, 신체운동지능, 음악지능, 자연탐구지능, 자기이해지능, 대인관계지능의 다중지능을 갖고 있다고 주장했다.

다중지능 이론은 인간의 지능이 IQ 및 EQ와 같은 단순한 지적능력이 아닌 여러 가지 다양한 지능으로 구성돼 상호 협력한다는 지능이론이다. 인간은 더 나아가 마음, 창조성, 윤리, 경험, 사회성 등의 고급인지 능력을 갖추고 있다고 한다.

아직까지 인간의 지능을 정확하게 분석하지 못한 상황에서 기계가 인간의 지능을 뛰어넘는 시점에 대해 전망하는 것은 잘못된 예측이라는 의견 또한 적지 않다.

그러나 인간의 다중지능을 뛰어넘는 슈퍼지능머신 대신에 특정 영역의 지능을 특화해 인간의 의사결정을 보조할 수 있는 스마트 머신의 등장이 2018년부터 등장하기 시작해 2020년 이후에는 산업적인 경제적 가치를 창출할 것이라는 분석이 대세이다(Gartner, Tractica, Techcast 등).

인간의 언어지능과 관련된 인공지능 분야에서, IBM은 자연어 질의응답 시스템인 왓슨 슈퍼컴퓨터를 개발해 미국의 인기 퀴즈쇼인 Jeopardy!에서 2011년에 인간 챔피언 2명을 물리치고 우승했다.

구글은 유튜브 동영상을 1주일 간 학습해 고양이를 자동으로 인식하는 인간의 시각지능에 해당하는 구글 브레인 프로젝트의 결과를 2012년에 발표해, 딥 러닝 기술을 적용한 음성인식과 이미지인식 성능을 획기적으로 개선할 수 있는 전기를 마련했다.

인간의 학습지능과 관련된 기술로는, 미국 DARPA의 사용자의 경험으로부터 학습할 수 있는 인공지능 비서 개발을 위한 CALO 프로젝트(Cognitive Assistant that Learns and Organizes, 2003~2008)의 연구결과가 애플의 시리로 2011년에 상용화 된 사례가 있다.

최근 구글은 게임전략을 학습할 수 있는 심층강화학습 전문 기업인 딥마인드를 지난해에 인수해 다각적인 인공지능 기술 개발에 총력을 기울이고 있다.

뇌인지 컴퓨팅은 인간 두뇌의 생물학적 특징을 모델링해 인간의 사고 체계를 접근하는 기술로 뇌 모델링과 뇌를 모사하는 뉴로모픽 칩 등의 기술을 포함한다. IBM은 DARPA에서 주도하는 SyNAPSE 프로젝트를 통해 100억 뉴런을 가지는 인간 두뇌를 닮은 뉴로모픽 칩 개발을 목표로 연구 중이다.
 

▲ Tomorrow’s world A guide to the next 150 years(BBC, 2013)

▲ 인공지능 기술의 분야별 개발 사례


엑소브레인 SW

인간의 언어 지능은 표현하고자 하는 생각을 말과 글을 통해 효율적으로 의사소통하는 능력이며, 인간과 기계가 의사소통을 하기 위한 가장 원천적이며 중요한 지능이다. 현재 정보의 80%는 자연어로 기술된 비정형 텍스트 빅데이터이며, 텍스트 빅데이터에서 ‘누가 먼저 많은 가치를 추출해 내느냐’가 기업과 국가의 성패를 좌우하는 지식산업혁명 시대가 도래했다.

엑소브레인(Exobrain)은 내 몸 바깥에 있는 인공두뇌(外腦)라는 뜻으로, 기계가 자연어를 이해하고 지식을 학습해 생산하며 자연어로 기술된 질문에 대해 정답을 제공할 수 있는 자연어 질의응답(Natural Language Question Answering) 기술 개발을 목표로 한다.

인간과 기계와의 의사소통을 뛰어넘어 지식 소통이 가능한 인공지능 SW를 개발해 미래의 다양한 지식산업환경에서 전문가 수준의 질의응답 서비스를 통한 의사결정지원 서비스 제공을 목표로 한다.

 

▲ 엑소브레인 SW 개념


엑소브레인 SW 과제는 미래창조과학부 SW 분야의 그랜드챌린지 과제로 2013년에 시작돼 10년간 총 3단계에 걸쳐 수행될 예정이다. 최종목표는 자연어를 이해해 지식을 자가 학습하며, 전문직종에 취업 가능 수준의 인간과 기계의 지식소통이 가능한 지식과 지능이 진화하는 SW 개발이다.

1단계(2013.5 ~ 2017.2) 연구목표는 일반지식 대상 심층분석형 ‘엑소브레인 SW’ 원천기술 개발 및 산/학/연 연계 인공지능 생태계 조성이다. 2단계(2017.5 ~ 2020.2)에서는 다양한 지식산업환경에서 인간의 지식노동을 보조할 수 있는 스마트 어드바이저 개발 및 사업화 추진이다. 스마트 어드바이저란 다양한 전문분야(예: 의료/특허/법률/경영/세무 등)에서 전문가의 지적노동을 보조할 수 있는 대화형 조력자를 지칭한다.

마지막 3단계(2020.5 ~ 2023.2) 연구목표는 한국어에서 영어로 언어를 확장해 기업/공공 분야의 전문가의 의사결정에 필요한 글로벌 지식을 서비스할 수 있는 ‘인공두뇌(Thinking Machine)’ 개발을 통해 지식처리 신산업 창출을 목표로 하고 있다. 특히, 3단계에서는 콜센터의 로봇 상담사, 스마트카, 가상 아바타, 휴머노이드 로봇 등의 다양한 기기에 탑재되는 지능형 에이전트 등으로 산업 확산을 추진하고자 한다.

언어처리 인공지능 분야 세계 최고 기술선도를 위한 단계별 도전목표는 아래의 그림과 같다.
 

▲ 엑소브레인 SW의 추진단계


현재 추진 중인 1단계는 세부과제 간 연구협력을 통한 최종목표 달성을 추진하는 병렬형 과제로 추진되고 있다. 한국전자통신연구원이 총괄과제 및 1세부과제를 주관하며 자연어 이해, 지속적 언어지식 학습, 자연어 질의응답 기술을 개발하고 있다.

2세부과제는 솔트룩스가 주관기관으로, 지식생산을 통한 지식베이스 구축을 추진하고 있다. 3세부과제는 인간모사형 자가학습 원천기술을 KAIST가 연구 중이다. 4세부과제는 지식/기기의 협업을 위한 지능형 프레임워크 개발을 한국전자통신연구원이 추진 중이다.

 

▲ 엑소브레인 SW의 세부과제 구성


엑소브레인 SW의 도전기술은 크게 3가지로 나눌 수 있으며, 자연어의 어휘, 문법, 문맥의 의미를 이해하는 자연어 심층 이해 기술, 빅데이터로부터 끊임없이 새로운 지식을 학습하고 생산하는 기술, 자연어 질문에 대한 문제를 이해하고 정형/비정형 지식으로부터 정답을 추론하는 질의응답 기술이 핵심 기술이다.

 

▲ 엑소브레인 SW의 도전기술


▲ 자연어 심층 이해 기술


▲ 자연어 지식 학습 및 생산 기술


▲ 자연어 질의응답 기술


▲ 엑소브레인 인공지능 생태계 추진 전략


현재시점의 주요한 연구 성과로는 국내외 최고 수준의 자연어 이해기술을 개발해 19개 기관에 기술보급을 추진하고 있으며, 복합추론형 자연어 질의응답 기술을 개발해 퀴즈대회 우승자 수준으로 성능 개선을 추진 중이다.

또한, 총 1억 트리플(Triple)의 아시아 최대 규모 지식베이스를 구축해 확장을 추진 중이며, 국내 최대 규모의 한국어 어휘지도를 구축해 배포를 추진하고 있다. 또한 국내외 논문 게재 177건(SCI/E 30건 포함), IPR 확보를 위한 특허 출원 106건 및 국내외 표준기고서 18건을 제출했다.

특히, 2016년 초에 ITU-T에서 ‘Intelligent Question Answering Framework Service’를 국제표준 승인을 목표로 추진 중이다. 더불어 산/학/연 연대 과제 참여인력 300여명에 대한 인공지능 교육, 국내외 워크샵, 기술개발을 통한 인력양성 및 생태계 조성을 병행 중이다.

엑소브레인 SW 과제의 1단계 마지막 연도인 2016년 하반기에는 연구결과의 검증을 위해 ‘인간과 엑소브레인의 지식대결 콘테스트’를 추진할 예정이다. 이 콘테스트를 통해 산업계 수요를 반영한 2단계 추진계획을 수립하고 산업화를 촉진시키는 촉매제로 활용할 계획이다.

빅데이터 지식처리 인공지능의 개념은 빅데이터로부터 스스로 학습하고 지식을 축적하며 사용자와 의사소통을 하고 필요에 따라 자율 협업을 통해 지식의 공유 및 진화가 가능한 차세대 SW 기술을 의미한다.

빅데이터 지식처리 인공지능 SW는 첫째로 일반 지식, 전문 지식 등에 대한 분석/추론 및 심층 학습을 통해 전문가 수준의 문제 해결 및 의사 결정을 지원할 수 있어야 한다.

둘째로 인간 수준의 지식·지능 체계를 가지고 의사소통 및 자가 학습과 도메인 확장이 가능한 지식베이스를 스스로 구축하는 지능 진화형의 지식 생산 능력이 있어야 한다.

셋째로 다양한 기기에 탑재돼 분산된 이종 지식베이스 및 기기 간의 자율 협업을 기반으로 발현되는 협업 지능을 통해 새로운 문제를 스스로 사고하고 해결하는 기능을 가져야 한다.


글로벌 기술 개발 동향
IBM은 왓슨 슈퍼컴퓨터를 개발해 Jeopardy! 퀴즈쇼에서 우승한 이후, 2014년 1월에 왓슨을 핵심사업으로 선정하고 새로운 서비스와 솔루션을 만들기 위해 10억 달러(1조 원)를 투자해 ‘왓슨 글로벌 본부’를 실리콘 밸리에 개소하였다.

IBM은 왓슨을 산업화하기 위해 의료, 금융, 상담분야에 집중적인 투자를 하고 있으며, 왓슨 생태계 조성을 위한 클라우드 기반의 왓슨 API를 공개해 파트너사, 스타트업 등과의 협업을 통해 인지 컴퓨팅 앱을 개발하는 데 1억 달러를 투자하고 있다.

구글은 위키피디아 콘텐츠 위주 5억 개의 객체에 대한 지식 그래프(Knowledge Graph)를 구축해 인물, 지역, 사물 위주의 짧은 단답형 질문에 대한 정답을 제공하고 있다.

일본에서도 2021년 동경대학교 입학이 가능한 수준의 인공지능을 갖춘 토다이(Todai) 로봇 프로젝트를 국립정보학연구소(NII)와 후지쯔가 수행하고 있다. 최근에는 MS에서도 코타나와 Bing 검색엔진의 지식베이스로 활용되는 사토리(Satori) 지식베이스 기반으로 한 자연어 질의응답 기술 개발에 총력을 기울이고 있다.


▲ 자연어 질의응답 관련 글로벌 기술동향


인공지능 발전 전망: IT 역사에서 가장 혁신적 기술로 부각 될 것
Tractica는 전 세계 인공지능 시장이 2015년 2억 200만 달러에서 2024년 111억 달러(연평균 성장률 56.1%)로 전망하고 있다. 가트너는 2016년 이후의 전 세계 IT 업계 전망을 발표하는 심포지엄에서 2018년에 전 세계 300만 명 이상이 로봇 상사와 일하게 될 것이며, 또한 전체 업무용 문서의 20%를 기계가 작성하게 된다고 발표하였다.

아직 인공지능 기술 수준 및 관련 시장은 시장 도입기 단계에 있으나, 인간의 지식노동을 전문가 수준으로 보조할 수 있는 스마트 머신이 (Gartner, Techcast, McKinsey 등이) 2020년 이후에 IT 역사 상 가장 혁신적 기술로 활용돼 고부가가치의 인공지능 시장이 형성될 것으로 전망하는 데는 큰 이견이 없다.

과거 IT기술은 비용 절감의 도구로 많이 활용돼 노동력을 대체하는 모습을 보였으나, 인공지능의 발달이 고도화되는 미래에는 인간의 지적 노동을 더 효율적으로 보완해줄 수 있는 방향으로 활용하기 위한 노력이 필요하다.


▲ 인공지능 기술의 미래 발전 전망


맺음말
인공지능 기반의 지식 처리 플랫폼은 빅데이터와 접목이 되면서 국가 및 기업의 미래 경쟁력을 좌우할 기술로 대두되고 있다. IDC에 따르면 10년 후에는 지금보다 약 50배 가량의 데이터 폭증이 예상되며 이에 따른 데이터의 심층 이해 기술이 필수적이다.

현재는 창출되는 데이터의 약 5% 정도만 지식화 되고 있어 학습하고 판단하며 인간과 기계의 지식 소통이 가능한 빅데이터 지식처리 인공지능 SW를 통해 전문가 수준의 지식 생산 및 공유가 국가의 미래 산업 경쟁력 확보의 최우선 과제로 전망되고 있다.

미국, 일본, 유럽은 물론 국내에서도 국가 차원의 대규모 프로젝트가 추진 중이며, 빅데이터 지식처리 인공지능 SW의 관련 기술이 상용화 수준으로 개발이 된다면 국가 소프트웨어 산업의 미래 경쟁력 확보로 인해 전통산업, 과학 및 교육 분야 등에 고성능 인공지능의 적용이 가능해져 전통산업 ICT화가 가속화 될 것이다.

또한 기업 및 공공 분야의 경영자, 전문가 의사결정 지원, 사회현상 분석과 예측 등의 지식경제 시대의 국가 핵심 소프트웨어 플랫폼으로 활용이 가능해 질 것이다.

엑소브레인 SW의 자연어 질의응답 기술은 인공지능 분야의 제일 어려운 난제이나, 성공 시 매우 수익성이 높은 SW분야의 미개척 분야이다. ETRI는 국가 SW 경쟁력 확보를 위해 엑소브레인 과제를 성공적으로 수행해 高위험, 高비용, 高난이도 차세대 인공지능 SW의 핵심 원천기술 확보하고자 한다.
 

▲ 엑소브레인 미래산업 활용


이를 통해, 전문가 수준의 지식을 제공하는 지능형 의사결정 지원 SW, 스마트 기기 및 휴머노이드 로봇 등에 탑재돼 지식서비스를 제공하는 스마트 컨설턴트, 지식 및 지능처리 新산업 창출, 글로벌 시장 진출 등을 통해 국가 SW산업의 미래 경쟁력을 확보하고자 추진 중이다.

저작권자 © 아이티데일리 무단전재 및 재배포 금지