주요 산업별 오픈데이터, 통계 지표 및 소셜 빅데이터, 다국어 언어자원 등 약 80억 건
솔트룩스는 인공지능 원천기술 개발을 위해 20년간 데이터를 자체 구축하고 외부 지식을 수집, 정제하기 위해 많은 노력을 기울여왔다. 이를 통해 주요 산업별 오픈데이터와 통계 지표 및 소셜 빅데이터, 다국어 언어자원 등 80억 건 이상의 정제된 빅데이터를 확보하고 있으며, 초대규모 데이터 클라우드인 빅오(BigO)를 통해 전 세계로부터 매일 5백만 건 이상의 데이터를 수집, 실시간 분석을 수행하고 있다.
이번에 개방되는 데이터는 오픈 데이터와 소셜 데이터뿐 아니라 방대한 언어자원과 지식베이스를 포함한 아시아 최대 규모가 될 예정이다. 솔트룩스는 이를 통해 여러 전문기업과의 파트너십을 채결하고, 세계 시장에서의 공통 경쟁력을 조기 확보한다는 전략이다.
국내 데이터 축적과 공유/활용 수준은 매우 미미하다. 언어지능 구현에 필수적인 위키백과 기준으로 보면 우리나라는 전 세계 국가 중 27위 수준으로 베트남(7위), 중국(9위)보다 낮고 세르비아 수준의 대단히 낙후된 상황이다.
이경일 솔트룩스 대표는 “이번 결정을 통해 더 늦기 전에 해외 선도기업과 경쟁할 수 있는 국내 인공지능 생태계가 마련될 수 있기를 기대한다”고 밝히며 “국내의 실력 있는 스타트업과 협력해 해외 진출 및 세계적 기업으로 도약하기 위한 교두보를 마련하고 미래 지능정보 사회 구현에 기여할 수 있도록 노력하겠다”고 포부를 밝혔다.
송요한 기자
hint05@itdaily.kr