AI 개발에 필요한 데이터 분석·후처리 지원

[아이티데일리] 미소정보기술(대표 안동욱)은 의료 및 산업 분야 거대언어모델(LLM) 구축 시 양질의 빅데이터 확보에 필요한 비(非)라벨링 데이터 표준화 솔루션 ‘데이터스캔(Data Scan)’을 출시한다고 15일 밝혔다.

‘데이터스캔’은 사람의 손으로 가공된 라벨링 데이터(지도학습)가 아닌 챗GPT 등 초거대 인공지능(AI) 개발에 양질의 빅데이터를 확보할 수 있는 비라벨링 데이터 표준화 솔루션이다.

미소정보기술이 비라벨링 데이터 표준화 솔루션 ‘데이터스캔’을 출시했다.
미소정보기술이 비라벨링 데이터 표준화 솔루션 ‘데이터스캔’을 출시했다.

초거대 AI 사전학습에 필요한 빅데이터 구축(텍스트)을 위해 데이터 등록부터 분류체계, 단어사전 구축 통한 자연어 처리 및 분류분석, 텍스트분석, 산업별 적용 도메인에 따른 데이터 후처리 등을 실시간 분석한다.

또한 기업·공공기관의 내부 문서 보안이 강화된 패브릭 기반 멀티모달 데이터 플랫폼 ‘스마트빅(smart BIG)’을 통해 LLM 구축 시 고도화된 언어처리 기술을 원스톱으로 제공한다.

미소정보기술 측은 ‘데이터스캔’이 의료, 금융, 법률 등 다양한 분야에 활용 가능할 것으로 기대했다.

미소정보기술 안동욱 대표는 “양질의 데이터는 AI 경쟁력의 핵심이다. ‘데이터스캔은’ 의료, 산업 데이터분석 및 멀티모달 데이터 플랫폼으로, 기업의 경쟁력을 지원하는 데이터 인에이블러(Data Enabler) 역할을 담당할 것”이라고 말했다.

저작권자 © 아이티데일리 무단전재 및 재배포 금지