AI 개발에 필요한 데이터 분석·후처리 지원
[아이티데일리] 미소정보기술(대표 안동욱)은 의료 및 산업 분야 거대언어모델(LLM) 구축 시 양질의 빅데이터 확보에 필요한 비(非)라벨링 데이터 표준화 솔루션 ‘데이터스캔(Data Scan)’을 출시한다고 15일 밝혔다.
‘데이터스캔’은 사람의 손으로 가공된 라벨링 데이터(지도학습)가 아닌 챗GPT 등 초거대 인공지능(AI) 개발에 양질의 빅데이터를 확보할 수 있는 비라벨링 데이터 표준화 솔루션이다.
초거대 AI 사전학습에 필요한 빅데이터 구축(텍스트)을 위해 데이터 등록부터 분류체계, 단어사전 구축 통한 자연어 처리 및 분류분석, 텍스트분석, 산업별 적용 도메인에 따른 데이터 후처리 등을 실시간 분석한다.
또한 기업·공공기관의 내부 문서 보안이 강화된 패브릭 기반 멀티모달 데이터 플랫폼 ‘스마트빅(smart BIG)’을 통해 LLM 구축 시 고도화된 언어처리 기술을 원스톱으로 제공한다.
미소정보기술 측은 ‘데이터스캔’이 의료, 금융, 법률 등 다양한 분야에 활용 가능할 것으로 기대했다.
미소정보기술 안동욱 대표는 “양질의 데이터는 AI 경쟁력의 핵심이다. ‘데이터스캔은’ 의료, 산업 데이터분석 및 멀티모달 데이터 플랫폼으로, 기업의 경쟁력을 지원하는 데이터 인에이블러(Data Enabler) 역할을 담당할 것”이라고 말했다.
김호준 기자
hojun@itdaily.kr