데이타벅스 조외현 대표 컨설턴트

[아이티데일리] 전 산업계의 핵심 동력이 데이터를 중심으로 재편되고 있다. 특히 챗GPT(ChatGPT)의 등장 이후, 데이터 학습의 결정체인 생성형 AI가 전 세계의 뜨거운 감자로 부상했다. 수많은 데이터를 학습하고 이를 토대로 결과물을 생성하는 생성형 AI를 구현하기 위해 데이터의 수집부터 저장, 학습, 거버넌스 정립 등 제반을 다지는 작업이 더욱 중요한 과제로 떠올랐다.

본지(컴퓨터월드/아이티데일리)는 지난달 7일 서울 양재동 엘타워에서 각계 데이터 전문가 및 국내 대표 기업들과 함께 생성형 AI를 둘러싼 주요 이슈에 관한 해답과 데이터 활용 전략을 제시해 보고자 ‘생성형 AI & 빅데이터’를 주제로 ‘제20회 2023 데이터 컨퍼런스’를 개최했다. 데이터 인사이트와 핵심 전략이 공유된 이번 컨퍼런스 내용을 정리했다.

 

“생성형 AI와 온라인 머신러닝: CDC 및 지능형 통합의 필요성”

데이타벅스 조외현 대표 컨설턴트
데이타벅스 조외현 대표 컨설턴트

트랙2 세 번째 세션은 ‘생성형 AI와 온라인 머신러닝: CDC 및 지능형 통합의 필요성’을 주제로 데이타벅스 조외현 대표 컨설턴트가 발표를 맡았다.

조외현 컨설턴트는 “온라인 ML이란 일괄 학습을 거치며 일회적이고 간헐적으로 작업이 일어나는 기존 모델과 달리 실시간으로 적응형 학습을 수행, 풍부한 데이터로 정확한 예측을 제공하는 기술을 의미한다”며 “적응성, 확장성, 그리고 실시간 예측 등의 장점으로 빠르고 비용 효율적인 의사결정에 기여한다”고 설명했다.

온라인 ML은 실시간성을 갖춘 만큼 빠르게 변화하는 날씨, 금융 등 분야의 애플리케이션에 유용하다. 또한 방대한 양의 데이터를 학습하는 것뿐 아니라 변화에 대응할 필요가 있는 생성형 AI에서도 사용 가능하다. 생성형 AI에 새로운 데이터가 채워지지 않는다면 과거 정보를 기반으로 올바르지 못한 대답을 내놓을 수 있기 때문이다.

온라인 ML 구현은 여러 솔루션이 함께 어우러져야 가능하다. 데이타벅스가 총판을 맡고 있는 ‘스트림(Striim)’은 CDC(변경 데이터 캡처) 솔루션으로 실시간 데이터 변화를 반영해 자연어 기반 생성형 AI 검색을 강화하는 역할을 맡는다.

조외현 컨설턴트는 “스트림은 DB에서부터 슬랙, 젠데스크, 구글 스프레드시트 등 여러 애플리케이션에 이르는 다양한 데이터를 실시간으로 확보, 벡터 DB로 전환해 LLM 서비스에 적용하는 중간 연결고리 역할을 맡는다. 특히 기존에는 실시간 데이터 캡처를 통한 가공 및 정제가 어려웠으나 현재는 인메모리(In-Memory) 기반으로 해결할 수 있게 됐다”고 말했다.

관련기사

저작권자 © 아이티데일리 무단전재 및 재배포 금지