[2025 데이터 컨퍼런스 ⑧] “IBM SPSS 스태티스틱스와 생성형 AI의 결합”
데이타솔루션 빅데이터러닝센터 정성원 센터장
[아이티데일리] 생성형 인공지능(Generative AI)은 이제 유행을 넘어 비즈니스의 중심으로 자리매김하고 있다. 오픈AI의 ‘챗GPT(ChatGPT)’가 촉발한 변화는 자율적 업무 수행이 가능한 ‘AI 에이전트’로까지 이어졌다. 이제 화두는 AI를 얼마나 잘 활용할 수 있는가다.
생성형 AI가 이룩한 혁신, 그 중심에는 데이터가 자리하고 있다. 수집, 저장, 통합, 관리 등 데이터 활용 전 과정이 뒷받침돼야 뛰어난 성능을 갖춘 AI 모델을 개발할 수 있다. AI 기술 발전과 함께 데이터의 중요성이 높아지고 있는 이유다.
이러한 변화 속에서 본지(컴퓨터월드/IT DAILY)는 지난달 21일 서울 서초구 양재동 엘타워에서 “AI를 이용한 데이터 활용 방안”을 주제로 ‘2025 데이터 컨퍼런스’를 개최했다. 행사는 AI로 고도화된 환경에 걸맞은 데이터 운영 전략과 생성형 AI와 관련한 주요 이슈에 대한 인사이트를 찾고, 관련 솔루션의 시연까지 경험해 볼 수 있는 자리로 마련됐다.
트랙 2에서는 ▲데이타솔루션 빅데이터러닝센터 정성원 센터장의 ‘IBM SPSS 스태티스틱스(Statistics)와 생성형 AI의 결합’ ▲데이터벅스 송정욱 이사의 ‘자연어 검색을 위한 CDC와 실시간 벡터 임베드(Vector Embed)’ 등의 세션이 마련됐다.
트랙 2 첫 발표를 맡은 데이타솔루션 빅데이터러닝센터 정성원 센터장은 ‘IBM SPSS 스태티스틱스와 생성형 AI의 결합’을 주제로 통계 분석에 생성형 AI가 적합한 이유를 소개했다.
먼저 정성원 센터장은 통계 분석 분야에서 생성형 AI가 갖는 장점을 강조했다. 생성형 AI 중 널리 알려진 LLM은 수많은 정보를 토대로 구성된 기초적 모델이다. 특정 목표에 맞게 개발된 형태가 아니기에 학습 과정에서 충분한 양의 데이터가 구성된 분야와 그렇지 않은 분야 간 전문성의 차이가 나타난다. 그렇기에 데이터 수집이 수월한 영역이라면 더 강력한 성능을 보여줄 수 있다는 게 정 센터장의 의견이다.
정 센터장은 “데이터 수집 측면에서 통계 분석은 생성형 AI가 잘할 수 있는 일이다. 인터넷에 통계 분석과 관련한 정보는 비교적 많다. 정보를 유료화하는 경향을 띠는 외국과 달리 우리나라는 블로그나 사이트를 통해 개인이 분석한 결과를 공유하는 경우가 잦아 충분한 학습 데이터를 확보할 수 있다”고 설명했다.
통계 분석과 생성형 AI 간 결합을 위해 데이터솔루션은 ‘코리아플러스 스태티스틱스 AI 코치(KoreaPlus Statistics AI Coach)’를 6월 중 출시할 예정이다. 코리아플러스 스태티스틱스는 IBM의 통계 분석 솔루션 ‘SPSS’에 데이터솔루션의 ‘밸류 애드 컴포넌트(Value Add Component)’와 서비스를 추가한 플랫폼이다. 이에 수행한 결과를 생성형 AI로 분석하는 모듈인 AI 코치를 접목한다는 계획이다.
정성원 센터장은 “사용자는 AI 코치를 통해 통계에 쉽게 접근할 수 있고, 결과에 대한 추가적인 질문으로 관련 답변을 제공받아 통계 분석의 품질을 향상할 수 있을 것”이라고 말했다.