본지, 20일 서울 양재동 엘타워서 ‘2025 데이터 컨퍼런스’ 개최
[아이티데일리] 생성형 인공지능(Generative AI)은 이제 유행을 넘어 비즈니스의 중심으로 자리매김하고 있다. 오픈AI의 ‘챗GPT’가 촉발한 변화는 자율적 업무 수행이 가능한 ‘AI 에이전트’로까지 이어졌다. 이제 화두는 AI를 얼마나 잘 활용할 수 있는가다.
생성형 AI가 이룩한 혁신, 그 배경에는 데이터가 자리한다. 수집, 저장, 통합, 관리 등 데이터 활용 전 과정이 뒷받침돼야 뛰어난 성능을 갖춘 AI 모델을 개발할 수 있다. AI 기술 발전과 함께 데이터의 중요성이 높아지고 있는 이유다.
이러한 변화 속 본지(컴퓨터월드/IT DAILY)는 5월 21일 서울 서초구 양재동 엘타워에서 “AI를 이용한 데이터 활용 방안”을 주제로 ‘2025 데이터 컨퍼런스’를 개최했다. 행사는 AI로 고도화된 환경에 걸맞은 데이터 운영 전략과 생성형 AI와 관련한 주요 이슈에 대한 인사이트를 찾고, 관련 솔루션의 시연까지 경험해 볼 수 있는 자리로 마련됐다.
“규칙에서 학습으로: 이상치 탐지의 새 패러다임”
먼저 키노트를 맡은 고려대학교 산업경영공학과 김성범 교수(한국데이터마이닝학회 회장)가 ‘규칙에서 학습으로: 이상치 탐지 새로운 패러다임’을 주제로 연단에 올라 행사의 포문을 열었다. 이상치 데이터는 정상과 다른 새로운 패턴이나 예외가 존재하는 데이터를 뜻한다. 이상치 탐지는 스팸 메일 필터링, 센서를 통한 중장비 이상 감지 등 다양한 산업 분야에서 쓰이고 있다.
이상치를 탐지하는 방법은 크게 △규칙 △밀도 △모델 △재구축 등 네 가지가 있다. 규칙은 전문가가 경험을 토대로 기준을 세우는 방식이며, 밀도는 데이터를 정규분포로 정리한 뒤 정상과 이상을 구분하는 방식이다.
김성범 교수는 “규칙 기반은 데이터 없이도 단순한 예측이 가능하며, 밀도 기반은 전문 지식 없이도 이상 유무를 쉽게 파악할 수 있다는 장점이 있다”고 설명했다.
규칙과 밀도는 전통적 이상치 탐지에 쓰였다. 모델 기반 방법론은 여기서 한 단계 더 나아간 알고리즘이다. 이는 정상 데이터로 학습한 머신러닝 모델을 기반으로 객체별 정상·이상 여부를 판단하는 방법론이다. 선, 원 등으로 정상 데이터의 영역을 구분한 뒤 이를 바탕으로 수식을 세우고 이상치를 탐지한다.
최근에 많이 쓰이는 방법은 ‘재구축 기반’이다. 재구축 기반 모델은 정상 데이터를 압축해 특정 데이터를 추출하고, 이를 다시 정상 형태로 복원하는 학습 과정을 거친다. 그 후 데이터를 투입하고 복원한 결과가 정상 데이터와 얼마나 일치하는지를 기준으로 오차를 계산하며, 이 오차가 클 경우 이상치로 분류한다.
재구축 기반의 대표적 예로 ‘오토인코더(Autoencoder)’가 있다. 오토인코더는 입력 데이터의 특성을 요약하는 인코더(Encoder)와 요약 정보를 복원하는 디코더로 구성된다. 여기서 입력 데이터와 복원 데이터 간 차이를 토대로 이상치를 찾아낼 수 있다. 오토인코더뿐 아니라 생성형 AI의 기반을 이룬 ‘트랜스포머’와 이미지 생성 모델에 쓰이는 GAN 등도 재구축 기반 모델에 해당한다.
김성범 교수는 “AI 하면 흔히들 챗GPT를 떠올린다. 하지만 이는 AI의 한 종류일 뿐이며 데이터 예측·분석에 강점을 갖춘 여러 머신러닝 모델이 있다”며 “많은 AI 가운데 본인이 필요한 것을 찾고, 이를 통해 업무 효율을 높이기 위한 노력을 지속해야 변화하는 시대에 뒤처지지 않을 수 있다”고 강조했다.
“AI 시대, 개발자의 길을 찾다!”
다음으로 비아이매트릭스 배영근 대표가 ‘AI 시대, 개발자의 길을 찾다!’를 주제로 메인 세션 첫 발표를 했다.
배 대표는 개발자로서 30년여간 고민한 개발 방법론과 AUD 플랫폼 등 자사 솔루션을 활용한 업무 효율화 방안을 소개했다.
개발 프로젝트는 현업의 불명확한 요구 사항, 잦은 변경 요청으로 여러 시행착오를 겪는다. 이 때문에 만족스런 결과물을 거두지 못할 뿐 아니라 비용과 시간도 많이 소모하게 된다. 현재 기업과 기관에서는 요구명세서로 현업과 개발 조직이 원활한 소통이 가능하도록 돕고 있다.
배 대표는 여기서 한 단계 나아가 ‘빨리빨리 개발방법론(PPDM)’을 제안했다. PPDM은 분석과 설계를 없애고 요구 사항을 직접 개발하는 방법을 뜻한다.
배 대표는 “PPDM을 토대로 화면·기능 설계 과정에서 현업이 원하는 내용을 담은 엑셀을 HTML, 자바(JAVA)로 변환하는 ‘AUD 플랫폼’을 개발했다”며 “AUD 플랫폼으로 소통 과정에서 빚어지는 마찰은 줄임으로써 개발자는 다른 업무에 더 여력을 쏟을 수 있다”고 설명했다.
프로젝트 개발 과정에서 여러 프로그램이 쓰이며 이로 인한 비효율화 문제도 대두됐다. 이를 해결하고자 비아이매트릭스에서는 AUD 플랫폼이 코딩 없이 개발이 가능한 솔루션을 탑재, 개발에 드는 공수를 절감했다.
비즈니스에 AI를 어떻게 도입하는가 또한 기업이 고민하는 문제다. 범용적인 AI 서비스는 기업 내 업무를 수행하는 데 약점을 드러낸다. 이에 비아이매트릭스는 AI 모델에 내부 데이터베이스(DB)와 도메인 전문 용어를 학습시킴으로써 특화된 업무 수행이 가능토록 구현했다. 이를 통해 자연어 입력만으로도 데이터를 바탕으로 보고서 초안을 만들거나 차트, 표로 재구성한 화면을 생성할 수 있다.
나아가 비아이매트릭스는 올 하반기 중으로 개발도구와 AI를 결합해 코딩 작업을 자동화하고 이미지 시안을 실제 분석 인터페이스로 전환하는 기능 등을 공개할 계획이다.
배영근 대표는 “비아이매트릭스는 로우코드(Low-code), 노코드(No-code)를 아우르는 플랫폼으로 AI 시대에 걸맞은 업무 환경 고도화를 지원하겠다”고 밝혔다.
“AI 전환의 숨은 장애물, 데이터 사일로를 해결하는 방법”
두 번째 메인 세션 발표를 맡은 퀘스트소프트웨어코리아(이하 퀘스트)의 유광일 부장은 ‘AI 전환의 숨은 장애물, 데이터 사일로를 해결하는 방법’을 주제로 발표했다.
AI가 사람처럼 학습, 판단하기 위해선 방대한 데이터가 필요하다. 그런데 기업들은 많은 데이터를 보유하고 있음에도 AI 전환을 어려워하고 있다.
이는 데이터가 각기 다른 시스템에 저장된 데다 접근이 어렵고 통합되지 않는 ‘사일로(Silo)’ 문제를 겪고 있기 때문이다. 실제로 기업에서 전사적자원관리(ERP), 고객관계관리(CRM) 등 여러 솔루션을 사용 중인데, 이들 간 연계가 이뤄지지 않은 탓에 전체 상황 파악이 불가해 고객 불만과 컴플레인으로 연결되기도 한다.
데이터 사일로를 해결하기 방안으로 퀘스트에서는 쉐어플렉스(SharePlex)를 제안했다. 쉐어플레스는 실시간으로 데이터를 복제하고 통합할 수 있는 솔루션이다. 기존에 데이터를 처리하던 ‘배치(BATCH)’ 방식과 달리 원본 데이터베이스(DB)에 변경 사항이 생길 때마다 이를 즉각 타깃 DB에 반영하는 일이 가능하다. 데이터를 최신 상태로 유지하기에 비즈니스에서 실시간 의사결정을 하는 환경을 마련할 수 있다.
유광일 부장은 “쉐어플렉스는 국내 금융권에서 오랜 기간 안정적으로 운영되며 성능과 신뢰성을 검증받은 제품”이라면서 “온프레미스와 클라우드를 모두 지원해 마이그레이션, 하이브리드 환경 구축에도 활용할 수 있고, 복제 외에 빅데이터 분석을 위한 데이터 스트리밍, GUI 기반 모니터링까지 기본 기능으로 제공한다”고 설명했다.
퀘스트는 완성도 높은 복제를 위해 데이터 무결성을 보장하는 기술도 구현했다. 이를 통해 전통적 방식에서 발생하는 서비스 중단이나 검증 과정에서 다운타임을 개선한 마이그레이션이 구현됐다. 특히 기업이 데이터 중요도, 시스템 리소스에 따라 적절한 방법을 선택할 수 있도록 로우(Row), 칼럼(Column) 등 단위별 복제 기능을 제공한다.
유광일 부장은 “AI가 발전할수록 실시간성과 정합성을 갖춘 데이터 통합은 더욱 중요해질 것”이라며 “쉐어플렉스는 통합 데이터 플랫폼으로서 AI 전환에 적합한 기능과 성능을 제공한다”고 강조했다.
“AI 거버넌스를 위한 통합 컨트롤 타워, ‘AI 워크벤치’”
이어 세 번째 메인 세션 발표를 위해 연단에 오른 지티원 어호경 전무는 ‘AI 거버넌스를 위한 통합 컨트롤 타워 – AI 워크벤치’를 주제로 발표했다.
AI가 발전함에 따라 리스크 관리가 중요 문제로 떠오르고 있다. 산출물에 대한 윤리적 문제를 해소하고, 데이터 보안 및 개인정보 침해에 대응하기 위해 정부, 기관 차원에서 기준을 제시하고 있다. 최근 유럽연합(EU)에서는 AI법(AI Act)를 만들었으며 우리나라에서도 AI기본법을 제정한 바 있다.
새로운 AI 관련 법과 규제는 관리 감독 인력 확보, 조치 사항 문서화 등을 규정하고 있다. 이에 따라 기업에서도 AI를 책임감 있게 사용하기 위한 거버넌스의 필요성이 주목받고 있다. 하지만 거버넌스 수립에 필요한 표준화된 프로세스와 산출물 관리 체계가 부재한 실정이다.
지티원에서는 AI 거버넌스 체계 수립 지원을 진단부터 실제 적용까지 올인원으로 제공하고 있다. 우선 금융위원회, 과학기술정보통신부 등 정부 부처, 금융 당국에서 제시한 가이드라인을 분석해 총 4개 영역, 45개 항목으로 사전 진단 체크리스트를 만들었다. 기업은 이를 토대로 4~6주간 현재 거버넌스 운영 수준을 점검할 수 있다.
거버넌스 수립 과정에 참고할 만한 레퍼런스 모델도 지원한다. 레퍼런스 모델은 표준 프로세스, 산출물 구성 항목, 책임감 있는 AI(RAI) 지표 등으로 구성된다. 기업에서는 레퍼런스 모델과 현 시스템을 비교하며 개발 단계에서 검증 사항을 확인하고 절차에 따른 과정 전반을 한눈에 파악할 수 있다.
지티원은 AI 거버넌스를 기업 시스템에 빠르게 적용할 수 있도록 ‘AI 워크벤치’를 만들었다. 이 솔루션은 컴플라이언스 준수, 프로세스 표준화를 위한 진단 항목을 ‘지식 통합팩’ 형태로 제공한다. 또 전체 워크플로와 통합돼 업무 수행 과정에서 전체 진행 상황이 거버넌스와 일치하는지 파악할 수 있다. 지티원에서는 규제 변화에 따른 대응이 가능토록 프로세스, 체크리스트도 지속적으로 업데이트하고 있다.
지티원 어호경 전무는 “여러 가이드라인, 규제를 파악하고 이에 맞는 체계를 만드는 데 많은 시간이 소요된다”며 “지티원은 AI 워크벤치를 중심으로 시스템 진단, 표준 체계 수립, 산출물 관리 등 거버넌스 운영에 필요한 모든 요소를 올인원(All-in-One) 서비스로 제공한다”고 강조했다.
“AI·데이터 혁신의 게임체인저, 스노우플레이크”
오전 마지막 메인 세션으로는 스노우플레이크 조동규 상무가 ‘AI, 데이터 혁신의 게임체인저, 스노우플레이크로 비즈니스를 가속화하다’를 주제로 발표했다.
조 상무는 AI를 효과적으로 도입하기 위한 선결 과제로 ‘문제 정의’를 강조했다. 단순히 최신 기술을 도입하는 것이 아니라 비즈니스 관점에서 AI가 해결해야 할 과제를 분명히 하고, 그에 맞는 체계적 접근이 필요하다는 분석이다.
조 상무는 AI 기반 혁신의 핵심 요소로 △사람(AI를 이해하고 활용할 인력) △솔루션(적절한 AI 기술) △데이터(문제 해결을 위한 정확한 데이터) 등 세 가지를 꼽았다. 그는 “많은 기업이 인력이나 솔루션 확보에는 집중하지만 정작 ‘데이터’를 간과하는 경우가 많다”며 “AI는 결국 데이터에 기반하기에 제대로 된 데이터 없이는 아무리 뛰어난 알고리즘도 무의미하다”고 지적했다.
AI에 필요한 데이터의 기준도 언급했다. 첫째는 ‘볼륨(양)’이다. 기업 내부에 AI 학습을 위한 데이터가 절대적으로 부족한 경우가 많다. 둘째는 ‘품질’이다. 오래된 데이터가 많더라도 정확성과 일관성이 떨어지면 활용도가 낮다. 셋째는 ‘정합성’이다. 부서 간 데이터가 연결되지 않아 하나의 흐름으로 분석할 수 없는 경우가 빈번하다는 것이다.
이러한 데이터 문제는 ‘데이터 사일로’로 이어지며 기업 전반의 AI 전략 실행에 걸림돌이 된다. 스노우플레이크는 이를 해소하기 위해 다양한 기업 데이터셋을 공유·거래할 수 있는 ‘스노우플레이크 마켓플레이스’를 운영 중이다.
조동규 상무는 “외부 고품질 데이터를 마켓플레이스에서 안전하게 확보해 기업의 데이터 역량을 보완할 수 있다”며 “이런 구조가 AI 기반 비즈니스 혁신의 기반이 될 것”이라고 강조했다.
AI 기반 데이터 활용 방안 공유
점심시간 이후 이어지는 오후 세션은 트랙 1과 2로 나뉘어 진행됐다. 트랙 1에서는 △엔코아 김기동 팀장의 ‘기업 데이터 활용의 극대화, AI 에이전트 연결로 여는 스마트 워크 전략’ △핸디소프트 신기술연구소장 윤상집 상무의 ‘데이터와 업무의 AI 융합 시너지 솔루션’ 등의 세션이 이어졌다.
트랙 2에서는 ▲데이타솔루션 빅데이터러닝센터 정성원 센터장의 ‘IBM SPSS 스태티스틱스(Statistics)와 생성형 AI의 결합’ ▲데이터벅스 송정욱 이사의 ‘자연어 검색을 위한 CDC와 실시간 벡터 임베드(Vector Embed)’ 등의 세션이 마련됐다.
이후 다시금 트랙을 통합해 마지막 메인 세션이 진행됐다. EDB코리아 김희배 지사장이 ‘오픈소스DBMS를 활용한 디지털 현대화’를 주제로 연단에 올랐다.
이번 2025 데이터 컨퍼런스의 오후 세션에서 발표된 상세 내용은 컴퓨터월드 6월호에서 확인할 수 있다.


