다차원 분석 활용해 학생 개인에 대한 맞춤형 교육 환경 제공
다양한 데이터 프로젝트 경험 갖춘 굿모닝아이텍 통해 ‘알터릭스’ 솔루션 도입

[아이티데일리] 오늘날 많은 기업들이 자사 고객들에 대한 맞춤형 서비스‧콘텐츠 제공에 열을 올리고 있다. 개개인의 취향을 분석해 그에 맞는 최적의 서비스를 제공함으로써 고객의 충성도를 높이고 이탈을 방지한다.

최근 이러한 고객 맞춤형 서비스를 학생들을 위한 교육과정 개선에 활용한 학교가 있어 화제다. 바로 삼육대학교다. 삼육대학교는 교내 활동이나 학업 성취도 등 학생들의 다양한 데이터들을 분석해 시각화할 수 있는 IR(Institutional Research) 정보시스템을 구축, 개개인에 대한 맞춤형 지도가 가능한 교육환경을 마련했다.

삼육대학교 정보전산실 전경

데이터 기반 혁신 이끄는 IR 정보시스템

삼육대학교는 1906년 제칠일안식일예수재림교회의 교육이상에 따라 평안남도 순안에서 시작된 의명학교가 효시다. 삼육대학교는 일제 강점기 신사참배 반대로 폐교의 위기를 맞기도 했으나 재개교해 근대교육의 역사와 함께한 민족사학이다. 국내 최초의 남녀공학 교육, 기숙사교육, 실업교육을 통해 조국 근대화를 이끌어온 인재를 양성하여 국가와 사회에 이바지했다. 지난 1949년에 현재 위치인 서울시 노원구(당시 경기도 양주)로 이전했고, 1961년에는 문교부 인가를 받아 정규 4년제 대학이 되면서 삼육신학대학으로 개칭했다. 삼육(三育)이라는 명칭에는 학생들의 지(智), 영(靈), 체(體)라는 세 가지 요소를 고르게 성장시키겠다는 목표를 담았다.

삼육대학교는 올해로 개교 116주년을 맞이했다. 현재 ‘SU-Glory 2030’ 발전전략을 통해 ‘미션(Mission), 비전(Vision), 열정(Passion)을 가진 창의적인 인재’라는 새로운 가치를 내세우며 ‘교육중심 MVP대학’을 표방한다. 이를 위해 단계적인 교육 커리큘럼의 혁신을 추진하고 적극적인 투자를 아끼지 않고 있다. 최근에는 학생들의 편리한 캠퍼스 생활과 효과적인 학습 환경을 지원하기 위해 ▲비교과 포인트 시스템 ‘SU-PAY’ ▲비교과 모바일 홍보시스템 ‘SU-ePR’ ▲돌봄경제 플랫폼 ‘SU-돌봄숍’ 등 다양한 IT 시스템을 구축하고 있다.

특히 삼육대학교는 우수한 인재를 양성하기 위해서는 교육과정과 학생들의 학습 수준을 정확하게 진단하고 개선점을 도출해 지속적인 교육의 혁신을 도모하는 프로세스가 필요하다고 판단했다. 그러나 지식이나 경험에 의존하는 기존의 방법으로는 사람의 선입견이나 편향이 들어갈 수 있고, 그동안 생각지 못했던 혁신적인 변화를 만들어내기 어렵다. 따라서 보다 정확하고 믿을 수 있는 데이터에 기반해 교육 수준을 높일 수 있는 차세대 정보시스템의 필요성이 대두됐다. 이에 삼육대학교는 교육부의 대학혁신지원사업을 통해 2019년부터 2021년까지 3년에 걸쳐 IR 정보시스템 구축에 나섰다.


데이터의 양과 질, 손쉬운 활용성까지 갖춰

새로운 IR 정보시스템에는 삼육대학교가 2010년부터 축적해온 방대한 데이터들이 활용됐다. 특히 기존에 운영 중인 다양한 시스템에서 생산된 데이터들을 다차원적으로 분석해 개선점을 도출하고 시뮬레이션을 수행할 필요가 있었다. 이러한 분석은 한 종류의 데이터만 가지고는 정확한 결과를 낼 수 없기 때문이다.

삼육대학교 IR 정보시스템의 주요 목표

가령 IR 정보시스템의 중요 역할 중 하나는 저학년(1~2학년)들의 자퇴나 편입 등 중도탈락을 예방하는 것이다. 이를 위해 기존에 축적된 데이터들을 분석해서 중도탈락한 학생들이 어떤 특징을 가지고 있는지 도출했다. 성적이 급격하게 떨어진 학생들은 자퇴할 가능성이 높게 나타났다. 하지만 성적을 높게 유지하는 경우에도 중도탈락하는 학생들이 있었다. 다른 학교로의 편입을 준비하는 경우였다. 이들은 대개 학점을 안정적으로 관리하면서 토익이나 토플 등에 집중하는 특징을 보였다. 성적이 안정적이면서 장학금이나 교내 활동 등에 관심이 많은 학생들은 중도탈락이 낮았다.

IR 정보시스템이 학생들 개개인을 정확히 분석하기 위해서는 데이터의 양과 다양성이 모두 갖춰져야 한다. 삼육대학교는 특정 학생이 어떤 입시 전형으로 입학했는지, 입학 당시 성적과 인적사항은 어땠는지, 전공과 학업 성취도는 어느 정도였는지, 휴학이나 복학 등 학적 변동은 어떻게 이뤄졌는지, 성적과 관계없는 교내 활동에는 얼마나 적극적으로 참여했는지 등 다양한 데이터들을 수집해 분석하고 패턴화했다. 이를 바탕으로 현재 재학 중인 학생들을 중도탈락 고위험군/저위험군/일반 등으로 분류하고 서로 다른 전략과 메리트를 제시하거나, 졸업을 앞둔 고학년들에게는 효과적인 취업 준비 전략과 지도 방안 등을 제공할 수 있게 됐다.

또한 IR 정보시스템은 IT 기술을 잘 모르는 부서들이 정보화조직에 대한 의존도를 낮추는 결과도 만들어냈다. 기존에는 각 부서들이 중요한 의사결정을 내리거나 정책을 수립하기 위한 데이터를 얻으려면 정보전산팀의 도움을 받아야 했다. 의사결정 과정에서 데이터의 중요성이 높아지면서 정보전산팀의 부담은 더욱 가중됐고, 각 부서에서는 원하는 데이터를 얻기 위해 많은 시간을 마냥 기다릴 수밖에 없었다. 각 업무 담당자와 직접 연락해 데이터를 요청할 수도 있겠으나 이는 데이터의 정합성과 일관성에서 문제가 생길 가능성이 있었다.

새롭게 구축한 IR 정보시스템을 활용하면 각 부서들이 직접 원하는 데이터를 손쉽게 가공하고 분석할 수 있다. 다양한 시스템에서 수집된 데이터들이 표준화 과정을 거쳐 IR 정보시스템에 연결돼 있으며, 이들은 정합성과 일관성 등을 갖추고 일정 이상의 품질이 확보돼있어 지난한 전처리 과정 없이도 즉시 활용 가능하다. 또한 비전문가도 드래그앤드롭(Drag&Drop)으로 필요한 데이터들을 통합하고 분석해 보고서 형태로 만들 수 있는 직관적인 UI가 갖춰져 있어 정보전산팀에 의존할 필요가 줄었다.


IT 전문성 마련과 데이터 준비 우선돼야

이번 IR 정보시스템 구축사업을 주도한 삼육대학교 정보전산팀의 조윤희 팀장은 “종종 다른 학교에서 우리의 IR 정보시스템을 벤치마킹하기 위해 찾아온다. 그들이 가장 많이 물어보는 것은 어떻게 정보화부서의 협력을 이끌어냈느냐 하는 점”이라고 말했다. 이어서 그는 “그런 문의를 하는 대학들의 경우 대부분 IR 정보시스템 구축을 주도하는 조직이 정보화 담당 부서가 아닌 경우였다. 이럴 경우 기대하는 시스템의 이상적인 목표와 현실의 벽이 생기기 쉽고, 정보화 부서 입장에서도 이를 위한 지원과 협력이 우선순위에서 밀릴 수 있다”고 덧붙였다.

반면 조윤희 팀장은 “삼육대학교는 데이터에 기반한 교육의 질 개선을 위해 IR센터가 설립됐고, 정보화부서인 정보전산팀이 IR 정보시스템의 청사진을 그리고 세부적인 추진 계획을 세우는데 적극적으로 참여하며 동기부여와 책임감이 뒤따랐기 때문에 성공적인 구축이 가능했다”고 설명했다. IR센터가 대학조직이 필요로 하는 정보를 찾고 IR 정보시스템 구축 및 운영을 위한 행정적인 지원과 지표분석을 꾸준히 진행하는 한편, IT 전문성을 가진 정보전산팀이 IR 정보시스템의 설계와 구축의 기술적인 부분을 주도했기에 실전성 높은 시스템이 완성됐다는 설명이다.

IR 정보시스템 구축에 앞서 데이터 관리 체계가 잘 정비돼 있었던 점도 유리하게 작용했다. 삼육대학교는 지난 2014년부터 데이터표준화 정책을 수립하고 DB아키텍처를 새롭게 모델링했다. 이후 개발자가 임의로 DB 스키마를 변경하거나 표준화 정책에 맞지 않는 모델을 올릴 수 없도록 하면서 철저한 관리 체계를 유지해왔다. 초창기에는 반발도 많았고 진통을 겪었지만 결과적으로는 데이터의 품질을 높이고 현행화가 유지돼서 우수한 환경을 갖출 수 있었다.

이렇게 잘 관리된 데이터가 있었기에 IR 정보시스템 구축 사업도 어려움 없이 진행될 수 있었다. 정보전산팀은 본격적인 사업에 들어가기에 앞서 기존에 축적된 데이터들의 품질을 재차 점검하고 정제 작업을 수행했다. 이를 통해 본 사업에서는 한층 더 데이터가 잘 정리돼있고 각 도메인에 맞는 값들이 정확히 들어가 있어서 수월한 사업 진행이 가능했다. 특히 시스템 구축 후에도 데이터 분석을 수행하려면 데이터 정제와 전처리 과정에 많은 시간과 역량이 소모되는데, 사전에 교통정리가 잘 돼있으면 분석에 드는 공수를 줄일 수 있었다.


손쉬운 데이터 준비와 학습 돕는 ‘알터릭스’

삼육대학교의 IR 정보시스템 구축사업은 3년에 걸쳐 진행됐으며, 마지막 3년차인 지난 2021년에는 머신러닝 기반의 빅데이터 분석과 예측 모델을 과제가 진행됐다. 이를 위해 삼육대학교는 다양한 데이터 프로젝트 및 머신러닝 모델 개발 경험을 갖춘 굿모닝아이텍을 통해 ‘알터릭스(Alteryx)’ 솔루션을 도입했다.

과거에는 분석을 위한 데이터 셋을 만들기 위해 일일이 DB에 쿼리를 날리거나 별도의 프로그램을 개발해야했다. 이는 매우 번거롭고 많은 시간을 필요로 하는 작업이며, 실제로 데이터 분석에 소요되는 시간보다 이렇게 데이터를 추출하고 준비하는 전처리 과정에 더 많은 시간이 소요됐다. 심지어 이렇게 만든 쿼리나 프로그램들은 IT 담당자가 임기응변으로 만들어 쓰는 경우가 많았고, 기껏 만든 것들도 담당자의 개인 PC에 저장돼 있어 체계적으로 관리되지 않았다.

알터릭스를 통해 최적의 알고리즘을 손쉽게 찾을 수 있다.

알터릭스는 이러한 데이터 전처리 과정을 시각화하고 간소화할 수 있도록 도와준다. 모든 전처리 프로세스가 시각화되어 어떤 데이터가 어떤 필터링 과정을 거쳤는지, 최종적으로 어떤 데이터셋으로 추출됐는지를 명료하게 확인할 수 있다. SQL 지식을 갖춘 전문가나 프로그래머가 아니더라도 직관적인 마우스 클릭과 드래그를 통해 전처리 프로세스를 확인하거나 수정할 수 있다. 알터릭스 솔루션을 통해 데이터 전처리 프로세스가 저장되기 때문에 중앙 관리 또한 가능하다.

오토ML(AutoML, Automated Machine Learning)을 통해 머신러닝 파이프라인에서 반복적인 모델링 작업을 자동화할 수 있다는 점도 장점이다. 최적의 모델을 찾기 위해서는 반복적인 시뮬레이션을 통해 특정 목적이나 데이터셋에 맞는 다양한 알고리즘을 테스트해야 하는데, 알터릭스에 적용된 오토ML은 사용자 대신 다양한 알고리즘들을 시뮬레이션 한 후 최적의 분석 방법을 제시한다. 삼육대학교는 학생들의 중도탈락을 사전에 탐지하고 예방하기 위한 모델을 만들기 위해 알터릭스 솔루션을 활용했으며, 이를 통해 학생 개개인의 성향과 데이터에 최적화된 분석 모델을 쉽고 빠르게 찾아 적용할 수 있었다.

“모든 데이터를 IR 정보시스템으로 집중해 활용성 높일 것”
삼육대학교 학술정보원 조윤희 정보전산팀장


Q. IR 정보시스템을 구축하며 가장 어려웠던 점은?

프로젝트 전에도 우리 정보전산팀에서는 데이터 마트, 데이터 웨어하우스 등을 구축하고 활용하는 부분에 대해 직간접적인 경험과 개념을 갖추고 있었다. 데이터를 수집하고 정제해 분석하고 보고서를 만드는 정도는 충분히 가능한 수준이었다. 그러나 새로운 IR 정보시스템에서 머신러닝을 도입해 빅데이터 분석을 하는 데에는 기존에 접해보지 못한 통계학, 수학적인 지식이 요구됐다. 우리에게는 미지의 영역이었기 때문에 프로젝트를 어떻게 운영하고 이끌어나갈지 많은 고민이 있었다.

이번 사업을 함께한 굿모닝아이텍의 컨설턴트들은 그동안 다양한 분야에서 머신러닝을 활용한 빅데이터 분석 경험과 노하우를 가지고 있었다. 다만 기업과 대학은 사정이 조금 다르다. 기업들은 지출을 줄이거나 매출을 늘리는 수익 모델에 대해서 비슷한 패턴의 분석을 요구하는 경우가 많지만, 국내 대학 중에서 빅데이터를 활용해 학생들의 성향을 분석하고 교육 여건을 개선하려는 시도는 우리 삼육대학교가 선도적이었다. 그래서 기존과는 조금 다른 예측 모델이 필요했고, 데이터를 이해하고 업무 방식을 공유하는 부분에 대해서 많은 부담이 있었다.

다행히 결과적으로 서로간의 소통이 잘 이뤄져서 프로젝트가 성공할 수 있었다. 프로젝트 진행 과정에서 굿모닝아이텍과 협력해가면서 새로운 예측 모델을 만들고 분석 환경을 설계했다. 국내외 사례와 논문들을 참고해가면서 새로운 예측모델을 시험하고, 다양한 요구사항에 맞춰서 시스템을 개선하고, 재미있는 데이터가 나오면 새롭게 반영해서 결과를 뽑아보는 일련의 과정이 상당히 흥미로운 경험이었다. 굿모닝아이텍 측에서도 잘 협력해줘서 교육 분야에서 선도적인 빅데이터 분석 사례를 남길 수 있었던 것 같다.


Q. 앞으로 추진할 정보화 프로젝트가 있다면?

삼육대학교는 새로운 시대의 인재를 키워내기 위해 제도나 규정들이 빠르게 바뀌고 있다. 그래서 앞으로 몇 년 간은 새로운 제도에 맞춰서 전반적인 차세대 정보시스템 구축사업을 추진할 계획이다. 대규모 차세대 프로젝트 같은 형식이 아니라 각 시스템 별로 작은 사업들을 만들어나갈 것이다.

새롭게 만들 차세대 정보시스템에서는 데이터의 중요성이 더욱 높아질 것이다. 따라서 단순히 사용자의 업무 효율을 높이기 위해 개선하는 수준을 넘어, 해당 시스템에서 효율적으로 데이터를 얻기 위한 시스템을 만들어나가려고 한다. 예를 들어 교원정보시스템을 보다 편리하게 관리할 수 있도록 개선하면서 동시에 IR 정보시스템에 데이터를 넘겨줄 수 있는 프로세스를 추가하는 식이다. 산재된 시스템들에서 수집되는 모든 데이터가 IR 정보시스템으로 모일 수 있도록 만들어 데이터의 관리를 편리하게 하고 활용성을 높이려고 한다.

또한 재직 중인 임직원들을 대상으로 IR 정보시스템에 대한 교육을 제공할 것이다. 정보전산팀을 거치지 않고 원하는 데이터를 찾거나 분석하는 방법을 안내한다면 각 부서들의 업무 효율이 높아질 것으로 기대된다. 가능하다면 임직원들이 이수해야 하는 직무교육에도 포함시키고자 한다.

저작권자 © 아이티데일리 무단전재 및 재배포 금지