국립 한국방송통신대학교 이병래 교육정보화본부장

국립 한국방송통신대학교 이병래 교육정보화본부장
국립 한국방송통신대학교 이병래 교육정보화본부장

[아이티데일리] 교육 분야에도 예외 없이 인공지능(AI)과 빅데이터 분석 등의 ICT 신기술이 스며들고 있다. 이러한 ICT 신기술은 개인화된 교육 환경을 마련하거나, 학습자의 학업 성취도를 달성하기 위한 지원 시스템 등에 접목되고 있다.

최근 디지털 신기술 특히 인공지능과 빅데이터를 대학 교육 환경에 적용해 주목받는 성공 사례가 있다. 바로 한국방송통신대학교(총장 고성환)이다. 한국방송통신대학교는 AI와 빅데이터 등을 적용해 현재 대부분 대학이 고민하고 있는 학업 지속도를 높일 수 있는 맞춤형 교육 환경을 구현했다. 데이터를 토대로 인공지능(AI) 분석 시스템을 개발한 것이다. 해당 시스템은 학생 성향의 패턴을 분석해 학습자가 학업을 지속하도록 지원하며, 학내·외 데이터를 분석해 대학 행정 및 의사결정도 지원한다.

“학생들이 의욕을 잃지 않고 학업 목표를 달성할 수 있는 환경을 구현하는 데 힘쓰겠다”고 강조한 한국방송통신대학교 이병래 교육정보화본부장을 만나 시스템 구축 사업 과정과 특장점, 기대 효과 등을 들어봤다.

한국방송통신대학교 전경


빅데이터를 활용한 AI 학습분석 개발

1972년 개교한 한국방송통신대학교는 전 세계에서 두 번째로 생긴 국립 개방·원격 대학교다. 원격 대학교 중 최초이자 유일한 국립 대학으로 서울대학교의 부설 대학교로 개교했다. 1982년에는 국립 대학교로 분리‧독립했으며 현재 학사 학위에 이어, 석사 학위와 평생교육과정 등을 운영하고 있다.

한국방송통신대학교는 최근 디지털 기반 고등교육 혁신, 열린 교육 체계 고도화, 확장성 기반 원격고등교육 진흥, 브랜드 가치 혁신, 전략 추진 인프라 조성 등 5가지 발전전략을 수립해 빠르게 변화하는 4차 산업혁명에 대응하며 교육 디지털 혁신에 나서고 있다.

한국방송통신대학교는 특히 AI를 비롯해 다양한 정보기술을 기반으로 빠르게 변화하는 교육환경 패러다임에 대응하기 위해 ‘빅데이터를 활용한 AI 학습분석 개발 프로젝트(데이터허브시스템구축, 2차)’ 사업을 추진하고 있다. 한국방송통신대학교는 이 사업을 통해 데이터 허브 포털에서 데이터를 편리하게 활용해 데이터 분석 기반 행정업무 환경을 구현하고자 했다. 또한 AI 분석으로 성인 학습자들의 학습 행태를 파악해 학습자들이 학업을 지속할 수 있도록 다양한 서비스를 제공하고자 했다.

먼저 1차 프로젝트에서는 빅데이터 기반 AI 시스템을 위한 데이터 준비 작업이 진행됐다. 구체적으로 기존 통계정보를 사용자 친화적인 ‘데이터 허브 포털’로 전환·개발했고, 데이터를 정비하고 확대·개선했으며 솔루션을 고도화했다. 특히 전(全) 부서에서 쉽게 데이터를 요청하고 획득·가공할 수 있는 화면도 개발했다.

이어 지난해 11월부터 올해 5월 20일까지 진행된 2차 프로젝트에서는 구축된 데이터 허브를 기반으로 시스템을 구축했고, 패키지 솔루션들을 리뉴얼했다. 구체적으로 1차 사업에서 구축된 데이터를 활용해 학업 유지를 위한 예측 지표를 발굴했고, 발굴한 예측 지표를 기반으로 중도에 학업을 그만두지 않도록 다양한 학습자 맞춤형 서비스를 위한 AI 기반 일부 예측시스템을 개발했다. 또 이렇게 개발한 예측시스템을 기존에 구축돼있던 다양한 통계정보와 연계해 학습자 분석 시각화 화면을 개발했다.

한국방송통신대학교 이병래 교육정보화본부장은 “우리 대학은 특성상 다양한 직업과 다양한 연령층을 보유하고 있다. 학생의 성향별 패턴을 분석해 학업을 지속할 수 있는 요인을 찾아내고, 이를 토대로 대국민 평생학습 모델을 수립하고자 한다”면서 “이번 프로젝트의 핵심은 ‘AI 기반 학업지속 예측 시스템’과 ‘빅데이터 활용 사이트’ 개발이다. 여기에 활용되는 데이터 처리를 위해 별도의 데이터마트를 구성했고, 데이터허브 시스템에 저장된 데이터를 활용하되 데이터 부재 시에는 데이터 추출과 저장을 수행할 수 있는 환경도 마련했다. 이번 프로젝트로 데이터 기반 교육 정책 및 학습분석 지원서비스 체계를 만들었다”고 설명했다.

한국방송통신대학교의 이병래 교육정보화본부장과 빅데이터를 활용한 AI 학습분석 개발 사업과 관련된 대담을 일문일답으로 구성했다.

현재 컴퓨터과학과 교수로 재직하고 있는 이병래 본부장은 지난해 3월부터 교육정보화본부의 본부장직을 맡고 있다. 교육정보화본부는 데이터허브팀과 정보화기획팀, 정보화기반팀, 학사정보‧정보서비스팀 등 4개의 팀으로 구성돼 있다. 이 중 데이터허브팀을 보유한 국립대학은 한국방송통신대학교가 유일하다.

한국방송통신대학교 이병래 교육정보화본부장은 “새롭게 개발한 시스템을 운영하면서, 개선점과 예측도를 높일 수 있는 방향으로 고도화를 계획하고 있다. 이번에 개발한 시스템을 5~10년 사용한다는 생각보다 전교 여러 부서와 학과, 팀들에서 제안하는 기능들과 개선점을 반영하며 지속적으로 고도화할 예정이다”라고 강조했다.


“방송대 평생 고등교육 품질 향상 기대”

Q. 이번 사업의 추진 배경은 무엇인가.
A. 사업의 정확한 명칭은 빅데이터를 활용한 AI 학습분석 개발 사업이다. 사업을 추진하게 된 배경은 대학에서 빅데이터 활용 필요성이 늘었다는 점과 학업 성취도 유지·관리 중요성이 증가했다는 점 그리고 마지막으로 방송대 특수성을 반영한 데이터 분석이 필요하다는 점 등 크게 3가지다.

먼저 빅데이터 활용 필요성 측면에서 점차 현대사회는 지능정보 기술을 기반으로 변해가고 있다. 이에 따라 여러 시스템이 디지털화되며 생성, 유통되고 있다. 쌓이는 데이터가 점차 크게 늘고 있다는 것이다. 교육 환경 패러다임 역시 빅데이터 활용에 초점을 맞춰 변화하고 있고, 이에 대응하기 위해선 데이터 기반 대학 행정 및 학습자에 대한 분석 작업이 필요하다.

두 번째 사업 추진 배경은 최근 학생들의 졸업률을 관리하는 것이 큰 이슈로 떠오르고 있다는 점이다. 우리나라는 1995년 대학 진학률이 51.4%로 크게 높아졌다. 진학률만큼이나 학업을 중단하는 학생도 늘어나는 추세다. 이는 우리 대학에만 해당하는 문제가 아니다. 4년제 대학을 기준으로 졸업 이전에 학업을 중단하는 비율이 2000년 3.6%에서 2013년 6.4%로 늘어났다.

실제 해마다 14만 명 정도가 중도에 학업을 중단하고 있으며 이에 대한 사회적 비용은 3조 원에 달한다. 입학부터 졸업까지 학생들을 관리할 필요성이 제기되고 있는 것이다. 학생들의 학업 성취도와 영향도를 관리하고 분석하는 것이 중요해졌다.

세 번째로는 한국방송통신대학교라는 특성에 맞는 학업 성취를 시스템적으로 뒷받침하기 위해서다. 우리 대학의 재학생은 직장인, 만학도의 비율이 높다. 학생마다 진학 배경과 내적 요인을 관리하는 것이 중요하다. 또한 LMS에서 생성되는 학습자의 실제 데이터를 분석하고 활용해야 하는 필요성도 늘어나고 있다.

이 외에 교직원들이 데이터허브 포털에서 데이터를 편리하게 활용할 수 있도록 하고 데이터에 기반해 행정 업무를 효율화하는 것도 이번 사업의 중요한 이유였다.

Q. 주요 사업 수행 내용을 말해달라.
A. AI 기반 예측시스템과 빅데이터 활용 사이트, 예측모형 및 학습분석에 필요한 데이터 추출 및 저장을 위한 ETL(Extract, Transform, Load) 등의 개발이 이루어졌다.

1차 사업을 통해 구축된 데이터허브를 기반으로 AI 분석 모델을 구축했다. AI 기반 예측시스템의 경우 성별, 연령대, 학과, 학년, 과목, 학적, 출석, 온라인 학습, 상담, 튜터 등을 토대로 학업 성취도 주요 요인과 월 단위 위험도를 예측했다. 이를 위해 데이터 전처리 및 변수를 기초통계(EDA) 분석에서 변수 중요도 분석으로 전환했고, 기존 데이터 전처리 과정을 알고리즘을 통한 변수를 선택하도록 변경했다.

특히 머신러닝 지도학습 기반 의사결정 분류 앙상블 알고리즘을 적용해 분류 정확도와 재현율을 높였다. 이를 통해 학습자들에게 학업을 권유하고 튜터 가이드를 제공하며, 학업 지속 요인을 발굴해 대학 정책을 수립하는 데 활용하고 있다.

큰 틀에서는 데이터허브에 저장된 정보들을 기반으로 분석 데이터를 구축했다. 이후 분석 대상 데이터허브를 개별 마련했고, 이를 토대로 분석 모델을 만들었다. 분석 모델에서 나온 결과를 데이터마트(DM)에 저장했고 포털을 통해 가시화했다.

아울러 AI 기반 예측 시스템을 위해 공통 오픈 API 개발, 상담게시판 워드 클라우드 개발 등의 작업도 병행했으며, 빅데이터 활용 사이트에는 과목별 수강신청 학습자 특성과 실태조사 결과, 튜터소속 학생 학습활동 현황, 다중 학적보유 학생 현황, 문자발송 비용 데이터 분석 현황 등을 한눈에 볼 수 있는 화면도 개발했다.

Q. 타 대학과 달리 온라인 수업이 대부분이기에, 학업 성취도 판단에 어려움이 있을 것 같다.
A. 상당히 어려웠다. 우리 대학은 설립 당시부터 다른 사이버대학과 달리 원격 수업에만 의존하지는 않았다. 블렌디드 러닝(Blended Learning)으로 불리는 온·오프라인 병행 수업이 대부분이다. 그러다 보니 사이버대학이나 일반 대학과 달리 학사시스템이 상당히 복잡하다. 여러 형태의 교육이 이뤄지기에 이를 뒷받침하는 시스템의 규모도 크고, 복잡도도 높다.

또 학습자들의 특성도 매우 다르다. 우리 대학에는 직장인, 만학도가 일반 대학에 비해 많다. 학습자들이 학업에 열중할 수 있는 환경이 아니라는 얘기다. 능력이나 의지가 없어서가 아니라 환경적 요인 때문에 잠시 방심하면 학업의 끈을 놓칠 수 있게 될 수도 있다. 이런 부분에서 학습자들의 환경적인 요인이 학업 성취도와 밀접하게 연관돼 있다.

Q. 학생의 성취도 여부를 판별하고 예측하기 위해 이용한 데이터의 양과 알고리즘은.
A. 수집한 데이터는 전체 5.44억 건에 달한다. 학습 데이터는 57만 건, 검증 데이터는 31만 건, 테스트 데이터는 32만 건이다. 알고리즘의 경우 XG부스트(XGBoost), 라이트GBM(LightGBM), 캣부스트(CatBoost) 3가지 알고리즘을 동시에 구동했다. 일반적으로 다른 대학의 경우 알고리즘을 1~2개, 혹은 2~3개를 테스트하고 1개의 알고리즘만 적용하는 데, 우리 대학은 4개의 알고리즘을 테스트해 3개의 알고리즘을 동시에 구동하고 있다. 개별 알고리즘은 각각 다른 환경에서 유연하고 우수하게 동작한다. 아울러 앙상블(Ensemble) 기법을 적용했다. 앙상블 기법은 데이터 분석 업계에서는 오래전부터 연구되던 기법이다. 각각의 알고리즘의 평균값을 계산하고 이를 알고리즘에 적용하는 방식이다.

Q. 예측의 정확도는 어떤가.
A. 방송대는 정확도를 알고리즘으로 자동 수행한 모델 정확도와 실제 예측한 결과의 정확도를 나누어서 관리한다. 모델정확도(모델신뢰도)는 3가지 알고리즘을 이용해서 2개 모델(중간평가 이전 모델, 중간평가 이후 모델)로 적용하여 사용하므로 총 6가지 모델이 수행된다. 그래서 그 정확도는 각각 97.83%, 98.07%, 98.01%, 99.5%, 99.54%, 99.54% 나옴을 확인했다.

또한 실제로 예측한 결과 정확도는 한 달이 지난 후 예측 결과를 확인할 수 있는데, 그 정확도는 3월에 92.62%, 4월에 89.88%, 5월에 90.32%를 각각 기록했다. 이제 막 시작한 단계이기 때문에 계속 수정하여 시스템을 운영하며 개선점을 찾는 과정도 진행하고 있다.


“학업 지속 위한 조기 예측‧알람에 큰 도움”

Q. 위세아이텍을 사업자로 선정한 이유는. 또 사업을 수행하며 회사 측에 강조한 부분은.
A. 먼저 위세아이텍을 선정한 이유는 회사가 AI 및 빅데이터 분석과 관련된 역량을 갖추고 있다고 판단했기 때문이다. 우리 대학은 국립 대학교로 조달청을 통해 사업을 공시했고 여러 기업이 지원했다. 자체적으로 평가위원을 선정했고 사업자 제안사항과 사업 경험, 검증작업 등을 통해 위세아이텍이 선정됐다.

이번 우리 사업의 핵심은 학습자가 학업을 지속할 수 있는지 없는지 그 여부를 예측하는 것이다. 이러한 예측은 개강 시기인 3월에 이루어져야 한다. 4월, 5월에 예측하게 되면 학습자를 상대로 학업을 지속하도록 독려할 수 없게 된다. 쉽게 말해 개강하는 달에 맞춰 조기에 예측하고 알람을 줄 수 있어야 한다는 의미다.

이번 사업을 추진하면서 우리는 이러한 조기 예측‧알람을 위세아이텍 측에게 주문했다. 100% 정확도는 아닐지라도 조기에 예측 결과가 나와야 한다는 것이었다. 위세아이텍 사업 관계자들이 조기 예측‧알람을 수행할 수 있도록 다양하고 창의적인 아이디어를 제시해줬다.

사업 마지막에 일부 방향이 수정됐는데, 위세아이텍에서 예측률을 높일 수 있도록 도움을 줬다. 기존에는 재학생이 학업을 유지할지 멈출지를 이분법적으로 예측하는 것으로 시스템이 설계됐다. 하지만 학업을 ‘멈출 학생’보다 ‘유지할 수 있는 학생’을 찾는 것이 더 중요하다고 판단했다. 이분법적인 예측에서 백분율로 예측하도록 변경했다. 이에 따라 시스템 상당 부분을 변경해야 했는데 위세아이텍에서 잘 도와줬다. 감사함을 표한다.

Q. 시스템 기대 효과는.
A. 궁극적으로는 대국민 평생학습 모델을 마련하는 것이다. 이를 위해 다양한 연령층을 보유하고 있는 우리 대학 학습자들의 성향별 패턴을 분석해 성인 학습자들의 학업 지속 요인을 찾아내고자 했다. 기술적으로는 대학 행정의 혁신과 정확한 의사결정을 지원할 수 있는 데이터 통합 관리 체계 및 데이터허브 포털을 구축하는 것이다.

물론 현재 개발한 예측시스템을 원활히 잘 운영하도록 정책도 마련해야 한다. 우리 대학의 총장님부터 교직자들에게 시스템을 100% 활용할 수 있는 방안과 거버넌스를 만들어야 한다는 점을 강조하고 있다.

Q. 사업으로 학습자들이 얻을 수 있는 가치는 무엇인가.
A. 우리 대학이 개발한 시스템은 학습자 스스로 입학 초기 설정한 목표를 달성하도록 하는 데 도움을 줄 수 있을 것이다. 모든 학습자에게 메시지 보내는 것이 아니다. 데이터에 기반하고 예측해 목표를 향해 정진해야 하는 상황에 놓인 학습자에게 알람이나 메시지를 보내는 것이다.

물론 학습자는 이 시스템의 알람이 번거롭고 귀찮을 수 있다. 또 학습자 중에는 사실 열심히 하고 싶었는데 시기를 놓친 학습자도 분명히 있을 것이다. 우리는 시스템으로 학업의 끈을 놓지 않게 도울 뿐이다. 일부 학습자는 아무런 알람이나 독려가 없어도 학업 성취도를 잘 따라갈 것이다. 물론 이들 학습자에게도 학사 안내, 졸업을 위한 성취 수준 확인 등 개인별 맞춤형 서비스와 연계해 적시에 필요한 정보를 제공하고 주체적인 대학 생활 및 학업 성취가 가능하도록 질 높은 서비스를 제공할 수 있을 것이다.

저작권자 © 아이티데일리 무단전재 및 재배포 금지