학교교육 연구로 생산된
데이터의 안전한 보존과 활용

● 글. 송미영 선임연구위원

송미영
선임연구위원, KICE 기획조정본부

국가수준 및 국제 학업성취도 평가 연구, 서답형 문항 자동채점 프로그램 개발, 학생평가 타당도 제고 방안 연구, 교육정책 효과성 분석 연구 등을 수행해 왔다. 현재는 KICE 교육데이터 통합관리 체제 구축을 위한 과제 발굴 및 추진, 이와 관련한 현안에 대응하고 있다.

오늘날 데이터를 ‘21세기 원유’라고 비유하는 만큼 모든 부문에서 데이터의 생산·활용에 대한 효율적 관리 능력이 미래 경쟁력의 주요 핵심으로 부상하고 있다. 정보기술의 급속한 발전과 함께 불확실성이 증가하는 사회문화적 환경 변화에 따라 정책화 패러다임 변화가 요구되고, 데이터에 근거한 과학적인 정책 수립과 실행에 대한 논의와 연구가 활발하다. 교육 부문에서는 각종 교육 관련 기관에 산재해 있는 데이터를 집적·연계·활용하도록 지원하는 등 데이터 기반 교육정책을 강화하고 있다(교육부, 2020.10.30.). 또한 연구 환경의 디지털화로 인하여 연구 패러다임도 실험·이론(문헌) 중심에서 데이터 중심 연구로 변화하고 있으며(정영철, 2020, p. 9; 최명석, 김현우, 이상환, 2019, p. 2), 연구 결과물뿐만 아니라 원천데이터를 공유하는 오픈 사이언스 정책이 확산되는 추세이다.

한국교육과정평가원은 데이터 중심의 연구 패러다임 변화를 반영하여 학교교육 실제에 밀접한 연구사업 수행으로 생산된 데이터(이하 KICE 교육데이터)1)를 체계적으로 관리하기 시작하였다. 그 간 교육과정, 교수학습, 교육평가 연구를 수행하면서 꾸준히 생산해 온 방대한 KICE 교육데이터는 초·중·고 학교교육의 성과와 실제적 양상을 보여주는 원천이며 국가수준의 교육정책 결정과 관련된 다양한 문제 해결의 실마리를 제공하는 귀중한 자원이다. 한국교육과정평가원은 KICE 교육데이터를 교육 부문의 역사적·학술적·정책적 활용 가치가 높은 국가적 지식자원으로 인식하고, 기관 차원에서 안전하게 보존하고 효율적으로 활용하기 위한 토대를 구축하는 노력을 기울이고 있다(송미영 외, 2021).


1) 한국교육과정평가원의 연구사업 수행 과정 또는 결과로 산출된 것으로, 대개 ‘연구데이터(research data)’라 일컬음.

오래 전부터 학교교육 연구 데이터의 중요성은 강조되어 왔지만 최종 성과물에만 관심이 집중되어, 일부 연구사업을 제외하고는 수행 과정에서 생산된 데이터의 경우 개별적으로보관되는 편이었다. 1차적인 연구 성과물인 각종 데이터를 부서·실·팀·개인 단위에서 관리할 경우, 연구자의 전보 또는 퇴직, 저장장치의 고장 또는 파손 등이 발생하면 개별 관리 중인 데이터가 유실되거나 훼손될 위험성이 존재하게 된다. 이러한 관리체계에서는 기 생산된 데이터에 대해 누가 어떤 형태로 어디에서 보관하고 있는지 파악하기가 쉽지 않으며 누구에게 요청할지도 불명확함에 따라 재사용도가 낮게 될 뿐만 아니라 중복 조사 가능성도 배제할 수 없다. 무슨 데이터가 누구에게 있는지 알더라도 개별적으로 요청하는 방식이 보편적이면 데이터의 재사용에 대한 사항을 종합적으로 파악하기가 용이하지 않기도 하다. 이에 데이터의 손실 위험성을 줄이고 활용성을 높이기 위해서 개별 또는 분산관리 방식에서 통합관리 방식으로의 전환이 필요하다.

기관 차원에서 KICE 교육데이터를 체계적으로 축적하는 동시에 데이터 중심의 정책 연구를 강화하고 연구 환경 변화에 적극 대응하기 위하여, 한국교육과정평가원은 2021년 교육데이터센터를 신설하고 연구사업별 데이터를 한 곳에 집적하는 통합관리 제도를 도입하였다. 통합관리 기준(지침)에 따라 연구사업을 수행하는 팀은 연구계획 단계부터 연구종료 단계까지 연구사업 수행 전(全) 과정동안 데이터를 관리하고, 연구종료 이후에 데이터를 교육데이터센터에 제출하도록 하여 기관 차원에서 최종 데이터를 취합하고 보존하게 된다. 연구사업의 책임자는 연구사업 종료 후 1개월 이내에 원천데이터(마이크로데이터)와 이를 이해하기 위한 설명자료(데이터 개요서, 조사도구, 코드북 등)를 제출해야 한다.

[연구사업 수행 단계에 따른 KICE 교육데이터 생성·관리 흐름도(한국교육과정평가원, 2021)]

연구사업 성격과 연구방법에 따라 데이터는 다양한 특성을 가지는데, 데이터 공유 가부와 상관없이 모든 데이터를 교육데이터센터에 제출하여 통합관리하는 것을 원칙으로 정하고 있다. 다만, 통합관리 제도 도입 초기에는 모든 연구사업의 전체 데이터에 일괄 적용하기보다는 보편적이고 친숙한 유형의 데이터부터 시작하여 통합관리 대상 범위를 점차 확대함으로써 통합관리 체제가 정착될 수 있도록 단계적 운영을 계획하였다. 즉 현재는 설문·평가(시험) 시행을 통해 수집한 조사 데이터를 중심으로 통합관리 제도를 적용하고 있다. 대체로 조사연구에 의해 데이터가 생산되는 경향으로, ‘델파이’, ‘면담’ 등의 조사도 실시되지만 ‘설문’이나 ‘평가(시험)’에 의한 조사가 더 많은 비중을 차지하는 편이고, 연도별 데이터 수집방법의 경향성은 크게 다르지 않아 상대적으로 높은 비율의 수집방법인 설문·평가(시험)에 의한 조사 데이터를 우선적인 관리 대상으로 고려하였다. 통합관리 제도 운영과 관련하여 연구사업 책임자 대상의 설명회 개최, TF 운영 등을 통해 데이터 생산 및 활용 주체의 의견을 반영하여 학교교육 분야의 다양한 데이터에 대한 총체적인 집적을 위한 세부 사항을 구체화 하였다.

한편 데이터 통합관리 체제의 효율적 구현에는 정보기술 토대가 수반되어야 하는데, ‘연구사업관리시스템’ 에 탑재된 연구 원천자료 파일 등록 메뉴는 데이터 접근성 관련 기능의 한계가 있어서 적합한 시스템 마련이 요구된다. 한국교육과정평가원의 수많은 연구사업에서 생산된 공신력 높은 데이터의 체계적인 축적과 효율적인 공유·활용을 위해 긴요한 정보시스템2) 개발을 통해 데이터 통합관리의 정보기술 토대 구축을 계획하고 있다(송미영 외, 2021). KICE 교육데이터를 관리하는 시스템은 초·중·고 교육활동과 관련한 다양한 연구 데이터를 축적·연계·결합하여 종합적인 분석을 실시하고 학교교육을 개선하기 위한 정책 지원의 주요 토대가 될 것이며, 올해는 목표 시스템을 설계하고 1차 파일럿 시스템을 시범 운용할 예정이다.

[연구데이터-연구사업-보고서 관리 시스템 관계 (송미영 외, 2021)]

KICE 교육데이터 제출, 검색3), 활용을 포괄한 통합관리의 전체 맥락에 적합한 시스템을 개발하고, 데이터 생산자 및 사용자의 시스템 사용 편이성을 고려하여 연구사업 수행의 전(全) 단계를 관리하는 ‘연구사업관리시스템’과 ‘연구보고서관리시스템’과의 연동도 구상하고 있다. 연구 환경 및 데이터 특성을 고려한 시스템을 개발하되, 유관 시스템과 연계를 통해 데이터 제출·등록 과정의 편리성, 연구데이터와 연구보고서 간 연결성을 제공하고자 한다. 또한 데이터 생산 및 활용 주체의 의견 수렴 과정을 거쳐 데이터의 공개 범위, 제공 (유예) 기간, 접근 제한의 설정 등을 통해 계층적 공유·활용 체계를 구현해 나갈 계획이다. 이러한 시스템은 교육정책 수립 과정에서 요구되는 데이터 수요에 적시 대응하는 데 유용하게 기능할 뿐만 아니라 교육 분야의 다양한 연구정보 및 자원을 연결할 수 있는 플랫폼 역할을 수행할 수 있을 것이다. 향후 KICE 교육데이터 오픈플랫폼으로 발전하게 되면, 여러 연구자가 데이터를 공유하고 이를 기반으로 한 데이터 연계, 혹은 협동 연구의 진행도 가능할 것으로 보인다.


2) 연구사업관리시스템의 연구 원천자료 파일 등록 기능은 데이터 축적ㆍ공유ㆍ연계를 위한 통합관리 체계를 원활히 운영하는 데에는 제한적임. KISTI가 개발한 연구데이터 리포지터리 시스템의 기술 지원을 받아, 이를 근간으로 KICE 교육데이터의 특성과 통합관리 제도에 적합한 시스템을 개발할 계획임.
3) 원천데이터와 함께 제출하는 설명자료 중의 하나인 데이터 개요서는 일종의 메타데이터로서 데이터 유형, 조사 대상, 조사 내용, 조사 기간 등을 포함하는데, 리포지터리 시스템에서 데이터를 검색하는 기준으로 활용될 것임.

KICE 교육데이터의 생산에서부터 활용까지 전체 흐름을 효율적으로 관리하는 시스템 개발과 더불어 단계적으로 적용 중인 통합관리 제도의 확장을 포함하여 종합적인 체계 구축을 완성하기까지 상당한 기간이 소요될 수 있다. 앞에서 언급한 것처럼 데이터 유형을 한정하지 않고, 통합관리 대상을 확대하고 축적·보존에서부터 공유·활용으로 통합관리 영역을 점차 넓혀 나가기 위해 해결해야 할 문제들이 남아 있기 때문이다.

한국교육과정평가원의 학교교육 연구로 생산된 데이터를 체계적으로 보존하여 활용할 수 있는 기반을 탄탄히 구축한다면, 다음 연구자는 축적된 KICE 교육데이터를 통해 새로운 미래를 열 수 있는 정책 연구가 가능할 것이다. 이 때 기존 데이터에 담겨 있는 연구자의 노고를 간과하지 않아야 한다. 이러한 방향성을 갖고 통합관리 체계를 완성해 나가기 위해서 지속적인 제도·규정에 대한 보완 작업과 이를 반영한 시스템 개발 작업을 준비하고 있다. 특히 연구사업별 데이터의 공개 범위, 절차 등에 대한 의견 수렴, 데이터 활용에 대한 원내외 요구 및 전문가 자문, 관련 기관 협의 등을 거쳐 다각적으로 검토하여 제도 확장의 합리적인 방안을 마련해 나갈 예정이다.

그동안 쌓아온 KICE 교육데이터를 가치 있게 활용하기 위한 토대 구축을 완성하고 성공적인 운영을 위해 꾸준한 투자와 모든 구성원의 적극적인 협조가 뒷받침되어야 한다. 앞으로 한국교육과정평가원이 보유하고 있는 방대한 학교교육 연구 데이터가 어떠한 미래를 보여줄 수 있을지 기대된다.

참고문헌

  • 교육부. (2020.10.30.). 교육부·시도교육청, 데이터 기반 교육정책 강화 한다: 지능형 교육정보통계시스템(EDS) 본격 개통. 보도자료.

  • 송미영, 시기자, 이은경, 이인태, 조기희, 최인봉, 김솔아, 박지윤 (2021). KICE 교육데이터 생산·보유 현황 조사 및 축적 방안. KICE ISSUE PAPER (연구자료 ORM 2021-40-1)

  • 정영철. (2020). 근거 기반 정책 지원을 위한 연구 데이터 관리와 개방. 보건복지포럼, 286, 7-18.

  • 최명석, 김현우, 이상환. (2019). 국가 연구데이터 공유의 시작, 데이터 관리계획(DATA MANAGEMENT PLAN). KISTI ISSUE BRIEF, 13. 한국과학기술정보연구원.

  • 한국교육과정평가원. (2021). 2021년 교육데이터 통합관리 계획. 미간행.