예방접종등록 정보시스템에 구축되어 있는 접종등록자료의 정확성, 중복성, 등록률 등을 분석하였다. 이를 통해 접종데이터 미등록 현황, 중복데이터, 누락데이터, 오류데이터 현황을 파악하였다. 또한 예방접종 등록 정보시스템의 접종등록자료의 품질 개선을 위한 품질관리 오류기준안을 마련하여 데이터베이스 품질관리체계 수립을 제안한다.
In this study, the accuracy duplication and register rate of the vaccination registration data in National Immunization Registry Information System were evaluated and analyzed. Through which undocumented vaccination status data, duplicate data, missing data, errors data into the vaccination registration data were analyzed. In addition, the quality control for the vaccination registration database quality improvement, were proposed for standard error checking. In this paper, we propose an efficient validation of a quality management system of the database.
2000년 6월부터 질병관리본부에서는 예방접종서비스의 질적 향상, 기록과 감시, 평가 및 연구 등을 목적으로 피접종자의 인구사회학적 특성, 접종시기, 접종백신 등 예방접종 관련 정보들을 체계적으로 수집하고 관리하는 예방접종등록사업을 추진하여 예방접종서비스의 질적 향상을 도모하고, 안전한 접종을 적기에 제공할 수 있도록 하고 있다[1,2].
2015년도부터 예방접종률이 조사통계에서 보고통계로 변경됨에 따라 기존에 등록된 예방접종 기록의 활용성이 기억/회상(Recall/Remind)서비스 제공, 접종전 기록조회 등에서 더 나아가 이를 통해 지역별(보건소) 예방접종률을 산출하거나, 전산등록이 누락된 예방접종 대상자를 찾아 접종을 유도하거나, 아니면 인적사항의 전산등록은 되어 있더라도 누락된 접종내역을 보완할 수 있는 등 보다 등록의 질을 향상시킬 필요가 있다.
매년 구축·활용되는 데이터양은 기하급수적으로 증가하고 있으며, 업무의 다양화로 데이터베이스 활용 요구를 충족시키기 위해서는 데이터 품질 확보가 전제되어야 한다. 예방접종등록 정보시스템에서 오류데이터 문제가 개방·공유·협업 기반의 저해요소로 작용될 우려가 있다.
이에 본 논문에서는 예방접종등록정보시스템에 구축되어 있는 자료 중 2012년 출생아의 접종 등록 자료의 정확도, 타당도 등을 평가 및 분석하여 자료의 정확성, 중복성, 충실성, 완결성, 등록률, 누락자 현황 등을 파악하고 입력항목을 예방접종에 필요한 필수항목과 선택항목으로 구분하여 타당도 평가를 하여 예방접종 등록시스템의 품질관리 기준을 제시한다.
미국의 예방접종등록사업은 예방접종 수준 모니터링, 기억/회상 서비스 제공, 백신관리 등의 기능을 수행하기 위해서 실시되고 있다[3].
미국 질병관리본부(Centers for Disease Control and Prevention, CDC)에서는 표준화된 자료 질 평가 방법을 개발, 실행하고 향상시킴으로써 양질의 자료를 확보하고 있다. 등록 자료의 정확성을 평가하기 위해 등록체계의 자동 중복성 체크 과정을 통해 민감도와 특이도 계산하고 등록체계 데이터베이스 내 중복자료 분율(%) 평가한다[3,4].
호주의 소아 예방접종등록체계는 인구집단에 근거한 등록체계로서 소아 예방접종률의 감소에 대응하고 예방 가능한 소아 질병의 증가에 경각심을 일으키기 위하여 개발되었다[5].
2.2.1. ACIR
ACIR(Australian Childhood Imminisation Register)은 호주 인적 서비스부(Department of Human Services, DHS) 소속으로, 호주에 거주하고 있는 7세 이하 아동의 국가예방 접종 과 기타 예방접종, 그리고 해외 접종기록을 등록 및 관리한다[5].
7세 이하의 아동이 Medicare에 등록되면 자동으로 ACIR에 자료가 등록되며, Medicare 미등록 아동은 의사 또는 예방접종 제공자로부터 예방접종을 실시할 때 접종 의료기관으로부터 자료가 등록된다.
ACIR 자료의 정확성은 입력된 데이터를 정제하는 별도의 품질관리 팀을 운영하고 있으며 전문 인력이 입력되는 모든 데이터에 대한 정확성 여부를 확인하며, 불확실한 데이터는 입력 주체에게 환류하도록 하고 있다. 자료는 예방접종 제공자가 제출하는 자료에 의존하고 있으며, 예방접종 후 가능한 한 빠른 시간 내 데이터 전송이 필수적이다. 모든 예방접종 제공자는 최소 주단위로 자료 제출이 권장되고 예방접종 정보의 지연 제출은 부모에게 제공되는 가족수당(Family Assistance Payments)의 수급 자격 상실을 초래할 수 있다.
한국의 예방접종등록사업은 예방접종서비스의 질적향상, 기록과 감시, 평가 및 연구 등을 위해 2000년 6월부터 예방접종 등록프로그램을 전국의 보건소에 설치하여 개인별 예방접종기록을 전산화하기 시작하였다[6].
2002년∼2005년 예방접종등록시스템 인프라 구축, 접종기록 표준화사업으로 보건소 및 의료기관 표준모듈 보급하였고 2006년∼2009년 예방접종 등록 데이터의 활용하여, 예방접종일정안내 등 대국민 서비스 강화하고 ‘국가예방접종 지원 사업’시행하고 있다. 2011년 부터는 전자정부 사업을 통한 범부처 예방접종 통합관리체계 구축하여 운영 중에 있다[6].
표 1과 같이 국가예방접종은 국가가 권장하는 예방접종으로 감염병의 예방 및 관리에 관한 법률을 통해 예방접종 대상 감염병과 예방접종의 실시기준 및 방법을 정하고, 국민과 의료제공자에게 이를 준수토록 하고 있다[7].
국가예방접종 일정표
3.1.1. 피접종자(환자) 정보
피접종자 환자 정보는 피접종자를 구분할 수 있는 개인정보로 이 정보를 활용하여 관리 주체 의료기관, 기억/회상 서비스, 이상반응 추적 관리 등에 사용한다. 환자정보 데이터는 사용자 입력에 의한 필수와 선택 값을 가지고 있으며, 대부분의 정보는 시스템 내부에서 자동으로 생성되는 정보를 보유한다.
3.1.2. 접종내역
접종내역 정보는 피접종자의 예방접종 내역 정보로 접종시기, 접종방법, 사용백신 등 접종과 관련된 모든 정보를 보유하고 있으며 접종정보 데이터는 사용자에 의해 입력되는 값보다, 시스템 내부에서 처리되는 값이 많고, 대부분 사용자 입력값도 기준값을 제시하여 사용자가 선택할 수 있는 정보로 구성된다.
3.1.3. 백신정보
백신 정보는 식품의약품안전처에서 검정된 백신정보로 질병관리본부 예방접종관리과에서 백신정보를 계속 갱신하여 사용되며 질병관리본부에서 등록한 백신정보는 시스템 사용자가 로트번호 선택만으로 그 백신과 관련된 정보를 확인할 수 있으며, 대상 감염병과 접종에 필요한 정보를 포함한다.
2012년 출생아 중 2014년 9월까지 등록된 자료를 기준으로 국내 거주 확인된 내국인 대상자 482,608명이며, 이 중 예방접종등록 현황은 2014년 9월 기준으로 2012년생의 월령은 21개월(2012년 12월 출생아)〜 32개월(2012년 1월 출생아)로 일본뇌염 사백신, 생백신의 경우 2014년 9월 기준으로 접종시기(12개월〜36개월)가 종료되지 않아 9월까지 접종완료한 접종현황만을 파악하였다.
2012년 출생아 예방접종 등록현황
데이터 입력오류는 피접종자이름, 주민등록번호, 전화번호, 문자수신동의여부, 전자우편 등에서 발생데이터 입력 오류는 사용자가 값을 집적 입력하는 과정에서 발생하는 오류로 대부분 정해진 값이 아닌 주민등록번호 또는 이름과 같은 개별정보에서 주로 발생하였다. 표 3은 입력오류 발생유형이다.
입력오류 발생 유형
예방접종등록관리 정보시스템은 2002년부터 입력오류에 대한 검증을 하였으며, 현재 발생하는 입력오류는 사용자가 임의의 값을 의도적으로 넣거나 시스템 내부에서 데이터 처리과정, 공백문자 발생 등 사용자 입력 과정보다 시스템 오류에 의해 발생하는 경우가 많다.
예방접종등록관리 정보시스템은 2002년부터 입력오류에 대해 검증을 하여 입력되는 오류 유형에 따라 차단을 하였고, 사용자 임의의 입력을 최소화하고 기본값을 제공하여 오류에 대해 사전에 발생하지 않도록 하고있다. 하지만 사용자가 임의로 만들어내는 오류에 대해서는 오류 패턴에 대한 데이터 축적을 통하여 별도의 품질관리가 필요하다. 데이터 입력 통제는 입력자가 애플리케이션을 통해 데이터를 입력할 때, 부정확한 데이터를 탐지하여 입력 절차에 제한을 두어 입력자가 부정확한 데이터를 입력하는 실수를 미연에 방지할 수 있도록 할 필요가 있다.
데이터 내용오류의 발생은 사용자보다 시스템 내 다양한 기능들로 인하여 발생하는 경우가 대부분 이였으며, 민원처리 과정에서 데이터 수정에 의해서 발생되고 있다. 표 4는 내용오류 발생유형이다.
내용오류 발생 유형
입력데이터 내용오류 유형에는 동일접종에 대해 접종차수 중복과 접종일 중복, 접종일 오류, 백신유효기간 오류가 있다. 접종정보 기준안에는 로트번호, 아기 구분값, 개월 수, 피접종자구분, 전산등록일자, 접종코드, 접종날짜 및 차수, 접종연령 미준수, 접종간격 미준수 가 포함되어야한다.
내용 오류는 위에서 언급한 유형 이외에도 다른 변수에 의해서 더 많은 유형이 존재할 것이며, 입력오류와는 달리 다른 데이터와 연관관계 까지 고려해야 오류를 확인할 수 있고 원인을 찾을 수 있다.
대부분의 내용 오류에 대해서 원인을 파악하면 시스템 내에서 통제가 가능하며, 다양한 외부 시스템으로부터 등록되는 예방접종 데이터는 항상 내용오류 유형에 맞는 시스템 개선과 관리가 필요하다.
데이터 흐름 통제를 적절히 수행하지 못한 경우에는 입력 통제와 유사하게 부정확한 데이터가 발생될 수 있고 업무규칙 측정 결과, 오류 데이터 발생 원인이 데이터 흐름과 관련된 경우에는 소스 대 타깃 매핑 분석, 소스 데이터 추출 모니터링 보고서 등을 검토하여 오류의 원인이 흐름과정에서 기인한 것인지를 파악된다.
데이터의 입력 과정에서 수기 입력을 허용하는 데이터 항목은 항상 입력자의 실수가 발생할 가능성이 존재한다. 또한, 정보시스템에서 필요 이상의 데이터를 필수 입력 값으로 요구할 경우에는 입력자가 기피하거나 꺼려할 수 있어 전자우편, 주소, 휴대전화, 입력자정보 등과 같은 데이터 항목을 무의미하거나 거짓으로 입력할 수도 있다.
정보시스템의 테스트를 위해 임의의 테스트 데이터를 입력하고 시스템을 정상가동한 후에 테스트 데이터를 삭제하지 않아서 무의미하거나 부정확한 데이터가 존재할 수 있다. 즉, 입력 시스템의 오류 데이터 입력 통제 방식이 미비하거나 데이터베이스 내부의 무결성 제약조건을 방치하여 발생할 수도 있고, 입력 통제 방식은 적절하였으나 애플리케이션 및 데이터베이스 트랜잭션 처리 로직의 설계 미비로 인해 NULL이나 중복된 값이 발생할 수도 있다.
반면, 개인의 주민등록번호, 생년월일, 성별 등 개체의 내재적 속성은 시점의 변화와 무관하게 초기 데이터가 정확히 입력된 경우, 지속적인 정확성을 유지할 수 있다. 따라서, 데이터 항목의 변경 주기를 고려하여 데이터베이스를 설계할 필요가 있으며, 변경관리가 필요한 데이터 항목은 적절한 재검증 시기와 주기를 사전에 정의하여 이력 변경사항을 유지하는 것이 바람직하다.
예방접종등록 데이터의 특징은 데이터의 생산 주체가 병의원, 보건소의 의료 인력이 예방접종 관련 정보의 입력으로 데이터가 최초 생성되는 특징이 있으며 예방접종 등록의 특성상 정형화 할 수 없는 입력 중심의 텍스트성 데이터가 많아 예방접종등록데이터에 대한 정확한 데이터의 입력의 필요성을 인지하지 못하는 경우로 인해 저품질의 오류 데이터 입력이 발생한다.
이를 예방하기 위해서는 실제로 데이터를 생산하는 입력주체를 대상으로 입력 오류 및 사전 검증 체계 교육 등이 필요하며 데이터 표준, 데이터 구조 등 메타데이터 관리를 포함한 전반적인 데이터 품질 관리체계 구축이 필요하다. 논리 모델 작성부터 물리 데이터베이스 적용 시까지의 데이터 구조관리 절차 및 체계의 수립과 입력 데이터에 대한 통제 기준 및 사전 및 사후 검증 필요가 있다. 전사 차원에서 관리할 통합 코드 관리 체계가 필요하며, 데이터 표준 용어, 단어의 정의 및 현행화가 필요하며, 데이터 도메인의 보완 하여 null 값의 적용 기준, 기본값의 정의, 컬럼별 도메인 정의 및 인포 타입의 보완이 필요하다.
예방접종률은 예방접종사업의 성과를 간접적으로 측정할 수 있는 대표적인 지표이며, 매우 예민한 지표이기 때문에 사업의 문제점을 발견하여 즉각적인 조치가 가능한 매우 유용한 지표이다. 2015년부터는 예방접종등록관리 정보시스템의 등록자료를 활용한 접종률 산출을 기대할 수 있을 것으로 예상된다.
이에 본 논문에서는 예방접종등록정보시스템에 구축되어 있는 자료 중 2012년 출생아의 접종 등록 자료의 정확도, 타당도 등 평가 및 분석하여 자료의 정확성, 중복성, 충실성, 완결성, 등록률, 누락자 현황 등을 파악하고 입력항목을 예방접종에 필요한 필수항목과 선택항목으로 구분하여 타당도 평가를 하여 예방접종등록 시스템의 등록자료의 품질관리 기준을 제시하였다.
이는 향후 국가 예방접종 정책 수립의 근거자료로 활용 가능하고 예방접종등록관리 정보시스템의 예방접종 등록자료를 기반으로 국가 예방접종률 산출하여 필수 예방접종비용 국가부담 사업 시스템 안정적 운영할 수 있을 것으로 기대된다.