A Study of Metadata Elements for Digital Image Records Management

  • cc icon
  • ABSTRACT

    As the importance and proportion of electronic records increases in the public sector, the necessity for variable types of records management has strengthened. Elements of records management metadata standards, which were provided in 2007 by the National Archives of Korea, focused mainly on text-centered records management standards. Therefore an extension of elements which can represent diverse types of electronic records is needed. In this study, metadata elements focusing on image records are suggested. For this, the characteristics of image records are investigated and the Australian government recordkeeping metadata standard and the PREMIS data dictionary, which have been recently modified, are analyzed. Through this, four elements, format, significant properties, environment, and coverage are suggested to fortify the current records management standard.


    공공기관 내에서의 전자기록물의 중요성과 비중이 높아져감에 따라 다양한 형태의 기록물 관리의 필요성이 대두되고 있다. 2007년 제안된 국가기록원의 기록관리 메타데이터 표준안의 요소들은 주로 텍스트 형태의 기록물에 중점을 두고 있으므로 다양한 유형의 전자기록물을 표현할 수 있는 요소의 확장이 필요하다. 이에 본 연구에서는 이미지 기록물에 초점을 맞추어 메타데이터 요소들을 제안하였다. 이를 위하여 이미지 기록의 특성을 파악하였고, 최근에 그 개정판이 제공 된 호주 국가기록원의 Australian government recordkeeping metadata standard와 PREMIS 데이터사전과 요소들을 비교분석하였다. 이를 통하여 포맷(format), 중요속성(significant properties), 환경(environment), 범위 (coverage)등의 네 요소의 수정 및 추가를 제안하였다.

  • KEYWORD

    Electronic Records Management , Metadata , Image Records Management , Image Metadata , National Archives of Korea

  • 1. 서 론

    중앙행정기관과 지방자치단체 그리고 정부산하기관에 이르기까지 전자기록의 활용과 의존도는 더욱 커져가고 있다. 전자기록의 경우, 종이기록과는 다르게 내용, 구조, 맥락이 각각 별도로 존재하고, 전자매체의 신뢰성 확보를 위한 여러 요소가 복합적으로 고려되어야 한다는 점에 있어서 더욱 어려움이 수반된다.

    그동안 전자기록의 생산과 이용이 보편화됨에 따라 전자매체의 장기보존 및 기술쇠퇴에 대응하는 접근성 확보 등 다각적인 관점에서의 다양한 연구가 진행되어 왔다.

    전자기록관리를 위한 가이드라인으로는 호주의 DIRKS(Design and Implementation of Record Keeping System), 영국의 TNA (The National Archives) 가이드라인, 유럽 연합의 MoReq(Model Requirements for the Management of Electronic Records) 등이 대표적이며, 전자기록물의 진본성과 무결성 확보를 위한 프로젝트로서는 UBC 프로젝트를 모체로 하는 InterPARES 프로젝트가 대표적이다. 특히 InterPARES는 프로젝트 1(1999∼2001)과 프로젝트 2(2002∼2007)에 이어서, 프로젝트 3(2007∼2012)이 진행 중인데, 주로 개념적인 틀을 제시하는 데에 초점을 맞춰온 프로젝트 1에 이어서 프로젝트 2에서는프로젝트 1의 전자기록관리 개념 틀을 기반으로 하여 예술, 과학, 정부영역에 이르는 다양한 필드에서의 전자기록관리 사례연구를 제시하고 있다.

    한편, 전자메일, 디지털이미지, 동영상 등 다양한 유형의 정보들이 정부나 기업에서 공문서와 함께 보조적인 증거적 자원으로 받아 들여짐에 따라 전자기록관리 영역의 연구대상 유형과 주제 분야는 더욱 확장되고 있다.

    효율적인 전자기록관리와 보존을 위해서는 해당 기록물의 속성과 맥락을 지속적이고도 신뢰성 있게 제공하는 것이 필요한데, 이는 체계적이고 구체적인 메타데이터의 요소 설정으로 가능하다.

    이에 본 연구에서는 전자기록물의 여러 유형중 디지털이미지에 초점을 맞추어서 효율적인 기록관리를 위하여 고려되어야 할 메타데이터 요소들을 설정하였다. 이를 위하여, 먼저 국가기록원의 메타데이터 표준안과 최근에 개정판이 제공된 호주 Recordkeeping Metadata Standard Version 2.0, 그리고 PREMIS Data Dictionary for Preservation Metadata Version 2.0을 중심으로 메타데이터의 요소들을 비교분석하였고, 디지털이미지 기록의 특징 및 실제 사례를 분석하였다. Australian government recordkeeping metadata standard와 PREMIS를 선정한 이유는 두 표준의 포괄성과 최신성에 기인한다.

    이상의 분석결과를 토대로 디지털이미지의 기록관리를 위하여 고려되어야 할 메타데이터 요소들을 설정하였다. 각 요소에 대하여서는 구체적인 설명과 예제를 중심으로 제시하였으며, 이러한 요소들의 설정은 디지털 기록물의 비중이 지속적으로 확장되어 가고 있는 현상황을 고려해 볼 때에 매우 필요하며, 무엇보다도 실무자 입장에서 실용적으로 적용할 수 있다는 점에 그 의의가 있다.

    2. 이론적 배경

    디지털 자원은 급속하게 변화하는 정보기술 환경에서 가변적이고 훼손되기 쉬운(fragile) 특징을 갖는다. 따라서 안정적인 접근성 확보를 위한 디지털 보존 관련 요소들은 전자기록물 메타데이터 요소들에 필연적으로 포함되게 된다.

    디지털 보존 관련 메타데이터는 전자기록물의 중요성과 포션(portion)이 확대되면서 관리적 메타데이터 영역에 포함시키던 기존 경향에서, 독립된 별도의 보존 메타데이터 영역을 설정하는 실제 사례들이 증가하고 있다.

    보존 메타데이터 개발에 있어서 기준으로 삼을 수 있는 국제표준인 OAIS(ISO 14721)에서는관리대상이 되는 디지털기록의 최소 단위를 정보패키지(Information Package)로 정의하는데, 정보패키지는 내용정보 (Content Information)와 보존기술정보(Preservation Description Information)로 구성된다. 보존 기술정보는 내용정보에 대한 메타데이터의 역할을 하는데, 여기에는 출처정보(Provenance Information), 참조정보(Reference Information), 고정정보(Fixity Information) 그리고 맥락정보(Context Information) 등이 포함된다. 출처정보에는 내용정보의 기원, 변화이력, 접근 권한 등의 내용이 포함되고, 참조정보에는 식별자 시스템 관련 내용, 고정정보에는 내용정보가 임의로 수정되지 않도록 보호하기 위한 요소들, 그리고 맥락정보에는 내용정보의 생산 배경 및 다른 정보와의 관련성 등이 포함된다.

    이 외에도 영국의 CEDARS 프로젝트는 OAIS 참조모형을 기반으로 구상되었는데, 디지털 콘텐츠 저작권과 관련된 법적 요소들에 중점을 둔 보존 메타데이터 요소들을 제안하였고, 뉴질랜드 국립도서관(National Library of New Zealand)에서는 디지털 객체를 객체(object), 프로세스(precess), 파일(file), 메타데이터 수정(metadata modification) 등의 4가지 엔티티 영역으로 세분하여 메타데이터 요소를 제안하였다. 특히 세부 영역은 보존 메타데이터의 업무에 적용한 것으로써 실용적인 특성이 강하고, 국제표준을 기반으로 한다.

    한편, 국내의 경우에는 전자정보의 접근과 검색을 위한 메타데이터 요소 설정에 관한 연구는 비교적 활발한 편이지만, 장기적 보존과 접근을 위해 필요한 메타데이터의 개발에 초점을 맞춘 연구는 상대적으로 미진한 상황이다. 국내에서는 주로 전자정보의 보존과 접근을 위한 메타데이터로 Dublin Core와 MARC를 활용하거나 자체 포맷을 사용하고 있는데 이는 전자정보의 장기 보존이라는 관점에서 개발된 메타데이터가 아니기 때문에 장기 보존에 필요한 요소를 충분히 반영하고 있지 못하다(홍재현 2005).

    3. 선행연구

    전자정보의 보존을 위한 메타데이터 설계와 관련된 선행연구를 살펴보면 다음과 같다. 먼저 오삼균, 권기성(2007)은 국립국악원의 전통예술자료의 아카이빙을 위한 보존 메타데이터 스키마를 설계하였다. 이를 위하여 OAIS 참조모델과 PREMIS 데이터 사전 등의 보존 메타데이터 규격들을 참조하고 전통예술자료의 특성을 조사 분석하여 보존 메타데이터 스키마를 설계하였다. 기존 규격과의 호환성 유지를 대원칙으로 하였으며 네임스페이스 선언으로 지속적인 관리를 추구하였다.

    김효원, 윤용익(2008)은 이미지 자료의 디지털 아카이브 구축을 위한 워크 플로우와 메타데이터 요소를 제안하여 아카이브의 효율적인 관리와 이미지 내의 인물과 사물 등을 대상으로 한 검색을 가능하게 하고 이용자의 다양한 정보요구를 충족시키고자 하였다. 구체적으로, OAIS 참조 모형을 기반으로 워크 플로우를 제시하였으며, 클래스 기반 다단계 메타데이터 모델 관리를 제안하였다. 1단계는 Original Contents 단계에서 부가되는 Dublin Core기반의 단순한 메타데이터이고, 2단계는 Digitized Contents 단계에서 부가되는 이미지 표현을 위한 MPEG-7기반 메타데이터이며, 3단계는단Registration 단계에서 부가되는 온톨로지 기반 메타데이터이다.

    최상미, 리상용(2007)은 현용전자기록물의 메타데이터요소를 제안하고, 제안된 메타데이터요소를 외교통상부, 정보통신부, 국방부의 문서에 적용시켰다. 이를 위해 먼저 기록관리 메타데이터 국제 표준인 ISO 23081과 한국, 호주, 영국의 전자기록물을 위한 메타데이터요소를 조사한 후, 이들을 미국 피츠버그 프로젝트의 메타데이터 참고모델에서 제시한 메타데이터의 6가지 역할 범주를 대상으로 비교 분석하고, 이들 내용을 종합하여 우리 실정에 맞는 현용전자기록물의 메타데이터를 제안하였다.

    전자기록을 위한 메타데이터와 관련된 국내 연구 중에서는 이메일이나 구술사 기록물과 같이 특수한 형태의 기록을 위해 메타데이터 요소를 제시한 연구도 있다.

    김용, 김늘봄, 이태영(2008)은 2007년 제안된 국가기록원의 기록관리 메타데이터 표준안이 국내 공공기관에서 생산된 이메일 기록물을 직접적으로 적용하기에는 한계가 있다고 보고, 호주 이메일 메타데이터 표준 및 한국기록관리 메타데이터 표준 그리고 기록관리 및 기록물 메타데이터와 관련된 국제표준인 ISO 15489와 ISO 23081을 분석, 조사하였다. 또한 이메일 기록에 대한 특징을 추출하기 위해 사례연구를 수행하여 이를 종합적으로 검토한 후 이메일 기록 관리를 위한 필수 및 선택적 메타데이터 요소를 제안하였다.

    이정연(2009)은 문헌사를 대치하는 구술사에 관하여 기록물로서의 중요성을 제시하면서 구술사 기록물을 구조화 할 수 있는 메타데이터 모형과 요소를 제안하였다. 이를 위해 먼저 문헌연구를 통하여 구술사 기록물의 특성을 조사하고 구술기록을 표현할 수 있는 요소를 추출하였다. 다음으로 표준메타데이터인 Dublin Core, ISAD(G)와 미국방송협회에서 방송국 관련기관에서 활용할 수 있도록 개발한 메타데이터 표준인 PBCore를 분석하여 최종적으로 구술사 기록물을 위한 메타데이터를 제시하고 실제 구현하였다.

    4. 메타데이터 요소 비교분석

       4.1 국가기록원

    2007년 국가기록원에서는 전자기록이 종이기록 환경에서처럼 동일한 수준의 신뢰성, 진본성, 무결성, 이용가능성을 가지도록 보장하기 위해 공공기록을 대상으로 한 기록관리 메타데이터 표준을 제시하였다. 그러나 이는 전자결재를 통해 생산되는 현용 및 준현용 텍스트 기록물에 대한 메타데이터로 평가되며, 텍스트 형식이 아닌 비디오, 오디오, 이미지 등의 특수한 형식의 전자 기록물을 수용하기에는 한계점을 보이고 있어 수정이 필요하다. 특히 중앙행정기관과 지방자치단체 그리고 정부산하기관에서 다루는 전자기록 중에는 도면, 지도, 사진과 같은 이미지 기록이 다수 존재하는데 이러한 디지털이미지 정보의 특징을 반영한 메타데이터 요소의 보완이 필요하다.

    국가기록원에서 제정한 기록관리 메타데이터 표준(현용.준현용 기록물용)은 공공기록물 관리에 관한 법령에서 정한 현용.준현용 단계의 기록물을 관리하는 기관에 적용하도록 만들어졌으며, KS X ISO 23081-1과 KS X ISO15489-1,2를 기초로 하고『공공기록물관리에 관한 법률』,『공공기관의 정보공개에 관한 법률』등을 근거로 작성되었다.

    본 표준은 21개의 상위요소와 78개의 하위요소로 구성되어 있으며(<표 1> 참조), 이행여부는 필수와 해당 시 필수, 선택으로 각기 구분되어 있다. 이 요소들은 메타데이터의 기본 역할을 고려하여 구조(상위요소 6, 7, 8, 20번), 맥락(상위요소 1, 2, 9, 15, 19번), 내용 (상위요소 3, 4, 5, 10, 11, 16, 21번), 기록 관리 과정(상위요소 12, 13, 14, 17, 18번)의 4개 범주로 나눌 수 있다. 이러한 요소들은 기록의 4대 속성인 진본성, 신뢰성, 무결성, 이용가능성을 만족시키기 위해 필요한 정보를 제공하기 위해 선정되었으며, 업무 활동에 관한 맥락 정보가 기록될 수 있도록 보장한다.

    그러나 본 메타데이터 표준은 전자결재를 통해 생산된 텍스트 중심의 기록물에 대한 메타데이터로 평가되며, 다양한 형태의 기록을 포괄하기에는 한계점이 있는 것으로 보인다. 전자 이미지 기록물만의 고유한 정보를 담을 수 있는 관련 메타데이터 요소로는 ‘6. 유형’과 ‘7. 포맷’이 전부라고 할 수 있으며 해상도나 축척, 소프트웨어와 관련된 사항 등은 포함 되어 있지 않다. 다만, ‘13. 보존’요소에서 데이터포맷 마이그레이션, H/W 플램폼 이전, S/W 이전, 매체 이전 등의 보존행위에 관한 사항 정도를 기록할 수 있게 하였다.

       4.2 호주 Recordkeeping Metadata Standard Version 2.0

    호주 국가기록원은 호주의 기록관리 메타데이터 표준인 Recordkeeping 『Metadata Standard for Commonwealth Agencies Version 1.0』을 1999년에 제정한 후, 2008년에는 뉴질랜드 국가기록원과 협력하여『Australian Government Recordkeeping Metadata Standard Version 2.0』으로 개정하였다. 우리나라의 기준과 마찬가지로 AS ISO 15489 및 AS ISO 23081을 기반으로 제정되었다. 개정된 표준의 특징은 다중 객체 모델(multiple-entity model)을 기반으로 하며 5개의 객체 (Record, Agent, Business, Mandate, Relationship)를 설명한다는 점이며, 주로 전자기록물을 대상으로 작성되었다. 본 표준은 26개의 상위요소와 44개의 하위요소로 구성되어 있다(National Archives of Australia 2008) (<표 3> 참조).

    디지털이미지 기록을 고려했을 때, 호주 메타데이터 표준에서 우리나라 메타데이터 표준과 구별되는 특징을 살펴보면 다음과 같다.

    먼저 우리나라의 경우, 디지털이미지의 유형(지도, 도면 등)과 파일의 종류(JPEG, BMP 등) 정도만 기술할 수 있도록 구성되어 있는데 호주 표준의 경우, ‘19 Format’의 하위요소를 살펴보면 포맷명(Format Name), 포맷버전(Format Version), 생성 어플리케이션명(Creating Application Name), 생성 어플리케이션 버전(Creating Application Version), 포맷 레지스트리(Format Registry)까지 자세하게 기입하도록 되어 있다. 따라서 기술적 환경이 변해도 참고할 수 있는 파일과 소프트웨어의 구체적 정보를 확보할 수 있다. 또한 포맷과 생성 소프트웨어를 레지스트리에서 받아 사용하였을 경우엔 레지스트리 정보도 기입하도록 되어 있어, 이후 기술 변화 시에 레지스트리도 참고할 수 있게 하였다.

    또 다른 특징은 정보의 범위에 대한 메타데이터(16 Coverage) 항목이다. 우리나라 표준의 경우, 기록의 내용을 간결하게 설명하는 메타데이터인 ‘주제어’ 요소가 존재하는데 호주 메타데이터 표준의 경우, 주제어를 나타내는‘17 Keyword’ 항목 뿐 아니라, ‘16 Coverage’ 항목을 두어 좀 더 구체적으로 기록의 내용을 표현할 수 있도록 하였다. ‘16 Coverage’의 하위요소로는 사법권의 범위를 나타내는 ‘16.1 Jurisdictional Coverage’, 기록의 시간적 범위를 나타내는 ‘16.2 Temporal Coverage’, 그리고 기록의 지리적 범위를 나타내는 ‘16.3 Spatial Coverage’가 있다. 이러한 메타데이터를 통하여 기록의 맥락적 정보를 추가할 수 있게 하였고, 이 후 검색 시스템에서 이러한 정보를 활용한 조건 검색을 통해 검색의 성능을 향상시킬 수 있다.

       4.3 보존 메타데이터를 위한 PREMIS 데이터 사전 버전 2.0(Data Dictionary for Preservation Metadata Version 2.0)

    OCLC와 RLG는 공동으로 PREMIS(Preservation Metadata: Implementation Strategies) 실무그룹을 조직하여 2003년부터 전자기록의 보존을 위해 메타데이터가 어떻게 사용되고 있는지 연구하기 시작하였다. 디지털 아카이브의 운영 현황과 유형, 정책, 메타데이터의 실행 등을 파악하고 이를 토대로 디지털 보존을 위한 데이터 사전을 2005년 5월 발행하였다. 『보존 메타데이터를 위한 데이터 사전: PREMIS 워킹그룹 최종 보고서』(『Data Dictionary for Preservation Metadata: Final Report of the PREMIS Working Group』)의 발표 이후 계속해서 실행성과 상호운용성에 초점을 맞추어 연구가 진행되었고, 마침내 커뮤니티와 전문가의 피드백을 받아 개선시킨『보존 메타데이터를 위한 PREMIS 데이터 사전 버전 2.0』(『PREMIS Data Dictionary for Preservation Metadata version 2.0』)을 2008년 3월 발표하게 되었다(PREMIS Editorial Committee 2008).

    전자정보의 장기 보존을 위한 가장 종합적이고 포괄적인 메타데이터 요소 스키마로 받아들여지고 있는 PREMIS 데이터 사전은(오삼균, 권기성 2007) 상위요소(1단계) 아래 최소 2단계에서 최대 4단계까지의 하위요소가 구조적으로 존재하며, 최상위요소는 모두 13개의 카테고리로서, 구체적 내용은 다음 <표 4>와 같다.

    이상의 메타데이터 요소 중 디지털이미지 기록을 고려했을 때 우리나라 메타데이터 표준에서 참고할 만한 메타데이터 요소를 자세히 살펴보면 다음과 같다. 먼저, ‘1.4 중요 속성(Significant Properties)’으로, 해당 기록에서 중요하다고 여겨지는 속성을 기술하는 메타데이터이다(<표 5> 참조). 필수적 요소는 아니며, 기록관리자 입장에서 해당 기록의 관리를 위하여 중요하다고 생각하는 속성을 선택하여 입력할 수 있다. 특히, 이 요소는 필요에 따라 특성을 추가할 수 있기 때문에 PREMIS 데이터 사전의 확장가능성(Extensibility)을 보여준다고 할 수 있다. 예를 들어, 다음과 같이 입력이 가능하다.

    significantPropertiesType=“page count”

    significantPropertiesValue=“10"

    따라서 해당 메타데이터 요소를 통하여 이미지 정보에서 중요하다고 생각되는 속성을 추가하여 기술할 수 있다. 예를 들어, 아래와 같이 입력할 수 있다.

    significantPropertiesType=“appearance”

    significantPropertiesValue=“color”

    두 번째 특징은 호주의 기록관리 메타데이터 표준(Recordkeeping Metadata Standard)과 마찬가지로 객체 자체를 자세하게 설명하는 메타데이터와 함께 소프트웨어와 하드웨어를 포함한 환경적 요소를 기술하는 메타데이터이다(<표 7> 참조). 파일포맷의 버전, 파일의 크기, 소프트웨어의 생산자와 소프트웨어명, 소프트웨어 버전, 소프트웨어의 유형, 하드웨어 생산자, 하드웨어의 모델 등 해당 전자기록물의 충분한 메타데이터를 통해, 이 후 이미지 기록의 기술적 환경이 변화하여도 참고 할 수 있도록 하였다.

    5. 디지털이미지 기록의 특징 및 사례 분석

    본 논문에서 제시하고자 하는 메타데이터요소 설계와의 직접적인 연관성은 부족하지만, 디지털 이미지 기록의 특징 및 사례분석에 대한 이해는 필요한 요소 제안에 대한 간접적인 도움을 줄 수 있다.

       5.1 디지털이미지 기록의 특징

    디지털이미지 정보는 텍스트나 소리, 영상이 아닌 형태의 정보로, 사진, 그림, 도면, 지도, 만화 등이 포함될 수 있다. 그 중, 공공기관에서 주로 찾아볼 수 있는 형태의 이미지 정보로는 사진, 조감도, 도면, 지도 등이 있다. 이러한 이미지 정보는 다른 형태의 정보와는 차별화되는 특징들을 가지고 있다.

    먼저, 텍스트 정보에서는 찾아볼 수 없거나 다른 형태의 정보에서는 중요하게 여겨지지 않는 형태적 특성을 지니고 있는 데, 예를 들어 이미지의 사이즈, 해상도, 색공간 등이 포함된다. 이러한 정보의 경우 텍스트 정보에서는 거의 중요하게 여겨지지 않지만, 이미지 정보의 경우 출력 시 혹은 컨버젼(conversion), 이전(migration) 등 보존처리 과정에서 활용될 수 있다. 특히 도면이나 지도의 경우 축척이 중요하게 여겨질 수 있는데, 도면이 복사 또는 촬영 등에 의해 축소 또는 확대되는 경우에 대비하여 해당 축적의 표현이 필요하다.

    또한, 이미지 정보에는 고유한 파일 형식이 존재한다. 주로 사진이나 그림의 경우 JPEG(*.JPG)와 BMP(*BMP, *.RLE)가 일반적으로 많이 사용되며 Acrobat PDF(*.pdf), TIFF(*.TIF), PNG(*.PNG), CompuServe GIF(*.GIF) 등도 널리 알려져 있다. 반면 도면의 경우엔 dwg, dxf 등의 CAD파일이 사용되기도 한다(Wikipedia). 그러나 정보의 내용은 순수 이미지이지만, 텍스트 파일 형식(*.hwp)이나 그 외의 파일 형식(*.xls 등)으로 저장되어 제공되는 경우도 찾아볼 수 있다.

    이와 같이 고유한 파일 형식이 존재하는 만큼 이미지 정보의 생성 소프트웨어와 이미지 정보를 이용할 수 있게 해주는(readable) 소프트웨어 정보가 중요하다. JPEG이나 BMP파일의 경우 기본적으로 특정 소프트웨어 없이 Microsoft window의 기본 프로그램을 통해서 확인이 가능하지만, CAD 파일의 경우는 특정 소프트웨어를 통해서만 확인이 가능하기 때문에 기록관리 및 이용 측면에서 보았을 때 이와 관련된 구동환경에 대한 정보가 필요하다. 또한 기술 발전에 따라 기존 소프트웨어의 업그레이드 및 새로운 소프트웨어의 등장 그리고 기존 기술의 쇠퇴가 끊임없이 이루어지고 있기 때문에 장기적 이용가능성 관점에서도 이러한 기술적 정보들을 계속 업데이트 해주는 것이 중요하다.

    또한 이미지 정보는 텍스트를 포함하고 있지 않기 때문에 현재의 텍스트 기반 검색에 있어서의 정확성과 효율성이 높지 않은 실정이다. 따라서 이용가능성을 높이기 위해서는 이미지를 잘 설명하는 메타데이터가 필요하다.

       5.2 디지털이미지 기록 사례분석

    공공기관에서 사용되는 디지털이미지 기록의 속성을 반영한 메타데이터를 설정하기 위해 실제로 공공기관에서 제공하고 있는 디지털이미지 기록의 특징을 살펴보았다.

    먼저 국가기록원의 나라기록포털에서 이미지 기록을 검색하여 살펴보았으며, 다음으로 한국철도시설공단의 공개자료실에 있는 이미지 자료를 검색하였다.

    국가기록원의 소장자료는 크게 일반문서류, 시청각류, 행정박물류, 간행물류로 나누어 볼 수 있으며(<표 8> 참조), 이 중 일부를 디지털화하여 나라기록포털을 통해 공개하고 있다. 주로 온라인을 통해 공개되고 있는 이미지 정보는 현재 공공기관에서 사용되는 현용 기록물이라기보다는 역사적 사료의 성격이 강하며, 대부분의 경우 이미지 정보에의 온라인 접근이 차단되어 있었다. 또한 이미지 파일 형식을 바로 다운받을 수 있는 것이 아니고, 해당사이트에서 제공하는 특정 뷰어를 통해서만 한정적으로 이미지에 접근할 수 있었기 때문에 디지털이미지 기록의 특징을 파악하는데 어려움이 있었다.

    다음의 <그림 1>은 나라기록포털에서 ‘독도 지도’를 검색하여 접근하게 된 이미지이다. 내용은 지도이지만 사진으로 찍은 이미지 형태이고, 지도 정보에서 중요한 축척 정보뿐 아니라 여타 정보들이 자세히 표시되어 있지 않아 해당 이미지 정보에 대하여 파악하는 데에 어려움이 있다.

    공공기관에서 사용되는 이미지 기록의 사례를 살펴보기 위해 한국철도시설공단의 공개자료실에 공개되어 있는 이미지 자료를 검색하였다. 이미지 자료는 여러 메타데이터를 활용하여 검색하거나 브라우징 할 수는 없었지만, 나라기록포털과는 달리 파일을 다운받을 수 있었다. 따라서 원본의 내용이 훼손될 위험성이 있었으며, 진본성을 유지하기 위한 메타데이터가 필요함이 확인되었다.

    검색 결과 평면도, 조감도, 지도, 사진 등 다양한 이미지들이 제공되고 있었으며, 평면도, 배선도 등은 CAD 파일 형식으로, 조감도 등은 JPEG, HWP 등으로 제공되고 있었다. 그 외에도 Microsoft Office PowerPoint 및 Excel 형식 등 다양한 파일 형식을 통해 이미지 정보를 제공하는 것을 확인할 수 있었다.

    반면, 이미지의 제목과 간단한 내용 설명을 제외하고는 이미지를 설명하는 메타데이터를 전혀 찾아볼 수 없어 디지털이미지의 이용과 기록 관리에 있어서의 어려움이 있을 것으로 예상되었다.

    6. 디지털이미지 기록관리를 위한 메타데이터 요소

    공공기관에서 생산되는 디지털이미지 기록의 신뢰성, 진본성, 이용가능성을 보장할 수 있는 메타데이터 요소를 제안함에 있어 다음과 같은 사항들을 원칙으로 하였다.

    첫째, 2007년 국가기록원에서 발표한 기록관리 메타데이터 표준을 기준으로 한다. 이 표준의 프레임을 바꾸지 않고 본래의 구조에 디지털이미지 기록관리를 위한 메타데이터 요소를 확장하거나 수정하는 방식을 사용한다.

    둘째, 이미지 기록의 특성을 반영한다. 실제로 사용되고 있는 디지털이미지의 사례를 조사한 후, 이를 토대로 메타데이터 요소를 추가한다.

    셋째, 국제적으로 기록관리에 있어서 선진적이라는 평을 받고 있는 호주의 기록관리 메타데이터 표준과, 종합적인 보존 메타데이터로 평가 받고 있는 PREMIS 데이터 사전을 참고로 한다. 이 두 표준은 최근에 개정이 되었기 때문에 발전이 빠르게 이루어지는 기술 환경과 전자 기록의 성격을 잘 반영한 것으로 평가된다.

       6.1 포맷(Format) 요소의 확장

    국가기록원에서 발표한 기록관리 메타데이터 표준에서 수정, 확장된 메타데이터 요소는 크게 네 가지 요소로 다음과 같다.

    먼저 기존의 '7. 포맷 (Format)’요소에 ‘데이터포맷 버전 (Data Format Version)’을 추가한다. 장기적 기록관리의 관점에서, 기술 쇠퇴나 새로운 버전의 데이터 포맷의 등장 등을 대비하여 새로운 데이터 포맷으로 이전하거나 데이터 포맷 내의 이미지 정보 확인이 어려울 경우 참고할 수 있도록 하는 것이다. 예를 들어, DOC포맷(Microsoft Office Word 97-2003 문서)과 DOCX포맷(Microsoft Office Word 2007 문서)처럼 데이터 포맷명을 통해 그 버전을 어느 정도 확인할 수 있는 경우도 있지만, 확인이 불가능한 경우가 많기 때문에 따로 데이터 포맷 버전 요소를 추가하도록 하였다. 버전에 대한 정보는 호주의 기록관리 메타데이터 표준과 PREMIS 데이터 사전에서도 모두 기록하도록 권장하고 있다.

       6.2 중요 속성(Significant Properties) 요소의 추가

    두 번째로, ‘중요 속성(Significant Properties)’의 추가이다. ‘중요 속성’은 PREMIS 데이터 사전에서 해당 기록에서 중요하다고 여겨지는 속성을 필요에 따라 입력할 수 있도록 마련해 놓은 메타데이터 요소로, 이미지의 종류에 따라 필요한 속성들을 추가해서 메타데이터를 생산할 수 있기 때문에 유용하게 사용될 수 있다. 특히 지도, 설계도, 모형도, 그래프, 사진 등 이미지 종류에 따라 기술할 필요가 있는 속성의 종류가 다양하므로, 필요에 따라 확장할 수 있게 하였으며, 반복사용 가능하도록 한다. 예를 들어, 중요 속성으로는 해상도, 축척, 색공간, 이미지의 수 등이 포함될 수 있다. 자세한 사항은 아래 <표 10>과 같다.

       6.3 환경(Environment) 요소의 추가

    세 번째로 추가될 사항은 ‘환경(Environment)’요소이다. 이는 기록의 생산 소프트웨어와 하드웨어와 관련된 기술환경적 요인을 기록하도록 하는 메타데이터 요소로, 호주 기록관리 메타데이터 표준에서는 생산 어플리케이션과 그 버전을 기입하도록 하였다. PREMIS 데이터 사전에서는 소프트웨어 뿐 아니라 하드웨어와 관련된 일련의 사항들을 자세히 기입하도록 권장하고 있다. 우리나라 기록관리 메타데이터 표준에서는 ‘13. 보존(Preservation)’요소에서 하드웨어 플랫폼 이전, 소프트웨어 이전에 관한 사항 등은 기록하도록 되어 있지만, 생산 환경에 대한 언급은 찾아볼 수 없다. 따라서 기술 환경의 변화에 대비하여 이러한 메타데이터를 확장시켜 기록하고 관리할 필요가 있다. 자세한 메타데이터 하위요소는 <표 11>과 같다.

       6.4 범위(Coverage) 요소의 추가

    마지막으로 추가할 요소는 ‘범위(Coverage)’이다. 이는 기록물의 내용 및 맥락 정보와 관련된 메타데이터 요소로, 텍스트가 없거나 텍스트를 확인할 수 없어 검색 결과가 좋지 않았던 색인어 기반 검색 시스템에서 디지털이미지 기록의 범위를 메타데이터를 통해 한정해 줌으로써 검색 성능을 향상시킨다. 또한 기록내용의 범위를 미리 파악할 수 있게 하여 디지털이미지 기록의 이해와 이용을 돕는다. 범위는 크게 ‘시대적 범위(Temporal Coverage)’와 ‘공간적 범위(Spatial Coverage)’로 나누어 볼 수 있다. 이러한 기록의 범위에 대한 메타데이터는 호주 기록관리 메타데이터 표준에서도 찾아볼 수 있다.

    7. 결론

    전자기록의 생산과 이용이 보편화되었으나, 전자기록 관리에 대한 국내의 사회적 관심과 제도적 뒷받침은 미약한 상태이다. 2007년 국가기록원은 기록관리 메타데이터 표준안을 제정하여 기록의 신뢰성, 진본성, 무결성, 이용가능성을 보장하고자 노력하고 있다. 그러나 해당 표준은 다양한 형태의 기록물을 포괄하기에는 한계점을 보이고 있어 수정이 필요한 것으로 판단된다.

    이에 본 연구에서는 디지털이미지 기록을 대상으로 선정하여, 그 특성을 반영한 메타데이터 요소들을 제안하였다. 이를 위하여 한국철도시설공단의 공개자료실과 국가기록원의 나라기록포털 검색시스템을 통해 인터넷에서 공개되고 있는 디지털이미지 정보를 검색해보고, 제공되는 이미지의 종류와 그 특성들을 살펴보았다.

    다음으로, 호주의 국가기록원 메타데이터인 『Australian Government Recordkeeping Metadata Standard Version 2.0』과 PREMIS 데이터 사전을 참고로 이미지 정보의 기술을 위해 필요한 메타데이터들을 추출하였다. 이상의 두 메타데이터 표준은 모두 최초의 버전이 제정된 이후, 피드백을 바탕으로 2008년 개정되었기 때문에 현재의 기술적 상황 및 기록관리 실정을 더욱 잘 반영하고 있다고 평가할 수 있다.

    이러한 분석 결과를 종합하여 최종적으로 국가기록원 기록관리 메타데이터 표준을 수정, 확장하였다.

    제안된 메타데이터 수정안은 다음과 같다.

    첫째, 기존 '7. 포맷 (Format)’ 요소의 확장이다. 하위요소로, 'Data Format Version(데이터포맷버전)'을 추가하여 기록관리의 과정에서 참고할 수 있도록 하였다.

    둘째, '중요 속성(Significant Properties)'요소의 추가이다. 이미지기록의 다양한 속성을 상황과 필요에 맞게 기술할 수 있도록 확장 가능한 메타데이터 요소를 추가하였다. 이를 통해 기존의 메타데이터에 포함되어 있지 않은 이미지 기록의 특징을 기술할 수 있게 되었으며, 이용과 기록관리 과정에서 참고할 수 있게 되었다.

    셋째, '환경(Environment)' 요소를 추가하였다. 소프트웨어와 하드웨어 정보를 추가하여 기술 쇠퇴나 기술 이전 등에 대비할 수 있게 하였다.

    넷째, '범위(Coverage)' 요소의 추가이다. 이미지 기록의 내용과 맥락적 정보를 추가함으로써 이미지 기록의 이해를 돕고, 무엇보다 범위의 선택적 검색을 통해 검색 성능을 향상 시킬 수 있게 하였다.

    추가된 메타데이터 요소 중 '데이터포맷 버전'이나, '소프트웨어 및 하드웨어 정보' 등 기록물의 자세한 기술적, 환경적 정보는 전자 기록의 관리와 장기적 보존이라는 관점에서 추가된 메타데이터 요소로, 기존의 검색 성능을 향상시키기 위해 개발된 메타데이터에서는 찾아보기 힘든 요소라 할 수 있다. 특히, '환경'에서는 디지털이미지를 포함한 전자기록물이 갖는 가변성과 취약성을 보완하기 위하여 소프트웨어 및 하드웨어의 변천 이력을 기술함으로써 장기적인 디지털 보존이 가능하도록 지원하였다. 또한 '범위'와 '중요 속성'의 추가를 통해 기록물의 이용성과 검색 효율성도 높일 수 있도록 시도하였다.

    본 연구에서는기록관리 관점에서 디지털이미지 기록의 신뢰성,진본성,이용가능성을 보장할 수 있는메타데이터를 제안하였다. 그러나 제안된 메타데이터 요소의 타당성을 높이기 위해서는실제로 현장에서 적용해본 후 피드백을 받아서 수정하는과정을 거쳐야 한다. 또한 향후 기록관리 메타데이터 표준이 모든 형태의 기록을 포괄할 수 있는효과적인 표준으로 자리매김하기 위해서는이미지 기록뿐 아니라 비디오 자료,오디오 자료,전자메일 등 다양한 형태의 정보를 수용할 수 있는메타 데이터의 지속적인 개발도 필요할 것이다.

  • 1. 2007 기록관리 메타데이터 표준 -현용·준현용 기록물 용- google
  • 2. 나라기록포털 google
  • 3. 곽 정 2007 현용·준현용 단계의 기록관리를위한 메타데이터 [기록학연구] P.3-37 google
  • 4. 김 용, 김 늘봄, 이 태영 2008 이메일기록관리를 위한 메타데이터 표준요소 선정에 관한 연구 [정보관리학회지] Vol.25 P.87-112 google
  • 5. 김 효원, 윤 용익 2008 이미지자료에 대한 디지털아카이브 워크플로우와 메타데이터에 대한연구 [한국정보과학회 가을 학술발표논문집] Vol.35 P.82-85 google
  • 6. 김 희정 2003 디지털 아카이빙 최근 연구동향 및 OAIS 참조모형에 관한 연구 [한국기록관리학회지] Vol.3 P.23-42 google
  • 7. 설 문원 2004 행정기관의 기록관리 메타데이터 요소 분석-ISO 15489를 기준으로- [한국비블리아] Vol.15 P.217-241 google
  • 8. 오 삼균, 권 기성 2007 전통예술자료 아카이빙을 위한 보존 메타데이터 설계에 관한 연구 [한국문헌정보학회지] Vol.41 P.387-412 google
  • 9. 이 정연 2009 구술사 기록물 아카이브 구축을 위한 메타데이터 모델링 및 표준 요소 개발에 관한 연구 [정보관리학회지] Vol.26 P.163-184 google doi
  • 10. 최 상미, 리 상용 2007 현용전자기록물의 메타데이터 요소에 관한 연구 [한국기록관리학회지] Vol.7 P.39-60 google
  • 11. 홍 재현 2005 디지털 정보자원을 위한 보존 메타데이터 요소 설정 연구 [한국도서관·정보학회지] Vol.35 P.175-204 google
  • 12.
  • 13. 2005 Whitepaperon ISO 15489 - Records Management google
  • 14.
  • 15. 2008 Australian Government Recordkeeping Metadata Standard Version 20 google
  • 16. 2009 Understanding PREMIS google
  • 17. 2008 PREMIS Data Dictionary for Preservation Metadata version 20 google
  • 18.
  • 19. Tough Alistair, Moss Michael 2006 Record Keeping in a Hybrid Environment P.12 google
  • [<표 1>] 국가기록원 메타데이터 표준 상 하위요소
    국가기록원 메타데이터 표준 상 하위요소
  • [표 2] 유형과 포맷 메타데이터 요소의 적용 예시
    유형과 포맷 메타데이터 요소의 적용 예시
  • [<표 3>] 호주 Recordkeeping Metadata Standard Version 2.0 상.하위요소
    호주 Recordkeeping Metadata Standard Version 2.0 상.하위요소
  • [<표 4>] 보존 메타데이터를 위한 PREMIS 데이터 사전 버전 2.0 상위요소
    보존 메타데이터를 위한 PREMIS 데이터 사전 버전 2.0 상위요소
  • [표 5] 1.4. 중요 속성(significantProperties)의 구성
    1.4. 중요 속성(significantProperties)의 구성
  • [표 6] 1.5 객체 특성(objectCharacteristics)의 구성
    1.5 객체 특성(objectCharacteristics)의 구성
  • [표 7] 1.8. 환경(environment)의 구성
    1.8. 환경(environment)의 구성
  • [<표 8>] 국가기록원 소장자료 현황
    국가기록원 소장자료 현황
  • [그림 1] 국가기록원 나라기록포털의 이미지 검색결과 예시: 원문정보 - 독도지도
    국가기록원 나라기록포털의 이미지 검색결과 예시: 원문정보 - 독도지도
  • [그림2] 국가기록원 나라기록포털의 이미지 검색결과 예시:상세정보-독도지도
    국가기록원 나라기록포털의 이미지 검색결과 예시:상세정보-독도지도
  • [그림 3] 한국철도시설공단의 이미지 검색결과 예시:경의선1공구 위치도
    한국철도시설공단의 이미지 검색결과 예시:경의선1공구 위치도
  • [표 9] ‘ 7. 포맷(Format)’ 요소의 확장
    ‘ 7. 포맷(Format)’ 요소의 확장
  • [표 10] ‘중요 속성(Significant Properties)’ 요소의 추가
    ‘중요 속성(Significant Properties)’ 요소의 추가
  • [표 11] ‘환경(Environment)’ 요소의 추가
    ‘환경(Environment)’ 요소의 추가
  • [표 12] ‘범위(Coverage)’ 요소의 추가
    ‘범위(Coverage)’ 요소의 추가