여러 소스에 출현하는 관측분야의 과학데이터가 OpenURL 서비스 아키텍처에서 원활하게 유통되도록 하기 위해, OpenURL 소스와 서비스 구성요소간 상호운용성 확보를 할 수 있도록 Key/Encoded-Value(KEV) 형식으로 OpenURL 핵심 메타태그를 제안하였다. 현재의 OpenURL은 문헌위주의 학술정보 유통에 그 초점이 맞추어져 있으며, 과학데이터 유통을 위한 메타태그는 제공하지 못하고 있다. 과학데이터 기술을 위한 DataCite 컨소시엄의 메타데이터 요소를 기준으로 하고, 더블린 코어의 핵심 메타데이터 요소, 데이터세트와 테이블을 인용하기 위해 OECD에서 만든 메타데이터 요소, 지구관측 분야의 메타데이터 표준인 DIF 메타데이터 요소를 비교, 분석하여 관측분야의 과학데이터를 위한 OpenURL핵심 메타태그를 도출하였다.
과학 연구자가 수행하는 연구 패러다임이지속적으로 변하여 최근에는 데이터가 연구의중심이 되고 있다. Green(2009)은 데이터 수집이 연구의 대부분이라고 주장하였으며 학위논문이나 저널 논문, 단행본도 데이터 없이는쓰일 수 없음을 강조하였다. 인터넷 이전에는데이터를 손쉽게 얻는 것이 불가능 하였지만,1995년 이후 인터넷이 활성화되고 최근 들어 하드웨어의 눈부신 발전과 고성능 네트워크,센서장비의 확산이 여러 분야에서 다양한 포맷의 데이터를 발생시키고 있다. 따라서 도서관이나 정보센터는 연구자들의 새로운 연구 패러다임을 지원하기 위하여 기존의 학술논문이나 특허, 연구보고서 중심의 서비스에 데이터1) 서비스를 추가 확대할 필요가 있다.
도서관이나 정보센터에서 데이터 서비스를 추가하는 것은 문헌위주의 과학기술정보 서비스 체계를 구성하는 각각의 구성요소가 관찰/실험 데이터도 처리할 수 있게 확장되어야 함을 의미한다. 과학데이터 관련 서비스를 확대하는 데 있어 OCLC(2005)의 보고서가 지적한사항을 고려해야 한다. 그 보고서에 따르면 학술연구자들의 1%만이 기관에서 제공한 OPAC을 활용한 서비스를 이용하고 있으며, 연구자들의 90%는 검색포털 엔진(예: 구글, 야후 등)이나 이메일 등을 검색의 접점으로 이용하는 것을 알 수 있다. 이 결과는 연구자들이 선호하는정보 접근 방식을 연구자 소속 기관이 충분히검토 수용해야 함을 시사하고 있다. 다시 말하면, 연구자들이 접점으로 사용하고 있는 서비스와 연구자의 상황을 분석하여 최적의 서비스를 제공할 수 있도록 서비스 구성요소 간 상호운용성 확보가 중요하다. OpenURL2)은 이런 환경에서 연구자의 상황을 인지하여 서비스 할 수 있는 적절한 해결책 중 하나가 될 수있다. 그러나 현재의 OpenURL은 학술정보유통에 그 초점이 맞추어져 있으며, 과학데이터 유통을 위한 메타태그는 제공하지 못하고있다.
본 연구에서는 메타태그나 데이터 기반을 알기 위해 NISO OpenURL Version 0.1과 2004년 NISTO AX위원회에서 표준으로 제정한Z39.88-2004를 검토하였다. 과학데이터 기술을 위한 DataCite3) 컨소시엄의 메타데이터 요소를 기준으로 하고, Dublin Core(이하 DC)의 핵심 메타데이터 요소, 데이터세트와 테이블을 인용하기 위해 개발된 OECD 메타데이터 요소, 지구관측 분야의 메타데이터 표준인Directory Interchange Format(이하 DIF)메타데이터 요소를 비교 분석하여 관측분야의과학데이터를 위한 OpenURL 핵심 메타태그를 Key/Encoded-Value(KEV) 형식으로 제안하였다.
1) 연구자가 연구과정을 통해 생성한 모든 데이터는 연구데이터(Research Data)와 과학데이터(Scientific Data)로불린다. 본 논문에서는 이를 혼용하여 사용한다.
2) Herbert Van de Sompel(http://public.lanl.gov/herbertv/) 박사에 의해 주창된 것으로 학술정보에 대한 서지사항을 표준 된 포맷으로 전송하기 위해 파라미터(예를 들어 서명, 저자명, 시작페이지 등)를 정의하였다. 초기 버전은 0.1 버전으로 현재까지도 가장 많이 사용되고 있으며, NISO에 의해 OpenURL 1.0이 2004년에 표준(Z39.88-2004)으로 제정되었다.
3) DataCite는 국제적인 컨소시엄으로서 2010년 8월 말 현재, 9개국에서 12개 기관이 참여 중이며, DOI(Digital Object Identifier)가 부여된 80만 건 이상의 레코드를 확보하고 있다. DataCite는 과학데이터에 DOI를 부여하는에이전시 역할을 수행하고 있다(김선태 외 2010, 87).
데이터 중심의 제 4세대 R&D 패러다임이도래하면서 과학데이터에 대한 관심이 급증하고 있으며, 과학데이터에 대한 보존, 공유, 재사용에 대한 연구가 활발하게 진행되고 있다.특히, 메타데이터 통합관리를 위한 표준화, 데이터에 영속적 접근제공 방법, 데이터의 인용에 관한 연구가 활발하게 진행되고 있다. 이를 하나씩 살펴보면 아래와 같다.
첫째, 분야별로 과학데이터에 대한 표준화를 주도하고 데이터를 공유하는 움직임이 활발하게 전개되고 있다. 특히 학제 간 연계?융합 연구를 위해서 이질적인 메타데이터를 의미적으로 통합하여 연구자들이 관련된 데이터를 동시에 검색하고 발견할 수 있도록 하는 서비스의 개발이 필요하게 되었다. 둘째, 발생된 데이터에 대한 영구적 접근을 제공하기 위해 데이터식별자 부여에 대한 관심이 급증하고 있다. 국제적인 데이터 공유와 접근을 위해 독일의 국가과학기술도서관(TIB)에서 운영대행을 하고있는 DataCite 컨소시엄이 구성된 것도 바로 이러한 이유에서이다. 셋째, 데이터의 인용을 위한 표준 포맷에 관한 연구도 활발하게 진행 중에 있다. DataCite는 과학데이터를 기술하기위한 스키마를 최근에 발표하였으며, 데이터인용을 위한 핵심 요소와 그 형식을 제안하였다. OECD의 경우도 데이터세트와 테이블이인용되기 위한 핵심 요소와 그 형식을 제안하였으며, DIF의 경우도
과학데이터와 관련하여 출판업계의 움직임도 활발하다. ALPSP5)(2008)의 3번째 보고서에 따르면 전 세계의 과학?기술?의료 분야의 400개 출판사를 대상으로 조사한 결과160개(45%) 출판사가 그들이 발행하는 저널의 논문과 관련되어 있는 데이터로의 접근을 제공하고 있다. 한 가지 사례를 보면 ‘임상조사저널(Journal of Clinical Investigation)’의 경우 1999년부터 2009년까지 데이터가 딸린 논문의 양이 0%에서 87%로 늘었으며, 2010년엔 거의 100%에 이른다(Joan Starr, Angela Gastl 2011, 1). 이러한 조사결과는 학술정보유통에서 연구데이터의 중요성이 심화되어 가는 것을 의미한다. 또한 관련 커뮤니티에서 연구데이터 이용의 활성화를 준비해야 함을 시사한다.
연구패러다임의 변화 속에서 범지구적 문제의 해결을 위한 이해와 요구가 데이터를 중심으로 한 연구를 만들어 내고 있다. 특히 기후변화, 황사, 해양 오염 등 지구적 문제해결을 위해 많은 연구자들이 과학데이터를 공유하고 있으며, 대형 장비의 공동 활용을 시도하고 있다.예를 들어 휴먼 게놈 연구 결과의 공유 등이 그러하다. 이러한 글로벌 동향의 중심에 과학데이터가 있다. 과학데이터란 연구자의 연구활동 과정 중 생성되는 다양한 유형의 사실적 기록을 의미한다. 즉, 연구 활동을 통하여 생산된 연구 활동의 기록물로서 관측, 감시, 조사,실험, 분석, 계산 등의 과정을 통하여 생산된문자, 이미지, 오디오, 동영상 등의 아날로그 및디지털 형식을 포괄하는 데이터라고 종합하여정의할 수 있다. 따라서 그 형식이 복잡하고 널리 배포되며 범위가 넓은 것이 큰 특징이다. 또한 자료의 크기 또한 다양하다. 과학 분야의 대표 학술지인 Science는 최근 자매지 Science Signaling, Science Translational Medicine과함께 데이터의 홍수 속에서 부각되고 있는 여러 가지 이슈사항을 다루기 위해 연구데이터에 대한 특집호를 기획하여 발행하였다. 해당 호에는 과학데이터에 대한 설문조사 결과가 포함되어 있다. 내용은
[표 1] 국내 지구 관측 분야별 자료형식(이혜영 곽승진 2007 263 일부발췌)
국내 지구 관측 분야별 자료형식(이혜영 곽승진 2007 263 일부발췌)
그 크기가 다양하다. 1TB(TeraByte) 이상의대용량 데이터를 사용하는 연구자도 7.6%이며, 1GB(GigaByte) 미만의 데이터를 사용하는 연구자도 48.3%에 이른다.
관측분야의 과학데이터가 생산되는 자료형식은 관측분야와 관측요소에 따라 그 형태가매우 다양하다. <표 1>은 국내 지구 관측 분야별 자료형식 일부를 나타낸 것이다.
4) 본 논문에서는 가독성을 위해 모든 메타데이터 요소는 ‘ ? ’과 ‘ ? ’ 기호로 쌓아 표현한다.
5) ALPSP(The Association of Learned and Professional Society Publishers)는 1972년에 설립된 국제적 비영리 출판사 협회이다. 2011년 1월 현재, 36개국에서 360개 이상의 멤버가 가입되어 활동하고 있다. 멤버들은1만종 이상의 저널을 발행하고 있으며, 단행본과 보고서, 데이터베이스를 발행하고 있다(web-00001).
범용적인 OpenURL 핵심 메타태그를 개발하기 위하여 과학데이터 기술을 위한 DataCite 컨소시엄의 메타데이터 요소를 기준으로, DC의 핵심 메타데이터 요소와 데이터세트와 테이블을 인용하기 위해 개발된 OECD 메타데이터요소, 지구관측 분야의 메타데이터 표준인 DIF 메타데이터 요소를 중심으로 조사하였다.
DataCite는 국제적인 컨소시엄으로서 2011년 1월 말 현재, 9개국에서 12개 기관이 멤버로 활동 중이며, 2개 기관이 협력멤버로 참여중이다. DOI(Digital Object Identifier)가 부여된 80만 건 이상의 레코드를 확보하고 있으며, 과학데이터에 DOI를 부여하는 역할을 수행하고 있다. 2010년 8월 DataCite는 메타데이터 커널(버전 1.1)을 발표하였다. 이것의 주요한 기능은 크게 4가지로 요약할 수 있다. 첫째, DOI 등록을 위해 필요한 최소한의 요소를이용해 데이터세트를 인용하는 표준을 제시하는 기능, 둘째, 데이터 관리를 위한 다양한 스키마들과 상호 운용성 확보 기능, 셋째, 다른자원과의 관계를 기술하는 것과 같이 데이터에 대한 융통성 있는 기술이 가능하도록 부수적인 요소를 제공함으로써 데이터세트의 발견이 더욱 용이하도록 하는 기능, 넷째, 용어의 통제어 리스트 사용이나 표준 어휘집 사용을 통해 미래 서비스를 준비하는 기능으로 구분된다(Joan Starr, Angela Gastl 2011).
DataCite 메타데이터 스킴의 핵심 속성은 데이터세트의 인용을 위해 준비된 5개의 요소로서
더블린 코어(Dublin Core, 이하 DC)는 ISO 15836으로 표준화된 메타 데이터요소 집합이다. DC의 가장 큰 장점인 단순성, 확장성, 구문독립성과 같은 특징 때문에 동영상, 소리, 이미지, 텍스트, 웹 페이지 등의 디지털 매체들을 기술하는 데 널리 사용되고 있다. 많은 분야에서 메타데이터의 상호 운용성 확보를 위해 연계테이블(Crosswalks)을 작성 할 때 그 기준점으로 DC를 사용하는 것이 그 이유이다. DC의 목표는 데이터의 형식과 구조를 단순화하
[표 2] DataCite 스킴에 누락된 DC의 주요 요소
DataCite 스킴에 누락된 DC의 주요 요소
여 원문의 저자나 발행자가 메타데이터를 직접 작성하고, 이를 바탕으로 특정분야에서 요구되는 수준으로 확장하여 사용할 수 있도록하는 것이다. 단순하고 확장 가능한 것이 큰 장점으로 인정되는 반면 디지털도서관, 교육매체관리 등과 같은 응용 영역에는 데이터 요소가부족하다는 비판이 있지만 단순한 구조의 시스템 개발, 교환 및 통합용 메타데이터, 응용프로파일 개발의 기본 메타데이터로 활용되고 있어 유용성이 매우 많다. DC 표준에는 두 가지 단계가 들어 있다. 하나는 단순 더블린 코어로 15개의 요소로 이루어져 있고, 다른 하나는한정적 더블린 코어로 기본 더블린 코어에 3개의 요소를 추가하고 요소가 적용되는 범위를 제한하기 위한 한정자(qualifier)를 추가한 것이다.
15개 기본요소 중
- DataCite 요소
- DataCite 요소와 기본요소 15개 중 14개와 추가요소 1개로 매핑이 가능함.
- coverage 요소는 관측분야의 데이터 요소에서 권고되는 항목으로 DataCite 요소로추가가 필요함.
<표 2>는 DataCite 스킴에 누락된 DC의 주요 요소와 그에 대응되는 후술할 DIF 요소이다.DC의
Toby(2009)는 데이터세트나 테이블을 출판, 표현, 인용하는 데 있어 표준적인 방법이 없음을 지적하였다. 심지어 OECD에서 만들어낸 같은 소스를 전혀 다른 방식으로 인용하고 있는 사례들을 들며 이를 위한 표준화 작업이 필요함을 강조하였다. 이러한 현상에 대한 이유로 Toby(2009)는 저자와 출판사가 데이터소스를 어떻게 인용해야 하는지 모른다는점을 들었다. 이러한 이유로 OECD 메타데이터 요소가 개발되었다. 인용을 위한 주요 메타데이터 항목을 기술한 것으로서 DataCite나 DC 데이터세트 보다 더욱 단순하게 구성되어있다.
데이터세트와 테이블을 출판하기 위한 OECD의 메타데이터 요소는 Altman과 King(2007)의 제안 요소 중
관측분야에서 표준으로 사용하고 있는 DIF(Directory Interchange Format) 포맷은 1987년 2월에 개최된 ESADS(Earth Science and Applications Data Systems Workshop)의 결과물로서 1988년 CI(Catalog Interoperability)과학자문위원회에서 최종 승인을 받아 채택되었다. 1989년 지구관측위성 위원회 데이터 워킹그룹(CEOS, Committee on Earth Observation Satellites Data Working Group)에서CI 워크숍에 적극적으로 참여하여 DIF구조에 많은 의견을 주었다. 이후 2004년 6월에 ISO 19115/TC211로써 표준으로 공표되었다. DIF포맷은 Entry_ID 등 8개의 필수 요소와 18개의적극 추천요소, 10개의 추천 요소로 구성되었다. 본 연구는 관측분야의 과학데이터를 위한 메타태그를 제안하는 것이 목적이기 때문에 관측분야의 메타데이터 기술 표준인 DIF에서 사용하는 요소가 반드시 고려되어야 한다. 아래<표 3>은 DIF에서 사용하는 요소 중 DataCite,DC, OECD에 포함되어 있지 않으면서, 과학데이터용 OpenURL 메타태그에 추가시킬 요소들을 정리한 것이다. 분석에 활용된 메타데이터 요소들의 샘플 데이터는
[표 3] DataCite 스킴에 누락된 DIF의 주요 요소
DataCite 스킴에 누락된 DIF의 주요 요소
4.1.1 KEV 메타데이터 형식
연구데이터를 위한 메타데이터 형식 개발이필요하다. 2011년 2월 현재 OpenURL Framework Registry에 등록된 메타데이터 형식은<표 4>와 같이 단행본, 학위논문, 저널, 특허, 서비스 타입이 전부이다. 연구데이터를 기술할수 있는 범용의 메타데이터 포맷을 개발하여레지스트리에 등록할 필요가 있다. 문헌위주의 학술정보를 기술하기 위한 4가지 포맷이 존재하지만 다양한 유형의 과학데이터를 기술하기위해서 레지스트리에 등록된 메타데이터 포맷은 없다. 따라서 다양한 유형의 과학데이터를 ContextObject에 기술하기 위해 두 가지 방법을 사용하고 있다. 그 중 한 가지 방법은 단행본용 메타데이터 포맷을 사용한다고 지정한 후 장르(genre) 키 값을 ‘unknown’으로 지정하거나, 전송하지 않고 제목과 저자 정보만으로ContextObject를 생성하는 것이다. 또 다른 방법으로 그 단순성과 명료성을 인정받은 DC 메타데이터 포맷을 사용하는 것이다. 이 방법은 DC의
[표 4] Key/Encoded-Value 메타데이터 포맷
Key/Encoded-Value 메타데이터 포맷
학술적 서비스 유형을 위한 key 구성
4.1.2 학술서비스 유형 형식 분석
다음으로 학술서비스 유형 형식의 확장이필요하다. 현재의 학술적 서비스 유형은 <표5>와 같이 총 6가지의 키로 구분되어 있다.
4.2.1 글로벌-식별자-영역(GLOBAL-IDENTIFIER-ZONE)
OpenURL에서 글로벌 식별자로 사용되는메타태그는 id이다. 이에 대한 메타 값은 글로벌 네임스페이스와 글로벌 식별자의 조합이다.현재 네임스페이스로 사용할 수 있는 것은 DOI(digital object identifier), pmid(PubMed identifier), bibcode(identifier used in Astrophysics Data System), oai(identifier used in the Open Archives initiative)이다(Herbert Van de Sompel 외 2000). 개별 과학데이터를 손쉽게 식별하기 위해서 ID는 필수적으로 사용되어야 한다. 과학데이터의 글로벌 유통을 위해서 DataCite는 과학데이터에 DOI를 부여하고 있기 때문에 과학데이터용 메타태그로서 id는 사용될 수 있으며, DOI 네임스페이스를 그대로 활용할 수 있다.
4.2.2 객체-메타데이터-영역(OBJECT-METADATA-ZONE)
OpenURL 메타태그 중 genre 태그의 값을 보면 개별 아이템의 묶음으로써 journal, book,conference를 제시하며, 개별 아이템으로서article, preprint, proceeding, bookitem을 제시하고 있다. 이것들은 문헌정보만을 위한 메타태그의 값들로서 본 논문에서 다루고 있는 과학데이터 용으로는 부적합하다.
메타태그 중 저자 관련 태그는
메타태그 중 식별자 정보를 제공하기 위한 태그로는
메타 값의 조합으로 개별 아이템을 식별할수 있는 태그로서
6) 관측분야 과학데이터의 유통을 위한 OpenURL 핵심 메타태그를 본 논문에서는 ORD(Observation Research Data) 메타태그라 한다.
5. ORD(Observation Research Data) 메타태그6)개발
관련 분야의 표준을 최대한 반영하고자 노력하였다. 특히 메타데이터 요소 비교의 기준으로 사용된 DataCite 메타데이터 요소를 거의 모두 수용하고자 하였다. 해당 분야의 전문가들이 연구현장의 의견을 반영하여 지속적인 갱신을 해오고 있는 DataCite, DC, OECD, DIF메타데이터 요소 하나하나에 대해서 그 용도와 가치를 판단하는 것은 불필요하다고 전제하였다. 다만 본 연구에서는 OpenURL 소스와 서비스 구성 요소간 상호운용성 확보를 할수 있도록 OpenURL 핵심 메타태그를 KEV형식으로 제안하는 것이기 때문에 OpenURL메타태그로 적합한 메타데이터 요소인지만 판단하였다. 다음은 ORD KEV 메타데이터 정의를 위해 준수한 설계방향이다.
- 데이터 인용을 위해 제시된 메타데이터 요소는 해당 분야 전문가들에 의해서 각고의 연구 노력으로 도출된 요소라고 전제(DataCite, OECD, DIF)
- 과학데이터 기술을 위한 최근 연구 동향을 반영하여 메타데이터 요소를 설계(DataCite)
- 관측분야 표준메타데이터의 필수요소와 적극 추천하는 요소는 해당분야의 전문가들에 의해서 오랜 시간 동안 검토되고 수정되어 제시된 메타데이터 요소라고 전제(DIF)
- 웹상의 전자자원을 기술하는 데 가장 많이 활용되고 있는 DC의 핵심메타데이터는 다른 정보자원 서비스와 연계를 위해 서라도 핵심요소 그대로 인정(DC)
- Z39.88 표준을 준수하여 KEV 메타데이터 제한언어는 “The Z39.88-2004 Matrix Serialization(식별자: info:ofi/fmt:kev:mtx)” 형식을 따름(Z39.88)
- Z39.88 표준을 준수하여 메타태그명을 수정함(Z39.88)
상기의 기준으로 DataCite 메타데이터 요소를 기준으로 DC, OECD, DIF 각각의 메타데이터 요소를 분석하여 연결테이블(Crosswalks)을 작성하였다. 다음으로 DataCite 메타데이터 요소를 대상으로 OpenURL 메타태그로 적합한 메타데이터 요소인지 판단하여 1차 핵심메타태그를 도출하였다. DataCite 메타데이터요소 중
[표 6] DataCite DC OECD DIF 스킴 연결테이블(Crosswalks)
DataCite DC OECD DIF 스킴 연결테이블(Crosswalks)
핵심 메타태그를 도출하기 위하여 DataCite 메타데이터 커널을 기준으로 DC 메타데이터요소, OECD 메타데이터 요소와 DIF 메타데이터 요소들을 비교하여 공통요소를 도출하였다. 이후 비교 대상으로 검토되었던 스키마에서 과학데이터 관련 핵심 메타태그를 도출하여 추가하였다.
현재의 OpenURL 레지스트리에 등록된 메타데이터 형식 중 학술 커뮤니티에서 자주 사용될 수 있는 서비스 유형에 대한 형식도 존재한다. 하지만 본 연구는 OpenURL소스와 서비스 구성요소의 상호운용성 확보를 위한 핵심 메타태그를 개발하는 것이 주된 목적이다.따라서 데이터 관련 서비스 유형 확장에 대한연구는 별도로 진행하고자 한다.
핵심 메타태그를 도출할 때 검토 스키마에 모두 존재하는 것은 해당 요소가 데이터를 기술하는 데 기본적인 기술항목임을 의미하는것이며, 또한 학술 커뮤니케이션에서 기본 항
ORD 메타데이터 포맷의 Key 선정 기준
목임을 의미하기 때문에 핵심메타태그로 선정하였다. 이런 기준으로 추가된 요소는
정의된 ORD KEV 메타데이터 형식은
ORD KEV 메타데이터 정의에 사용한 제한언어(Constraint Language)로는 OpenURL레지스트리에서 관리되고 있는 “The Z39.88-2004 Matrix Serialization(식별자: info:ofi/fmt:kev:mtx)” 형식을 사용하였다. Key 이름은 표준에 맞게 변경하였다. 모두 소문자로 변경하였으며, ‘_’ 문자를 삭제하였다. 또한 모든 공백을 삭제하였다. ‘_’ 문자가 삭제된 기존요소는
[표 8] ORD를 표현하기 위한 KEV 형식의 메트릭스 정의
ORD를 표현하기 위한 KEV 형식의 메트릭스 정의
최대한 수용하였으나,
정의된 ORD KEV 메타데이터 형식은 다음의 다섯 가지 사항을 고려한 것이다. 첫째,ANSI/NISO Z39.88-2004 표준을 준수하여 관련 커뮤니티 연구자들과 종사자들이 쉽게 이해할 수 있도록 하였다. 둘째, 메타태그의 최신성이다. 연구데이터의 출판에 앞장서고 있는DataCite의 최근 표준을 기준 스키마로 사용하기 때문에 데이터를 기술하되 필요한 메타태그에 대한 최근 연구결과를 반영하였다. 셋째, OECD와 DataCite, DIF의 데이터 인용을 위한 필수 요소 항목들을 함께 검토하였다. 따라서 OpenURL 소스에서 데이터 인용 관련 요소가 모두 활용될 수 있도록 설계하였다. 넷째, 관련분야 표준을 최대한 반영하였다. 관측분야에서 표준으로 사용되고 있는 DIF 형식의 요소 중주요 요소가 추가되어 관측분야에서 활용하는데 있어 기존 데이터베이스에 구축된 정보가 활용될 수 있도록 하였다. 다섯째, 미래를 준비하는 예비성을 들 수 있다.
본 개발 결과의 검증과 구현은 앞으로 Data-Cite 기술 관련 워킹 그룹, 현재 OpenURL 레지스트리 운영을 맡고 있는 OCLC, 세계적 Linking Resolver 솔루션 개발사인 엑스리브리스, 한국과학기술정보연구원의 전자자원 호스팅 사업 커뮤니티, 그리고 관련 종사자들과의 협력 연구를 거쳐 이루어질 것으로 사려 된다. 구체적인 과정을 서술하면 다음과 같다.
첫째, DataCite 기술 관련 워킹 그룹에 본연구의 결과를 제출하고 관련 연구자와 후속연구 진행이 필요하다. 둘째, 지구 관측 분야에서 2011년 2월 현재 OpenURL 레지스트리 운영에 책임을 맡고 있는 OCLC(Online Computer Library Center, Inc.)에 개발된 내용을 제출하여 표준화 작업을 진행하는 것이다. 셋째, Linking Resolver 솔루션을 개발하여 세계적으로 보급하고 있는 엑스리브리스사의 개발팀과 긴밀한 협력을 통해 ORD 개발 내용이 국제사회 커뮤니티에서 활발하게 논의될 수 있도록 해야 한다. 넷째, 한국과학기술정보연구원에서 운영하는 전자자원 호스팅 사업의 커뮤니티를 활용하는 것이다. 2007년에 사업을 시작하여 2011년 2월 현재 국내 57개 기관이 호스팅 사업에 참여하고 있다. 참여기관의 관리자들을 위한 교육이 매년 정기적으로 진행되고 있어, 이러한 채널을 이용하여 ORD의 실험적 적용을 통해 문제점을 지속적으로 개선시킬 수 있을 것이다. 마지막으로, ORD KEV 메타데이터 형식에 대한 관련분야 종사자의 검토가 무엇보다도 필요하다.
7) 2010년 DataCite 메타데이터 스킴이 공식적으로 발표 되었을 때 핵심 DOI가 핵심 속성이었으나 DataCIte 메타데이터 워킹 그룹에 참여하고 있는 Joan Starr, Angela Gastl(2011)의 연구에서는 Identifier로 변경되었음을알 수 있다.
8) DLESE는 미국 국립과학재단의 재정 지원을 받아 개발되었으며, 현재는 국가대기연구센터에서 운영 중에 있다.연구자가 연구수행 중 생성한 모든 데이터를 연구데이터로 정의할 때 DLESE에서 관리 및 유통되는 자료 중 과학데이터가 상당하다고 볼 수 있다. 또한 DLESE의 지구과학 교육 지원 내용 중 교육에 효율적으로 활용 될 수있도록 여러 도구와 인터페이스를 포함한 데이터세트, 이미지 제공은 과학데이터 서비스의 한 사례로 전혀 손색이 없는 예라 할 수 있다.
문헌위주의 학술정보 유통에 초점이 맞추어져 개발된 OpenURL에 과학데이터 유통을 위한 메타태그를 접목하는 시도를 하였다. ORD메타데이터의 객관성과 OpenURL에서의 상호운용성을 확보하기 위하여 DataCite 컨소시엄의 메타데이터 요소, DC의 핵심 메타데이터요소, OECD 메타데이터 요소, 그리고 DIF 메타데이터 요소를 비교, 분석하였다.
DataCite 메타데이터 요소를 기준으로 상기각 기관의 요소들과의 연결테이블(Crosswalks)을 작성하였다. 각각의 요소들을 비교한 후 공통요소를 찾아내고 이후 비교 대상으로 검토되었던 스키마에서 과학데이터 관련 핵심 메타태그를 도출 정립하였다. 핵심 메타태그를 결정할 때의 가장 큰 원칙은 검토 스키마에 모두 존재하는 것을 우선적으로 선택하는 것이었다. 다음으로 학술 커뮤니케이션에서의 주요한 요소, 관측분야의 메타데이터 포맷 등이 있었다.
ORD KEV 메타데이터(http://bit.ly/euht 9q)의 정의는 “Z39.88-2004 Matrix Serializati on(식별자: info:ofi/fmt:kev:mtx)” 형식을 제한 언어로 사용하였다. Key 이름은 표준에 맞게 변경하였으며 메타데이터 형식은 첫째, ANSI/NISO Z39.88-2004 표준 준수, 둘째, 메타태그의 최신성 보전, 셋째, OECD와 DataCite,DIF의 필수 요소 항목 참고, 넷째, 관련분야 표준의 적극적 반영, 다섯째, 미래 대비와 같은 다섯 가지 사항을 고려하였다.
본 개발 연구의 평가는 후속되는 연구에서유관 기관과 관련 종사자들을 연계하여 평가할것이다. 후속 연구로는 본 연구 결과의 활용과확산에 있어 다양한 형식의 제한 언어를 통한 연구결과 공유를 위해 info:ofi/fmt:kev:xml 형식의 제한 언어 확장이 필요하다. 또한 현재의 학술적 서비스 유형이 총 6가지의 키로 구분되어 있는데, 모두 문헌을 위주로 한 서비스 유형들만 포함되어 있기 때문에 이에 대한 연구가 필요하다. 이를 위해서는 Scholarly Service Type Keys의 확장 연구가 필요하다. 왜냐하면 과학데이터에 대한 이용자의 다양한 서비스 수요가 존재하며, 이러한 이용자의 요구가 서비스 서버에 전송될 수 있도록 서비스 타입 확장이 필요하기 때문이다.