A Study on Integration of Internal Information Retrieval Systems using Mashup; National Institute of Korean History Information Systems*

  • cc icon
  • ABSTRACT

    Mashup service provides results by query in real time and responds to users’ request in dynamic. In terms of size, each of NIKH(National Institute of Korean History)’s internal Information Systems is equal to individual library system. As adapting mashup for information convergence with external resources, it was accepted for internal integrated search in the same context. This study designated NIKH OpenAPI and proposed metadata format for internal integrated search of historical contents.


    본 연구에서는 실시간으로 질의를 처리하고, 이용자의 요구에 보다 동적으로 응답한다는 장점을 가진 매쉬업을 이용하여 기관 내부 정보시스템을 통합검색하고자 하였다. 국사편찬위원회 기관 내부의 정보시스템 각각은 개별 도서관시스템에 준하는 정보의 양을 보여주고 있다. 기관 내부의 여러 시스템에대한 통합검색서비스 또한 매쉬업 등 웹 2.0 기술을 적용하여 기관 외부 정보와 연계하는 통합검색 시도와 같은 맥락에서 볼 수 있다. 본 연구에서는 기관 내부에서 검색서비스를 제공하는 것을 전제로 하여 역사콘텐츠를 위한 국사편찬위원회 OpenAPI를 설계하고 메타데이터 형식 및 내용을 제안하였다.

  • KEYWORD

    Mashup , Information System , Integrated Search , Historical Contents , Digital Library , OpenAPI

  • 1. 서론

    도서관을 비롯한 정보제공기관의 정보검색시스템은 자료의 성격이 유사하여 하나의 시스템으로 구축되어야 함에도 불구하고 때로는구축 목적이나 담당 주체에 따라 개별 시스템으로 구축되어 관리되고 있다. 한 기관 내부에존재하는 다양한 시스템이 제공하는 정보의통합적인 제공에 대한 필요성과 중요성은 인정하지만 현실적인 방안을 찾지 못하고 있다.필요에 따라 기관 내부의 두 개별 정보시스템간에 분산검색을 통해 혹은 메타데이터 제공을 통해 정보를 공유하거나 기사나 날짜 등 특정 단위로 자료를 직접 링크하는 방식으로 정보를 공유하고 있다. 이러한 방법은 기관 내부정보시스템의 구성과 제공하는 자료의 성격및 유형이 다양하게 되면서 한계를 가지게 되었다.

    외부 자원과의 연계를 통한 통합검색서비스를 제공하려는 시도는 이전부터 있었으며 각자료의 메타데이터를 통합하여 DB를 구축하고 검색을 제공하는 한국역사정보통합시스템(이하 역통이라고 함)이나 국가지식포털 등이그 대표적인 예이다. 그러나 이 방식은 DB를구축하는 노력뿐만 아니라 실제 운영상의 문제로 실시간 정보 상태를 파악하지 못해 최신성이 떨어진다는 약점을 나타내고 있다. 최근에는 매쉬업 서비스를 비롯한 웹 2.0 기술을적용하여 외부 자원을 손쉽게 연결하여 단일정보시스템이 가지는 정보자원의 한계를 극복하고 있다. 기관 내부의 여러 시스템에 대한통합검색서비스 또한 매쉬업 등 웹 2.0 기술을 적용하여 기관 외부 정보와 연계하는 통합검색 시도와 같은 맥락에서 볼 수 있다. 통합검색을 제공하고자 하는 각 시스템이 기관 내부에 있든 외부에 있든 웹 기술을 적용하는 데있어서는 동일한 상황이라고 볼 수 있다. 오히려 기관 내부적으로 정보시스템을 통합하거나기존 시스템에 부담이 되지 않고 내부 정보의통합검색에 대한 요구를 만족시킬 수 있으므로 그 효과는 더 클 것이다.

    본 연구에서는 매쉬업 기술을 이용하여 기관내 다양한 정보시스템을 통합검색하는 모형을 제안하기 위해 국사편찬위원회(이하 국편이라고 함) 정보시스템을 대상으로 하였으며, 그 이유는 다음과 같다. 첫째, 국편 정보시스템의 하나의 정보량이 개별 도서관의 전체 정보시스템의 크기와 비슷하다는 것이다. 그러므로 기관들 간의 시스템 통합을 응용하여 기관 내부의 정보시스템 통합검색을 위한 모형을 설계할 수 있겠다. 둘째, 역사라는 주제영역을 가지고 있어서 매쉬업을 통한 정보서비스 모델이 심화될 수도 있으며, 실제 환경에적용될 가능성이 높아진다. 셋째, 국편 정보시스템은 간략버전의 OpenAPI 모습을 갖추고있으나 매쉬업 서비스의 본격적인 적용을 통해 정보의 유기적 연계를 통한 정보서비스를목표로 하고 있기 때문이다.

    본 연구에서는 우선 다양한 정보시스템을운영하고 있는 국편의 현황과 문제점에 대해알아보고, 개별적으로 운영되고 있는 정보시스템의 정보를 유기적으로 연계하여 서비스하기 위한 통합검색 방식에 대해 살펴보았다. 기관 내 이질적인 정보시스템의 통합검색을 위해 매쉬업 서비스를 채택하여 기관 내부 정보시스템을 위한 매쉬업 모델을 제시하고 국편의 환경에 맞는 OpenAPI를 설계하였으며 메타데이터 형식과 내용을 제안하였다.

    2. 매쉬업 개념 및 적용

       2.1 매쉬업 개념

    매쉬업은 구글, 네이버, 아마존, 야후 등 대표적인 국내외 인터넷 기업들이 해당 기관의데이터를 자유롭게 공유하는 기반을 제공함으로써 현재 웹 환경에서 가장 돋보이는 인터넷기술로 쓰이고 있다. 또한 매쉬업 서비스 생성도구가 빠르게 발전하고 있으며, 동시에 이러한 기술적인 노하우들이 많은 이들에게 공개됨으로써 보다 쉽게 매쉬업을 생성할 수 있는환경이 마련되었다(Fichter 2009).

    위와 같은 환경에서 매쉬업은 <그림 1>과같은 정보환경의 구성요소를 변화시키고 있다. 이용자 중심의 시스템을 구축한 정보기술들은 각 이용자들의 정보나 생각들을 좀 더 적극적으로 공유하기 위한 방안을 모색하였으며, 이를 위해 매쉬업기반 서비스를 이용하였다. 특히 ‘인간’을 중심으로 본 시스템은 그인간의 정보나 생각을 전달과 표현에 중심으로 두었다면 ‘커뮤니티’를 중심으로 한 시스템은 인간들이 공유할 수 있는 상황을 동적으로구축하는 것이다.

    정보를 저장하고 전달하는 ‘컨테이너’의 개념은 다양한 ‘미디어’를 통해 정보 저장 전달뿐만 아니라 정보를 재생산하고 빠르게 접근할 수 있는 환경으로 변화하였으며, 이러한 다양한 ‘미디어’로의 접근이 매쉬업 기술에 의해보편화되었다.

    ‘정보’를 바라보는 관점 또한 변화하였다. 특정한 사람에게 특정한 상황에서 유용한 ‘정보’를 중요하게 다루었던 관점은 모든 이들이활용하고 즐길 수 있는 ‘콘텐츠’의 개념으로변화하고 있다. 하나의 기술(description)단위로 ‘정보’를 다루는 관점과 달리, ‘콘텐츠’는하나의 정보에 담긴 아이템들을 각각의 정보단위로 보기도 하고, 대용량의 정보를 분석하여 새로운 정보를 창출할 수 있는 정보 덩어리들을 그 단위로 삼기도 한다.

    웹이 출현한 후 정보의 활용은 저장이라는개념에서 접근이라는 개념으로 변화하였다.이러한 변화를 반영하기 위해 ‘이질의 시스템들을 통합’하기 위한 노력들이 이루어졌다. 실제적으로 시스템들의 요소들을 통합하고 중심제어시스템을 구축함으로써 이와 같은 시스템통합을 통한 정보접근 환경을 이용자들에게제공하였다. 그러나 매쉬업기반 기술은 시스템통합보다는 기존의 시스템들을 유지하면서서로 자원을 공유할 수 있는 어플리케이션을제공하였다.

    <그림 1>은 매쉬업을 통해 정보환경 구성요소들의 변화를 설명한 것이다. 실제 매쉬업을 통해서 정보가 유통되면 네 가지의 구성요소들이 구별되지 않고 하나의 통합 시스템으로 제공된다(<그림 2> 참조). 예를 들면 ‘구글

    의 맵이 특정 웹 사이트에 적용되고 그 웹사이트는 스마트폰으로도 접근가능하며, 이용자들의 참여에 의해 새로운 정보가 창출되는 장을제공한다’라는 상황이 있을 수 있으며, 이 때이용자는 여러 개의 구성요소들을 생각할 틈도 없이 정보를 자유롭게 활용하는 데에만 가치를 둘 것이다.

    매쉬업의 대표적인 기술로는 OpenAPI(Open Application Programmer Interface)가 있으며 대표적인 예로는 구글맵, 네이버 및 다음의 도서검색 등을 들 수 있겠다.

       2.2 매쉬업 적용 및 발전방향

    매쉬업 서비스를 개발하기 위해서는 다른 이용자들이 생성해 놓은 어플리케이션을 연구하는 것이 바람직하다(Yee 2008). 특히 고려해야 할 사항은 다음과 같다. 첫째, 무엇을 통합할 것인가? 둘째, 여러 요소들을 왜 통합하려하는가? 셋째, 어떤 사이트에서 리믹싱하고 재조합할 것인가? 넷째, 어떻게 다양한 요소들을 통합할 것인가? 이용자 인터페이스뿐만 아니라 내부적인 시스템 구동에 대해서도 고려해야 한다. 다섯째, 앞으로 매쉬업 서비스를어떻게 확장할 것인가? 등이다.

    매쉬업 서비스를 적용한 웹사이트들을 살펴보면 위와 같은 매쉬업 개발 과정이 이해될 것이다. <표 1>은 웹 2.0을 기반으로 한 매쉬업 서비스에 대한 안내 및 연구 활동을 제공하는ProgrammableWeb 사이트1)를 이용하여 정리하였다.

    <표 1>에서 정리된 내용을 분석해 보면, 매쉬업 기술을 이용한 웹사이트의 발전 과정에서의 특성을 살펴볼 수 있다.

    첫 번째 특성은 웹사이트의 자원 활용 중심이 아니라 API 기술 개발차원에서 시스템 구축이 진행되고 있다는 것이다. 이러한 특성은API 기술을 기반으로 한 웹사이트의 개발에서초기에 발생되는 것이며, 사이트 개발이 고도화됨에 따라 극복될 수 있는 문제이기도 하다.단순한 두 번째 특성은 소스 사이트의 API 서비스에 종속적이다는 것이다. <표 1>의 Go-Go Google Gadget 사이트는 도서관의 이용자대출정보, 신착 및 추천도서에 대한 정보를 구글 가젯을 이용하여 처리하였으며, Readit.Me사이트에서는 아마존과 페이스북과의 연계를중심적으로 서비스화하였다. 세 번째 특성은 단순한 데이터의 연결을 기반으로 점차 이용자중심의 다양한 서비스를 제공하고 있다는것이다. <표 1>의 CodexMap 사이트는 지리적인 정보를 통해 도서검색을 지원하는 방식으로 도서명, 지역명 등 키워드 검색이 가능하며, 검색과정 및 결과를 시각적인 인터페이스로 표현하였다. GuruLib는 아마존 데이터뿐만 아니라 세계 각국의 도서관의 정보를 활용할 수 있다. Boulder Library with Amazon Reviews는 Library Thing과 연계하여 도서서평과 도서관 목록을 연결해주고 있다.

    현재 매쉬업기반 웹사이트는 매우 빠른 속도로 발전하고 있으며, 이와 관련하여 고려되어야 할 사항들은 다음과 같다.

    첫째, 요즘 들어 매쉬업 기술을 통한 정보통합의 단계가 실제 웹에 적용되기 시작되어,매쉬업 서비스의 양적인 증가를 이루고 있다.양적인 증가도 중요하지만 앞으로는 도서관 및 정보센터에서 적용될 수 있는 새로운 매쉬업 서비스 및 기술이 개발되는 등 매쉬업에 대한 질적인 향상도 고려되어야 한다. iGoogle이나 thefreedictionary.com처럼 이용자의 요구에 의해 매쉬업 서비스를 구성 및 조합할 수있어야 한다.

    둘째, 소스 사이트의 종속적인 부분을 해소하기 위해서는 먼저 소스 사이트의 신뢰성이확보되어야 하며, 더 나아가서는 구체적인 협력이 이루어지는 매쉬업 서비스 및 오픈소스나 GNU GPL(General Public License) 등을 활용하는 것도 바람직하다. 구글 테크놀로지 유저 그룹(Google Technology User Groups;

    GTUG)은 구글의 프로그래밍 기술에 관심이있는 사람들을 위한 이용자 그룹이며, 안드로이드 체계, App Engine, 유투브, 구글 캘린더 등의 API, OpenSocial 등 다양한 인터넷서비스 코드와 code.google.com에서 지원하는 모든 기술 리스트를 제공하고 있다.

    셋째, 정보의 통합에 중점을 두는 매쉬업에서 정보가 지닌 의미를 공유할 수 있는 매쉬업을 구축해야 할 것이다. 이는 도서관 및 정보센터에서 가장 바람직한 매쉬업 서비스를 기획할수 있는 기반을 제공할 것이다. 영국 Whichbook.net 은 주제를 상세하게 분류하여 이용자가 의미기반 검색을 제공하였으며, 소설의구성 및 성, 나이, 성향 등 또한 추가하였다. 전체적인 검색과정은 검색식에 맞는 도서를 제시하고, 영국 지도 이미지에서 이용자의 거주지를 파악한 후 근처의 도서관으로 연결시켜주는 프로세스이다.

    앞으로는 지금까지 살펴본 매쉬업 기술의적용 및 발전방향을 기반으로 하여 도서관 및 정보센터의 정보유통에 긍정적인 영향을 줄수 있는 매쉬업 모델을 제안하고자 한다.

    1) ProgrammableWeb[http://www.programmableweb.com/popular] 사이트에서 ‘library’ 태그로 검색한 결과이며, 표의 번호는 사이트 방문횟수를 기준으로 순위를 표시한 것임(2010. 9. 2을 기준으로 함)

    3. 도서관 정보시스템 통합검색을위한 매쉬업 전략

       3.1 도서관 정보시스템 통합검색

    3.1.1 정보시스템 통합검색의 흐름

    도서관내 또는 도서관간 정보시스템들의 통합검색을 논의할 때 기존의 연구들은 중앙집중형 검색 또는 분산검색에 대해 설명하였다.정보의 양이 많을 경우, 접속자수가 많을 경우와 같은 긍정적인 정보환경 또는 네트워크 환경이 안정화되지 않은 경우, 전산비용이 충분하지 않은 경우 등과 같은 부정적인 정보환경등, 이 모든 상황들은 정보를 통합해서 하나의 인터페이스로 제공하는 데 방해요소로 작용한다. 위와 같은 상황들을 고려해 보았을 때 많은 도서관에서는 다양한 시스템을 통제할 수 있는 Integrated Library System(이하 ILS라고 함)을 사이에 두고 중앙집중형 검색을 설

    계하였다.

    Jewell 등(2004)2)은 도서관에서 자관의 컬렉션, 서비스, 운영 등에 전자자원을 포함시키는 작업을 진행하였으나, 대부분이 기존의 ILS가 새로운 자원을 지원하기에는 부족하다고 주장하였다.

    도서관의 입장에서는 새로운 자원을 추가하고 기존의 자원들을 연결하는 작업을 지속적으로 진행해야 하며, 이를 위한 중앙집중형 검색의 문제점을 해결해야 한다. 동시에 지금의발전된 정보환경을 고려해 볼 때 동적이며, 적극적인 정보 통합을 생각해 보아야 한다. 중앙집중형 검색보다는 정보를 실시간으로 동적으로 활용할 수 있는 분산검색을 고려할 수 있을것이다.

    본 연구에서는 분산검색의 형식으로 매쉬업서비스를 활용하고자 한다. <그림 3>의 왼쪽은 중앙집중형 검색을 중심으로 정보를 하나로통합하여 이용자의 요구에 부합하는 자원을 제공하는 것이고, 오른쪽은 OpenAPI 기술을 이용한 매쉬업 기반 분산검색의 모델이다. OpenAPI기술을 이용한 매쉬업 기반 분산검색의 장점은 핸들시스템과 같은 시스템적인 제어장치가 필요 없으므로 자원을 자유롭게 확장하고 활용할 수 있다.

    즉, 본 연구에서는 디지털도서관의 발전방안으로 매쉬업 서비스를 통한 정보시스템 통합검색 구축방안을 제시하고자 한다(<그림 4>참조).

    3.1.2 정보시스템 통합검색의 범위

    디지털도서관이라는 개념 등장 이후, 정보

    저장에서 정보접근으로 패러다임이 전환되면서, 정보접근의 범위를 확장하는 작업이 부각되었다. 이와 동시에 자관에서는 소장 및 접근이 가능한 자원들에 대해 새로운 가치 창출을위해 지속적인 노력을 이어나갔다. 도서관의입장에서는 자관의 정보시스템에 새로운 정보덩어리를 추가하는 과정과 타 기관과의 연계를 통해 정보를 통합하는 과정을 유사하게 진행시킨다. 이런 맥락에서 본다면 도서관 내 존재하는 이질의 정보시스템들 간의 통합과 다른 도서관들과의 정보시스템 통합은 유사한과정 속에서 진행된다고 할 수 있다.

    <표 2>는 기관들이 자관의 다양한 시스템을 개발ㆍ 관리하고 있다는 것을 보여주고 있다. 한국연구재단은 정보를 제공하는 사이트 38개를 가지고 있으며, 한국과학기술정보연구원은 21개, 한국생명공학연구원은 14개로 조사되었다. 이는 한 기관에서 다양한 정보를 여러 사이트를 통해 제공하는 것을 보여주고 있다. 각 기관들은 자관 시스템들 간의 의미적인 연계 및시스템 상호운용성을 위해 노력하고 있다.

       3.2 매쉬업 전략

    3.1장에서 살펴보았듯이, 매쉬업은 도서관

    내ㆍ 외부에 존재하는 이질의 시스템들을 통합전략으로 이용될 수 있다.

    매쉬업에 대한 도서관의 적극적인 전략 수립은 이용자들의 끊임없는 정보요구를 충족시키는 준비로 간주될 수 있다. 앞으로는 지금의매쉬업 서비스에서 흔히 제공되는 단순한 지도 검색이나 도서 검색이 아닌 지식정보사회의 이용자에 맞는 정보서비스를 기획해야 한다.

    도서관에서 적용할 수 있는 매쉬업 전략은<그림 5>와 같으며, 첫 번째는 다양한 웹 포털 데이터(용어)를 연결하는 매쉬업 전략이다. 이 전략에서는 매쉬업 기술인 (Open)API를통해 간단하게 데이터 검색을 수행한다. 간단한 도서검색이나 지도 연결이 그 예가 되겠다.

    두 번째는 정보를 연결하는 매쉬업 전략이다. 정보를 연결하기 위해서는 용어의 의미를 연결하는 툴을 제공해야 한다. 정보검색시스템에 사전이나 간단한 시소러스 및 분류체계를제공하거나 특정 개체와 관련된 이용자들의 의견을 모아서 제공하는 것이 그 예가 되겠다.

    세 번째는 콘텐츠와 콘텐츠를 연결하는 매쉬업 전략이다. 의미적으로 유사한 다수의 정보 아이템들을 다양한 정보유형 및 출처 등으로 재조정하는 것이다. 주제어 기반으로 정보를 검색한 후 그 결과를 멀티미디어의 유형으로 나누거나 출처를 기준으로 재배치하는 것이 그 예이다. 앞으로는 정보 재배치에 대한설명이나 이용자가 직접 정보 재배치의 조건을 조정할 수 있는 시스템을 제안해야 한다.

    위의 세 가지 전략은 첫 번째 단계를 기준으로 두 번째 또는 세 번째 단계로 발전하는중이다. 첫 번째 단계에서 두 번째 단계로 발전하는 것은 정보들의 의미를 분석하는 것으로 김상균 등(2008)의 연구와 같이 온톨로지를 이용한 정보검색 매쉬업 시스템을 제안할수 있다.

    첫 번째 단계에서 세 번째 단계로 발전하는것은 주제의 성격이 비교적 유사한 시스템들간의 매쉬업 서비스에 활용될 수 있다. 이러한 발전은 기존의 시소러스나 사전이 활용되고있어서 의미적인 연결에 대해 새로운 요구가없거나 주제영역이 확실하여 용어 검색만으로도 비슷한 정보 아이템들이 모일 수 있다는 것을 전제로 한다.

    본 연구는 역사라는 주제영역을 대표하는 국사편찬위원회의 데이터 통합 검색을 위한 매쉬업 시스템 구축 방안을 제시하고자 한다. 본연구는 위에서 언급한 도서관에 적용할 수 있는 매쉬업 전략 단계 중 첫 번째에서 세 번째단계로 발전하는 과정을 기준으로 진행되었다.

    2) Dahl, M., K. Banerjee, and M. Spalti(2006)의 연구에서 인용함

    4. 매쉬업 서비스 모델 설계

       4.1 국사편찬위원회 정보서비스 현황

    4.1.1 정보시스템의 현황

    국편 정보검색시스템은 기초 사료 원전 및인물, 연표 등의 가공데이터를 제공하는 ‘한국사데이터베이스’, ‘승정원일기’, ‘조선왕조실록’,그리고 대중콘텐츠를 지향하는 ‘우리역사넷’등 4개의 원문검색시스템과 소장 수집 자료를 제공하는 ‘전자사료관시스템’ 및 ‘전자도서관시스템’으로 구성되어 있다(<그림 6> 참조).2010년 8월 현재 총 604만1,272건의 레코드를 제공하고 있는데 서비스 레코드의 기준은도서 1건에서 신문기사 1건까지 각 사이트별로 차이가 존재한다(<표 3> 참조). 현재 이외에도 역사포털로서 역사관련 24개 기관 29개사이트를 대상으로 검색서비스를 제공하는 ‘한국역사정보통합시스템’(이하 역통)이 있다.

    국사편찬위원회(이하 국편)의 개개 정보시스템은 시스템의 규모나 자료의 양으로만 보아도 한 기관의 정보시스템 이상의 정보를 제공하고 있다고 볼 수 있다. 각각의 정보시스템은 시스템간 정보 연계를 통해 정보서비스의시너지 효과를 내기에 충분하지만 현재 개별적인 정보시스템으로 각각 제공되고 있어 그장점을 살리지 못하고 있다. 일부 정보시스템에 한해 한국사데이터베이스를 통한 분산검색과 역사 포털인 역통에의 참여를 통해서 일부통합검색이 가능한 상황이다.

    4.1.2 통합정보검색 지원

    3.1에서 언급하였듯이 국편을 비롯하여 한기관 내에 다양한 정보서비스를 제공하는 정보시스템이 다수 존재하고 있는 경우는 이미일반적인 상황이 되었다 할 수 있다. 시스템구축과정에서 여러 이유로 인해 각각 독립적으로 사이트를 구성하고 서비스를 제공하고 있다 하더라도 정보의 유기적 연계를 통해 이용자에게 효율적인 정보검색서비스를 제공할뿐 아니라 기관 내 정보제공의 효율성 및 유연성을 높여야 할 것이다.

    국편의 정보시스템의 경우에도, 한국사데이터베이스, 승정원일기, 조선왕조실록은 자료의 성격상 통합시스템으로 제공되는 것이 바람직하다고 할 수 있다. 그러나 10여 년 동안개별시스템으로 구축, 운영되고 있고 원문제공시스템별로 각각 특화된 서비스를 제공하고있어 시스템 기반의 획일적인 통합은 오히려기존 이용자들에게 혼란을 제공할 가능성이있다. 따라서 단일 시스템으로의 통합이 아니라 매쉬업 서비스를 이용한 통합검색 방식이시스템간 정보를 공유하고 연계할 수 있도록하는 현실적인 대안이 될 수 있을 것이다. 현재 한국사데이터베이스에서 승정원일기와 조선왕조실록을 대상으로 분산검색을 수행하여 한국사데이터베이스를 통해 정보를 제공하고최종 콘텐츠는 각 사이트로 연결되도록 하고있다. 또한 전자사료관시스템을 비롯한 기관내 여러 시스템을 아우르는 연계 정보검색 서비스에 대한 필요성은 인식하고 있으나 서비스 방식이나 제공해야 할 메타데이터에 대한기준의 설정, 그리고 이용자 인터페이스 구성에 있어서의 어려움 등으로 가시적인 성과를나타내고 있지는 못한다.

    이러한 기관 내부 정보시스템간의 통합검색에 대한 논의와 시도는 초기 단계에 머물러 있는 반면, 유사한 성격 및 주제를 가지고 있는기관들을 대상으로 한 통합검색서비스에 대한시도는 2000년대 초반부터 활발히 이루어졌다. 역사분야에서는 역통을 통해 다양한 기관의 정보제공시스템에 대한 통합검색이 제공되고 있다. 국편도 역통의 운영 주체기관이자 참여기관으로서 한국사데이터베이스, 승정원일기,조선왕조실록 등이 연계되어 있다. 역통은 구축 초기에는 분산검색 방식을 채택하였으나검색 속도 문제와 함께 각 사이트들의 불안정으로 인해 성공하지 못하였고 그에 대한 대안으로 OAI 기반의 OAI-PMH을 적용하여 메타데이터를 수집하고 메타데이터베이스를 구축하여 통합검색을 제공하고 있다(<그림 7>참조). 각 기관의 정보시스템에서 역통에서 규정하고 있는 표준적인 메타데이터 형식에 맞추어 메타데이터를 추출, 수집하는 과정과 통합데이터베이스를 유지, 운영하는 과정은 자동화된 프로세스를 거치도록 되어있다. 그러나 기관의 시스템 운영 정책변화, 방화벽 설정등의 변수가 많아 자동화 프로세스가 제 기능을 하지 못하고 관리자가 각 단계마다 개입하여 수작업으로 관리하고 있다. 따라서 각 기관의 정보시스템과 역통이 제공하는 정보가 실

    시간으로 연동되고 있지 못하고 약간의 차이를 보이기도 한다. 이러한 상황은 기관 내부의 정보시스템에서도 각각 담당자가 다르고 부서가 다른 경우가 일반적이어서 기관간 상황과크게 다르지 않으나 기관 내부에서 일관된 정책을 가지고 운영 가능하다는 면에서는 차이가 있다. 이러한 측면에서 역통이 채택하고 있는 메타데이터베이스 구축을 통한 통합검색제공 방식을 국편 내부의 정보시스템간 통합검색 방식으로 채택하는 것은 바람직하지 못하다고 할 수 있다. 또한 역통을 국편이 운영하고 있고 기관의 정보시스템이 역통에 안정적으로 연계되어 있다하더라도 이는 기관 내부 정보시스템의 통합을 위한 서비스를 제공하기 위한 목적으로 만들어진 것도 아니다. 따라서 기관 내부 정보시스템의 안정적인 서비스를 바탕으로 OpenAPI 를 적용한 매쉬업 서비스를 채택하는 것이 최적의 현실적인 대안이 될 수 있을 것이다.

       4.2 매쉬업을 적용한 통합정보검색 모델설계

    4.2.1 매쉬업 서비스의 적용

    이 연구에서는 국편 내부의 다양한 정보시스템의 통합검색을 위해 매쉬업 서비스를 적용하도록 제안하고 있다. API 형식으로 각 정보시스템의 데이터를 요청하고 XML 데이터로검색결과를 받아 통합검색을 제공하도록 하였다. 국편의 정보시스템을 위한 API는 기관 내부의 정보시스템 간에 정보를 주고받는 것을목표로 하므로 외부에 공개하는 OpenAPI와같은 방식으로 구성하거나 인증을 요구할 필요는 없다. 그러나 기관 내부 정보에 제한하지 않고 외부 정보까지 통합검색하여 제공하는서비스를 고려한다면 처음부터 외부 OpenAPI형식으로 설계하는 것이 바람직하다. <그림 8>은 API형식으로 매쉬업 서비스를 적용하는 국편 정보시스템의 통합검색 모델을 보여주고있다. 각각 독립적으로 정보를 제공하는 국편

    정보시스템이 매쉬업 서비스 적용을 통한 통합검색 제공으로 단위 정보시스템을 넘어서는정보 융합 및 유기적인 연계가 가능해진다. 매쉬업을 적용한 통합검색은 <그림 9>에서 볼수 있듯이 각 정보시스템이 제공하는 OpenAPI를 통해 HTTP로 정보검색을 요청하고 각 정보시스템이 보내주는 검색결과를 XML 데이터 형식으로 받아 이용자 화면에 동시에 출력해주는 형태로 구현될 수 있다.

    4.2.2 국편 OpenAPI 데이터 설계

    정보시스템 외부에서 어플리케이션을 통해외부 시스템이나 이용자들이 REST 방식으로 호출하였을 때 데이터는 XML 형식으로 전송한다. 이 때 API 호출, 즉 검색 요청 변수(request parameter)는 기본적으로 <표 4>와 같이 8개 데이터를 사용하도록 설계하였다. 검색 후 다음 결과페이지를 받기 위해서는 totalCount,set_id의 값을 필수적으로 전달하여야 한다. 실제 검색결과와 같게 GET방식으로 URL을 입력해주면 XML로 검색결과 리스트를 보여주며 해당 검색 사이트들의 검색결과를 공통의 XML 형식으로 받아서 통합적으로메타검색을 시도한다. 인코딩 방식은 UTF-8로하며 원문보기는 해당 정보검색시스템으로 직

    접 연결하여 제어권을 넘기는 것으로 하였다.

    API를 통한 검색 요청에 따라 각 정보시스템이 출력하는 검색결과 필드는 각 정보시스템이 제공하는 자료의 유형 및 성격에 따라 정의하는 메타데이터가 다양하기 때문에 필드정의에 있어 세심한 주의가 필요하다. 자료 유형에 따른 메타데이터를 고려하여 정보시스템에 따라 개별적으로 출력 결과 필드를 정의할수도 있으나 한 시스템에서 제공하는 자료의유형도 다양하기 때문에 그 부분 또한 쉬운 문제는 아니다. 그 대안으로 동일 혹은 유사 주제분야의 표준 메타데이터 요소를 따르는 것도한 방법이 될 수 있다. 이 연구에서는 <표 5>와 같이 한국역사정보종합센터를 중심으로 이미 역사분야에서 표준으로 사용되고 있는 메타데이터 요소를 준수하도록 출력 결과 필드(response field)를 설계하였다. 이와 유사하게 국가기록원에서는 국가기록물 검색 Open-API 서비스를 위한 출력 결과 필드를 정의하

    여 제공하고 있다. <그림 10>은 역사분야 표준 메타데이터 요소를 출력 결과 필드로 적용하여 국편 한국사데이터베이스 OpenAPI를통한 검색 요청에 따라 출력 결과를 제공하는

    XML 데이터 예이다.

    국편 정보시스템의 통합검색을 제공하기 위해 매쉬업 서비스를 적용한 모델에 따라 Open-API를 설계하고 구현하는 실제 작업은 시스템환경 및 개발에 대한 후속 작업이 충분히 이루어져야 가능하다. 현재 국편에서 API를 적용해 제공하고 있는 통합검색은 <그림 11>과<그림 12>에서와 같이 각 정보시스템의 검색

    건수와 검색 결과리스트 URL만 제시하고 있는 단순한 형태이다. 국편 OpenAPI 형식은정보시스템 간에 콘텐츠 제공을 기본으로 하고 기관 내부에서 검색서비스를 제공하는 것을 전제하기 때문에 일반적인 OpenAPI와 다르게 인증을 요구하고 있지 않고 API를 호출하면 어느 시스템에서나 검색서비스를 제공받을 수 있도록 하고 있다. 이러한 단순한 형태의 API 데이터를 적용한 통합검색은 검색서비스를 통한 콘텐츠의 유기적 연계 및 서비스 제공이라는 목표를 달성하기 위한 가장 기초적인 형태에 해당한다고 할 수 있다. 현재 각 사이트마다 제공하는 콘텐츠를 위한 메타데이터의 형식 및 내용에 대한 공통적인 합의를 통해표준화된 형식의 검색결과 제공이 필요하다.메타데이터의 경우에 역사분야에서는 역사포털인 역통의 메타데이터 포맷을 표준으로 준수하고 있으므로 앞서 제시한 표준을 따르는것도 한 방법이 될 수 있다.

    5. 결론

    본 연구는 도서관간의 정보시스템 통합검색과 도서관내 이질적인 정보시스템 통합검색에대한 접근방식이 유사하다라는 전제로 시작하였다. 또한 본 연구에서는 실시간으로 질의를처리하고, 이용자의 요구에 보다 동적으로 응답한다는 장점을 가진 매쉬업을 이용하여 기관 내부 정보시스템을 통합검색 하고자 하였다. 국편 기관 내부의 정보시스템 각각은 개별도서관시스템에 준하는 정보의 양을 보여주고있다.

    도서관 정보시스템 통합검색에 적용될 수 있는 매쉬업의 단계를 정도에 따라 세 가지의단계로 구분하였으며, 본 연구에서는 첫 번째에서 세 번째로 진화하는 과정을 모형화하였다. 이 모형은 역사라는 주제적인 성격이 강한국사편찬위원회의 정보시스템들을 통합검색하기 위한 연구에 적용되었다.

    본 연구에서는 국편 내부의 다양한 정보시스템의 통합검색을 위해 매쉬업 서비스를 적용하도록 제안하였다. API 형식으로 각 정보시스템의 데이터를 요청하고 XML 데이터로검색결과를 받아 통합검색을 제공하도록 한다. 이를 통해 각각 독립적으로 정보를 제공하는 국편 정보시스템이 매쉬업 서비스 적용을통한 통합검색 제공으로 단위 정보시스템을 넘어서는 정보 융합 및 유기적인 연계가 가능해졌다. 매쉬업을 적용한 통합검색은 각 정보시스템이 제공하는 OpenAPI를 통해 HTTP로정보검색을 요청하고 각 정보시스템이 보내주는 검색결과를 XML 데이터 형식으로 받아 이용자 화면에 동시에 출력해주는 형태로 구현되었다.

    국편 정보시스템의 통합검색을 제공하기 위해 매쉬업 서비스를 적용한 모델에 따라 Open-API를 설계하고 구현하는 실제 작업은 시스템환경 및 개발에 대한 후속 작업이 충분히 이루어져야 가능하다. 현재 국편에서 API를 적용해 제공하고 있는 통합검색은 각 정보시스템의 검색 건수와 검색 결과리스트 URL만 제시하고 있는 단순한 형태이다. 이러한 형태의API 데이터를 적용한 통합검색은 검색서비스를 통한 콘텐츠의 유기적 연계 및 서비스 제공이라는 목표를 달성하기 위한 가장 기초적인형태에 해당한다고 할 수 있다. 현재 각 사이트마다 제공하는 콘텐츠를 위한 메타데이터의형식 및 내용에 대한 공통적인 합의를 통해 표준화된 형식의 검색결과 제공이 필요하다. 메타데이터의 경우에 역사분야에서는 역사포털인 한국역사정보통합시스템의 메타데이터 포맷을 표준으로 준수하고 있으므로 앞서 제시한 표준을 따르는 것도 한 방법이 될 수 있다.

    이 연구에서는 매쉬업의 발전 단계에서 대용량의 정보를 비교적 쉽고 효율적으로 처리할 수 있는 방법을 모색하였다. 이를 적용하여 앞으로의 연구에서 정보의 의미적인 연결에초점을 맞추어 볼 수 있을 것이다. 특히 국사편찬위원회에서 구축한 ‘한국역사용어시소러스’를 이용한다면 더 나은 매쉬업 서비스를 구축할 수 있을 것이다. 이 연구에서 제시하는모델은 역사분야 뿐 아니라 기관 내 다양한 정보시스템을 운영하고 있는 기관들이 직면하고있는 시스템간 정보공유 및 활용을 위한 하나의 방안으로 적용 가능할 것이다.

  • 1. 김 상균, 김 철, 장 현철, 예 상준, 송 미영 2008 약재 온톨로지를 활용한 약재 검색 매쉬업시스템 [『정보관리연구』] Vol.39 P.173-186 google
  • 2. 김 진한, 이 병정 2009 웹 서비스와 OpenAPI를사용한 SOA 기반 동적 서비스 합성 프레임 워크 [『 정보과학회논문지: 소프트웨어 및응용』] Vol.36 P.187-199 google
  • 3. 오 창훈 2009 『OpenAPI를 활용한 매쉬업 가이드: HTML과 자바스크립트로 손쉽게 만드는 AIR 애플리케이션』 google
  • 4. 최 태만 『한국 시각예술의 과제와 전망』 google
  • 5. Back Godmar, Annette Bailey 2010 “Web Services and Widgets for Library Information Systems.” [Information Technology and Libraries] Vol.29 P.76-86 google
  • 6. Dahl M, Banerjee K, Spalti M 2006 Digital libraries : integrating content and systems. google
  • 7. Digital Library Federation google
  • 8. Engard Nicole C 2009 Library Mashups: Exploring New Ways to Deliver Library Data google
  • 9. Google Technology User Groups google
  • 10. Governor James, Dion Hinchcliffe, Duane Nickull 2009 Web 2.0 Architectures Sebastopol google
  • 11. iGoogle google
  • 12. Engard. Nicole C 2009 Library mashups;exploring new ways to deliver library data google
  • 13. ProgrammableWeb. google
  • 14. thefreedictionary.com google
  • 15. Jewell Timothy D, Anderson I, Chandler A, Farb S. E, Parker K, Riggio A, Robertson. N. D. M 2004 Electronic Resource Management. Report of the DLF ERM Initiative google
  • 16. Whichbook.net google
  • 17. Yee Raymond 2008 Pro Web 2.0 Mashups:Remixing Data and Web Services google
  • 18. Yu Casati, Daniel. 2008 “Understanding mashup development.” [IEEE Internet Computing] Vol.12 P.44-52 google
  • [fig 1] 매쉬업 관점에서 본 정보환경 구성요소의 변화
    매쉬업 관점에서 본 정보환경 구성요소의 변화
  • [fig 2] 매쉬업 개념
    매쉬업 개념
  • [table 1] 도서관에 적용된 매쉬업 서비스
    도서관에 적용된 매쉬업 서비스
  • [fig 3] 정보시스템 통합검색의 변화
    정보시스템 통합검색의 변화
  • [fig 4] 디지털도서관의 발전방안으로서의 매쉬업
    디지털도서관의 발전방안으로서의 매쉬업
  • [table 2] 교육과학기술부 산하기관별 정보시스템 현황
    교육과학기술부 산하기관별 정보시스템 현황
  • [fig 5] 도서관에 적용할 수 있는 매쉬업 전략 단계
    도서관에 적용할 수 있는 매쉬업 전략 단계
  • [fig 6] 국편의 정보시스템
    국편의 정보시스템
  • [table 3] 국편 정보시스템의 서비스현황(2010.08 현재)
    국편 정보시스템의 서비스현황(2010.08 현재)
  • [fig 7] 역통 구성도(출처: 윤소영 2009)
    역통 구성도(출처: 윤소영 2009)
  • [fig 8] 매쉬업을 적용한 국편 통합검색 모델
    매쉬업을 적용한 국편 통합검색 모델
  • [fig 9] 매쉬업을 적용한 국편 정보검색서비스
    매쉬업을 적용한 국편 정보검색서비스
  • [table 4] 국편 OpenAPI 검색 요청 변수
    국편 OpenAPI 검색 요청 변수
  • [table 5] 역사분야 표준 메타데이터 요소
    역사분야 표준 메타데이터 요소
  • [fig 10] 국편 한국사데이터베이스 검색 결과 XML 데이터
    국편 한국사데이터베이스 검색 결과 XML 데이터
  • [fig 11] 한국사데이터베이스 검색 API 출력화면
    한국사데이터베이스 검색 API 출력화면
  • [fig 12] 국편 정보시스템 통합검색 결과화면
    국편 정보시스템 통합검색 결과화면