검색 전체 메뉴
PDF
맨 위로
OA 학술지
웹 기반 시뮬레이션 이력출처 데이터 공유 서비스 설계 Design of Web based Simulation Provenance Data Sharing Service
  • 비영리 CC BY-NC
  • 비영리 CC BY-NC
ABSTRACT
웹 기반 시뮬레이션 이력출처 데이터 공유 서비스 설계

Web based simulation service is actively utilized to computably analyze various kinds of phenomena in real world according to progress of computing technology and spread of Network. However it is hard to share data and information among users on the services, because most of web based simulation services do not share and open simulation processing information and results. In this paper, we design a simulation provenance data sharing service on EDISON_CFD (EDucation-research Integration Simulation On the Net for Computational Fluid Dynamics) to share the calculated simulation performance information. To store and share the simulation processing information, we define the simulation processing step as “Problem → Plan, Design → Mesh → Simulation performance → Result → Report.” Users can understand a problem solving method through a computer simulation by searching the simulation performance information with Search/Share API of the store. Besides, this opened simulation information can reduce the waste of calculation resource to process same simulation jobs.

KEYWORD
EDISON , 웹 기반 시뮬레이션 서비스 , 이력출처 , 데이터 공개 , 워크플로우
  • Ⅰ. 서 론

    네트워크 및 컴퓨팅 기술의 발달로 실생활에서 일어나는 다양한 현상을 수치적으로 계산하고 분석할 수 있는 웹 시뮬레이션 서비스가 활발히 사용되고 있다. 이중, EDISON 서비스[1, 2]는 최신의 시뮬레이션 프로그램과 콘텐츠를 서비스 할 수 있는 환경을 제공한다. 특히 고성능의 컴퓨팅 자원을 웹을 통해 쉽게 이용하며 가시화 도구를 통해 결과도 바로 확인할 수 있어 열유체[3, 4], 계산화학[5], 나노물리[6] 분야에서 매학기 천명이상의 사용자가 활용하고 있다. 많은 사용자가 활발히 사용함에 따라 시뮬레이션 작업 수도 증가하며 이를 수행하는 계산 시간도 증가하고 있다. 그러나 시뮬레이션 수행 내역 및 결과 등을 공유/공개하는 기능이 없어 동일한 시뮬레이션 작업이라도 각 사용자마다 모두 해당 작업의 계산을 수행해야만 결과를 확인 할 수 있는 문제점이 있다.

    이 문제를 해결하기 위하여 이 논문에서는 시뮬레이션 수행 내역 중, 계산 시간이 오래 걸리는 작업이나 중복적으로 자주 수행되는 작업을 저장하고 검색하는 이력출처 데이터 공유 서비스를 설계한다. 이 서비스에선 이력출처 저장소(Provenance Store)에 시뮬레이션의 수행내역과 관련정보(문제, 배경지식, 계획, 설계, 레포트, 등)을 저장하고, 데이터 검색 API를 통해 시뮬레이션 수행 이력 정보를 제공한다. 이 논문에서는 주로 EDISON_열유체에서 수행된 시뮬레이션 데이터를 중심으로 공유 서비스를 설계하였다.

    Ⅱ. 관련연구

    웹 기반 시뮬레이션 서비스는 게임[7], 모델링[8], 수학/과학[9], 수치분석, 사회학, 데이터흐름 다이어그램, 대수학, 등의 다양한 분야에서 활발히 활용되고 있다. 무엇보다 인터넷을 통해 쉽게 접근할 수 있으며 직관적 인터페이스, 웹 기반의 전처리기 및 가시화 도구를 제공하여 사용자들이 별다른 프로그램 설치 없이 서비스를 이용할 수 있는 장점이 있다.

    웹 기반 시뮬레이션 응용의 경우, 사용자 편의를 위해 보다 많은 계산자원, 직관적인 인터페이스, 가시화 도구, 등 사용자의 시뮬레이션 수행과 분석을 돕는 서비스 개선은 많이 이루어지지만, 시뮬레이션 수행 과정과 그 결과를 다른 사용자에게 공개하고 시뮬레이션 결과에 대한 신뢰성을 검토하는 기능들은 대부분 아직 서비스되고 있지 않다.

    정보의 라이프사이클 동안 변화를 기록하여 결과에 대한 신뢰성 판단 근거를 제공하는 데이터 이력출처(Provenance)[10-15]는 다양한 정보 (생성, 가공, 결과, 소유주 정보, 가정, 등)를 분석하여 타겟을 좀 더 명확히 이해할 수 있게 돕는다. 이력출처 시스템은 보통 “실시간 사건 수집” → “Time series 데이터 저장소를 지원하는 데이터 모델에 사건을 저장” → “데이터 검색 및 활용” 과정을 거쳐 서비스되며, 마치 기록 저장소처럼 보여진다[16]. 사건 저장을 위해 이력출처 그래프 모델이 많이 사용되는데 이중 대표적인 것이 Open Provenance Model(OPM)이다. OPM은 객체(entity), 문서(artifacts), 행위자 (actors)를 기본으로 데이터가 처리되는 과정을 기록하며 이를 그래프 형식으로 표현한다[17, 18].

    이력출처 기술은 신약임상시험[19], 모바일, 클라우드 서비스, 천문우주, 지구과학, 등의 분야에서 과거 이력정보를 통해 지식을 얻고 협력 연구를 수행하는 등 유용한 정보를 얻는 데 활용된다. 개발 중인 신약의 경우, 다양한 임상시험을 거쳐 그 효과 및 안정성을 검증하는 과정이 필수적이기에, 엄중한 품질 관리 측면에서 법적, 구조적, 과학적인 절차에 맞추어 신약의 효능과 부작용, 등을 기록한다[19]. 이를 위해 다양한 상세 수준에서 참여자(임상의, 연구자, 임상시험 대상자, 보조자, 등)와 각 처리 단계에 대한 진행 과정 (계획, 진행, 평가, 분석), 특이사항, 등을 표준 가이드 라인에 따라 기록한다. 이 기록은 이력출처 저장소에 접근 가능한 사용자가 질의를 통해 검색할 수 있으며, 질의는 데이터의 상세 수준 (속성, 하위 수준 등), 각 데이터간의 관계 (이전단계, 다음단계, 상위), 에 따라 기록된 임상 시 험 데이터를 다양하게 검색하고 분석할 수 있다. 검색 된 결과는 보통 그래프 형태로 정리되며 각 과정별로 누가 참여했고, 어떤 데이터를 활용하여 결과가 어떻게 나왔는지를 기술한다.

    이 논문에서는 시뮬레이션에 대해 이력출처 기술을 활용하여 시뮬레이션 수행 과정 정보를 공개하는 이력출처 데이터 공유 서비스를 설계함으로써, 사용자가 다른 사용자의 시뮬레이션 수행 과정을 검색하고 그 결과를 검토할 수 있어 사용자가 일일이 모든 시뮬레이션을 수행하는 시간과 노력을 절약할 수 있다.

    Ⅲ. 웹 기반 시뮬레이션 수행 내역 분석

    첨단 사이언스 교육 허브 (EDISON, EDucationresearch Integration Simulation On the Net)에서는 연구자들이 개발한 시뮬레이션 프로그램 및 콘텐츠 (보고서, 논문, 시뮬레이션 프로그램 매뉴얼, 등)를 웹을 통해 제공하는 사이버 교육·연구 환경을 제공한다[1, 2].

    시뮬레이션이 수행된 내역을 분석하여 그림 1과 같이 중복 비율을 얻었다. 2012년 2학기엔 57~82%정도의 중복 비율을 보이고 2013년 1학기의 경우, EDISON_Airfoil_Design 프로그램만 약 8%의 중복을 보이고 다른 프로그램은 84~99% 의 높은 중복 비율을 보인다. 이는 전체적으로 EDISON 웹 시뮬레이션 서비스가 아직 연구보다는 교육에 보다 집중되었기 때문에 비슷한 시뮬레이션 작업을 수행하는 것으로 보인다.

    그림 2는 2012년 2학기와 2013년 1학기 EDISON_열유체 서비스에서 활용된 시뮬레이션 프로그램 중 가장 중복 횟수가 많은 2D_Comp-2.1과 2D_Incomp-2.1의 중복 횟수와 대기 시간, 수행 시간을 보여준다. 2012년 2학기 2D_Comp-2.1의 경우, 입력 파라메터가 73회 중복된 시뮬레이션 작업들은 36832초 (약 10시간) 정도의 총 계산 시간을 갖고, 1회 중복된 시뮬레이션 작업들은 약 2,064일(day) 정도의 총 계산 시간을 가진다.

    이처럼 상당한 비율을 차지하는 파라메터 중복 시뮬레이션 작업 내역을 이력출처 스토어에 저장하고 공유한다면, 계산자원에서 동일한 시뮬레이션 작업을 수행하는 낭비를 줄이고 사용자가 원하는 시뮬레이션 결과를 바로 얻을 수 있다.

    그러나 동일한 시뮬레이션 결과를 판단하기 위해서 입력 파라메터와 Mesh 파일이 동일한지 일일이 비교해야 하는데, 모든 시뮬레이션 작업에 대한 Mesh 파일을 비교하는 작업은 많은 비용이 들기 때문에, 공유 서비스를 구축하는데 큰 걸림돌이 될 수 있다. 따라서 그림 3과 같이 동일 파라메터를 가진 작업에 대한 메쉬 정보를 형상에 따라 분류하여 사용자가 직접 쉽게 검색할 수 있도록 하였다.

    Ⅳ. 이력출처 저장소 (Provenance Store) 구축

    이력출처 스토어는 정의된 시뮬레이션 수행 과정(그림 5)에 맞게 데이터를 저장한다. 저장된 이력정보는 시뮬레이션 데이터 관리 모듈과 API를 통해 일반 사용자와 공유되고 검색된다. 이때 모든 시뮬레이션 수행 내역을 공유하기 보다는 많은 시간 계산이 필요한 시뮬레이션 작업이나, 중복이 많이 되는 작업들을 중심으로 공유하면 계산자원의 낭비를 줄여 시스템의 활용도를 높일 수 있을 뿐만 아니라 시뮬레이션 결과를 얻는 시간을 줄일 수 있다. 또한 실생활에서 접하는 여러 문제들[2]에 대한 시뮬레이션 수행 내역을 공개할 경우, 비슷한 문제를 푸는 연구 및 교육에 활용 할 수 있는 장점이 있다.

    그림 5에서 정의된 EDISON 시뮬레이션 수행 과정(문제 → 계획, 설계 → Mesh → 시뮬레이션 수행 → 시뮬레이션 결과분석 → 보고서)은 사용자가 공유된 시뮬레이션 수행 내역을 차근차근 이해하기 용이하다. 이중, “Mesh”, “시뮬레이션 수행 정보”, “시뮬레이션 결과”는 EDISON 서비스에서 자동으로 추출할 수 있지만, “문제”, “계획, 설계”, “시뮬레이션 결과분석”, “보고서” 부분은 사용자가 임의로 추가하여 넣어야 한다.

    그림 5의 수행 내역 형태로 데이터를 저장하기 위하여 그림 6과 같이 시뮬레이션 프로그램 수행에 대한 과정을 그래프를 작성했다. 이 그래프의 처리 과정에 따라 EDISON 시뮬레이션 데이터가 저장되며 정해진 데이터 수행과정(워크플로우)에 맞게 추출한 시뮬레이션 데이터를 저장한다. 저장된 데이터는 데이터 간의 관계나 각 단계별 속성 값을 중심으로 검색할 수 있다.

    Ⅴ. 이력 출처 데이터 활용

    시뮬레이션 이력출처 저장소에 저장된 시뮬레이션 수행내역을 API를 활용하여 검색할 수 있다. 그림 8은 이력출처 검색 API를 활용하여 시뮬레이션 수행내역을 검색한 결과의 예를 보여준다.

    그림 8그림 5에서 정의된 6단계를 중심으로 사용자에게 공개된 시뮬레이션 수행 내역을 각 탭마다 분류하여 보여준다. 그림 8에서는 “EDISON_CFD를 이용한 에어포일의 두께에 따른 임계 마하수 비교 연구”[20]를 중심으로 문제와, 계획, Mesh, 시뮬레이션 수행 및 결과를 정리하였다. 특히, “계획, 설계” 단계에 저장된 “임계 마하수에 대한 에어포일 두께의 영향”과 같은 배경 이론과 NACA0012, NACA0016에 대한 CFD 실험 조건, 그리고 발표된 논문은 수행된 시뮬레이션이 계획에 따라 어떻게 설정되고 수행되었는지를 명확하게 알 수 있다. 이처럼 단순히 시뮬레이션 수행 내역만 공개하기보다는 시뮬레이션 실험에 필요한 배경지식, 목적, 등도 추가하여 제공함으로써 시뮬레이션에 대한 이해를 돕고 문제를 해결하는 방법을 배울 수 있다.

    또한 공개된 시뮬레이션 수행 정보는 사용자가 시뮬레이션 서비스를 효과적으로 활용하는데 유용하다. 예를 들어 사용자가 기 수행된 시뮬레이션 정보를 토대로 시뮬레이션 계획을 세워 시행착오를 줄이는데 도움을 줄 수 있을 것이다.

    Ⅵ. 결 론

    웹 기반 시뮬레이션 서비스에서의 데이터 공유를 지원하기 위하여 이력출처 저장소를 설계하고 시뮬레이션 수행내역과 함께 문제, 배경지식, 계획, 설계, 레포트, 등의 관련정보를 같이 제공하는 공유 서비스를 제안하였다. 이를 통해 사용자들이 배경지식과 함께 시뮬레이션을 통해 문제를 푸는 방법과 결과를 정리하는 방법, 등을 배울 수 있다. 향후 공유된 데이터의 효과를 분석하여 시뮬레이션 서비스의 효율을 높일 것이다.

참고문헌
  • 1. Lee JongSuk Ruth, Kim Kyu Jin, Moon Jongbae, Nam Dukyun, Lim Jae Hyoung, Seo Jerry Hyeon, Ahn Bu-Young, Jung Youngjin, Park Hyoungwoo, Cho Kumwon 2010 "The Status of Higher Education in Science & Engineering in Korea" [e-learning week 2010] P.107 google
  • 2. EDucation-research Integration through Simulation On the Net (EDISON) google
  • 3. Jung Young Jin, Moon Jongbae, Jin Du-Seok, Ahn Bu-Young, Seo Jerry Hyeon, Ryu Hoon, Byeon Ok-Hwan, Lee JongSuk Ruth 2012 "Web Simulation Service Improvement on EDISON_CFD" [CST 2012] P.119-124 google
  • 4. EDISON_CFD google
  • 5. EDISON_Chem google
  • 6. EDISON_Nanophysics google
  • 7. AgentSheets google
  • 8. AnyLogic google
  • 9. Explore Learning google
  • 10. Provenance google
  • 11. Sudha Ram McClelland "DATA PROVENANCE," google
  • 12. Buneman Peter, Tan Wang-Chiew 2007 "Provenance in Databases: Past, Current, Future" [SIGMOD Tutorial 2007] google
  • 13. Buneman Peter, Cheney James, Vansummeren Stijn 2008 "On the expressiveness of implicit provenance in query and update languages," [ACM Transactions on Database Systems (TODS)] Vol.33 google
  • 14. Green Todd J., Karvounarakis Grigoris, Tannen Val 2007 Provenance semirings [Symposium on Principles of Database Systems] P.31-40 google
  • 15. Divesh Srivastava 2007 "Intensional Associations Between Data and Metadata," [SIGMOD] P.401-412 google
  • 16. Liu Q., Bai Q., Giugni S., Williamson D., Taylor J. 2013 "Data provenance and data management in eScience," google
  • 17. The OPM Provenance Model (OPM) google
  • 18. Moreau L. 2007 "The Open Provenance Model," google
  • 19. Translational Research and Patient Safety in Europe google
  • 20. Lee Jaeho, Lee Daeyeon, Park Soo Hyung 2012 "Study on Critical Mach Number According To Airfol Thickness Using EDISON_CFD", 1st EDISON_CFD competition) google
OAK XML 통계
이미지 / 테이블
  • [ 그림 1. ]  시뮬레이션 작업 중복 횟수 및 비율
    시뮬레이션 작업 중복 횟수 및 비율
  • [ 그림 2. ]  시뮬레이션 프로그램 (2D_comp-2.1, 2D_Incomp-2.1)의 작업 중복 횟수 및 처리 시간
    시뮬레이션 프로그램 (2D_comp-2.1, 2D_Incomp-2.1)의 작업 중복 횟수 및 처리 시간
  • [ 그림 3. ]  공개된 시뮬레이션 작업의 메쉬 파일 선택
    공개된 시뮬레이션 작업의 메쉬 파일 선택
  • [ 그림 4. ]  시뮬레이션 공유 서비스의 구조
    시뮬레이션 공유 서비스의 구조
  • [ 그림 5. ]  시뮬레이션 공유를 위한 시뮬레이션 처리 과정 설계
    시뮬레이션 공유를 위한 시뮬레이션 처리 과정 설계
  • [ 그림 6. ]  시뮬레이션 프로그램 수행에 대한 그래프
    시뮬레이션 프로그램 수행에 대한 그래프
  • [ 그림 7. ]  시뮬레이션 리스트 및 정보 검색 API
    시뮬레이션 리스트 및 정보 검색 API
  • [ 그림 8. ]  이력출처 스토어에서 공개된 시뮬레이션 작업
    이력출처 스토어에서 공개된 시뮬레이션 작업
(우)06579 서울시 서초구 반포대로 201(반포동)
Tel. 02-537-6389 | Fax. 02-590-0571 | 문의 : oak2014@korea.kr
Copyright(c) National Library of Korea. All rights reserved.