조선소 생산물류 시뮬레이션 결과 정도 향상을 위한 생산정보시스템 기간 정보 검증

Quality Verification of Legacy Data of Manufacturing Information System to Improve Results of Shipyard Manufacturing Logistics Simulation

  • cc icon
  • ABSTRACT

    Unlike other mass production in small variety, shipbuilding process is a project-based method in single variety, which causes unpredictable volatility in the planning system. In shipyards, series of manufacturing processes from fabrication to erection is sequentially carried out. In order to predict unfavorable changes such as overload or low load of working volume, computerized simulation has been being gradually adopted. The data used in the simulation are processed from the database of the main scheduling and planning system. Thus the quality of those data is very crucial for the meaningful results. Unfortunately, research on the verification of data quality is very rare and hardly known to the authors. In this work, using the database of scheduling and product information system of a large domestic shipyard, the data required for the simulation are qualitatively analyzed and verified.

  • KEYWORD

    시뮬레이션 , 생산관리시스템 데이터베이스 , 조선소 , 품질검증 , 자료표준화

  • 1. 서 론

    정보통신 기술의 발달은 기업체들의 경영방식에 큰 변화를 가져왔다. 글로벌 경쟁력을 갖춘 기업들은 여러 부서들 간에 데이터를 장벽 없이 실시간으로 공유하고 각 부문의 데이터들을 기반으로 신속하고 정확한 의사결정을 지원한다. 오늘날 기업은 정보 통신 기술에 기반을 둔 객관적인 데이터에 의존하지 않으면 생존하기 어렵다. 부정확하고 적절치 못한 데이터는 결국에 경쟁사보다 늦은 의사결정을 유도하거나 잘못된 판단을 내리기 때문이다. 또한, 최근 인터넷을 통해 유통되는 쓸모없는 데이터(garbage data)에 의한 피해 사례나 잘못된 데이터로 인한 영향이 얼마나 심각한지 대중매체를 통해서 잘 알려지고 있다 (Lee, et al., 2009).

    더 이상 데이터가 정보시스템의 부속품으로 여겨지는 시대는 지난 것으로 인식되고 있다. 데이터의 품질관리는 정보시스템에서 필수불가결한 프로세스이며 데이터 품질분석 및 진단은 데이터 품질관리를 위한 첫 걸음이다. 시스템 내부 데이터 중 어느 부분에 오류가 있으며, 원인이 무엇인지를 파악하는 것이 품질관리에서 가장 기초적인 업무이다.

    데이터 품질관리 요소는 크게 3가지 관점 즉, 데이터 값 관점, 데이터 구조 관점, 프로세스 관점으로 구분할 수 있다 (Gye, et al., 2006). 이들은 각각 상호 연계되어 시스템의 데이터 품질에 영향을 주고 있기 때문에 관리를 위한 지속적인 노력이 필요하다.

    조선소에서 다루고 있는 데이터 중에서 대표적으로 품질 관리가 필요한 정보가 일정 계획 정보라고 할 수 있다. 선박 한 척만 보더라도 말단 부품까지 내려간다면 몇 만개에 이르는 부품에 대한 정보가 있으며, 연단위로 보면 몇 척에서 몇 십 척을 생산하는 정보를 포함하고 있으므로 정보의 양이 방대할 수밖에 없기 때문이다. 조선소에서 사용하는 방대한 일정 계획 정보는 다시 하위의 공정 정보의 기준이 되기도 하고, 경영 지표를 측정하기 위한 기준이 되기도 한다. 기준에 해당하는 일정 계획 정보가 잘못되면 다른 결과에도 영향을 줄 수 있으므로 정보 품질을 확보하는 것이 매우 중요하다. 하지만 안타깝게도 조선 분야에서 데이터 품질에 대한 연구는 미비하거나 찾아보기 어렵다.

    정보 품질을 측정하고 개선하기 위해서는 평가 기준이 필요한데, 본 논문에서는 조선소의 방대한 일정 계획 정보를 생산 시뮬레이션의 관점에서 평가하고 개선하는 과정을 통해 조선소 일정 정보 품질 분석과 개선에 대해 연구하고자 한다.

    2. 정보 품질 측정

       2.1 정보 품질 측정 개요

    데이터 품질에 대한 중요성이 높아짐에 따라서, 여러 기업이나 기관에서 많은 관심이 높아지고 있는 추세이다. 이처럼 관심이 증가하는 이유는 보다 효율적인 데이터 보관 및 상호 교환을 통한 업무 효율 증진을 위함에 있다. 따라서 데이터 품질 관리는 정보 시스템 운영에 있어서 필수불가결한 요소 중 하나가 되어가고 있다. 일반적으로 데이터 품질 진단은 운영하는 정보시스템의 데이터 중 어느 부분에 오류가 있고, 그 원인이 무엇인지 파악하는 것이 우선 된다. 하지만, 아직까지 대부분의 기업에서는 이 부분에 대하여 효과적으로 관리가 이루어지지 않고 있다. 이에 따라, 본 논문에서는 국내 특정 A조선소를 대상으로 하여 데이터 정보 품질을 측정하고 개선책을 마련하고자 한다.

    데이터 품질 진단은 해당 기관이 운영 및 관리하고 있는 정보 시스템에 저장된 정형, 비정형 데이터의 품질을 측정하여 현재의 정보 품질 수준을 측정하는 것이 우선되어야 한다. 다음으로 측정한 정보 품질에 대하여 현재 수준의 품질 저하의 요인을 분석하여 개선사항을 제안하는 절차로 크게 볼 수 있다. 데이터 품질 진단은 오류 데이터 진단, 데이터 간의 연관성(긴밀성), 데이터 관리 프로세스의 효율성 진단 등으로 구분 할 수 있다.

    정형데이터 상에서 오류 데이터 진단은 실제 정보 시스템에서 사용되는 데이터 값에 대한 진단이다. 오류 데이터를 정의하기 위해서는 먼저, 품질 기준을 선정하여야만 한다. 품질 기준은 보통 완전성(completeness), 유일성(uniqueness), 유효성(validity), 일관성(consistency), 정확성(accuracy) 등의 5개의 항목을 이용하여 좀 더 세부적으로 분석되며 분석결과에 따라 품질 기준 목록이 마련된다. 일반적인 세부 품질 기준은 다음 Table 1과 같다. 상세한 품질 기준들을 정하는데 있어서 중요한 것은 확장된 세부 기준들이 실제 적용하여 측정 가능해야 한다는 것이다.

    이와 같은 오류 데이터 진단은 보통 현재 기관에서 운영 중인 DBMS 시스템과 호환 가능한 SQL 문법을 이용하여 진단하는 것이 일반적이다. 본 연구에서도 현재 해당 조선소에서 정형데이터들을 관리하고 있는 데이터베이스 시스템을 이용하여 데이터들의 품질을 진단하였다. 앞서 설명한 기준들에 의하여 1차적 데이터 정제를 수행한 후, 데이터 테이블 간의 연관성을 고려한 품질을 진단하였다. 데이터베이스의 테이블 간의 긴밀성을 고려하여 데이터 간의 정합성이 이루어지는 것이 무엇보다 중요하다. 이와 같은 데이터 품질 진단을 통한 효과적인 데이터 및 프로세스 관리는 시스템간의 업무 효율 증진, 데이터에 대한 신뢰도 향상 및 효율적인 데이터베이스 관리를 위한 하나의 지침을 제공해 줄 수 있다

       2.2 정보 품질 측정 중요성과 연구 사례

    조선소를 비롯한 대부분의 기업용 정보시스템(enterprise information system)은 대용량의 정보를 처리할 수 있는 시스템을 갖추고 있기 마련이다. 수작업으로 전수 조사가 불가능한 수준의 규모를 갖춘 대용량 정보를 다루는 경우, 정보에 대한 품질 측정은 매우 어렵고, 전수 조사가 불가능한 상황에서는 구조적이고 자동화한 방법을 따라 품질 측정 방법이 제공되어야 한다. 또한 대규모의 정보 유지 관리와 검색, 이용에는 시간과 컴퓨팅 자원이 소모되는데 품질이 낮은 정보는 비효율적인 소모가 크다. 이런 비효율적인 정보에 대한 최적화와 적절한 활용을 위해 품질을 파악하고 개선하기 위해 만든 방법 중 널리 쓰이고 있는 것이 데이터 품질진단 절차 및 기법 (Korea Database Agency, 2009)이다.

    대규모의 정보를 관리하고 있는 시스템에 해당 방법론을 적용했을 때 효과는 2012년 관세청의 정보 품질 개선 보고서 (National Information Society Agency, 2012)에서 Fig. 1의 내용을 확인할 수 있다. 이 보고서를 살펴보면 품질 개선 결과 90만 개에 이르던 거래처 코드에서 중복이 제거되어 81만개로 정리가 되었고, 정보 품질 분석을 통해 찾아낸 취약점을 보강하여 사이트의 입력 오류를 원천 방지할 수 있도록 개선했음을 알 수 있다. 이런 분석 및 개선을 통해 대규모 정보 관리에 필요한 자원이 효율적으로 사용할 수 있게 되었고, 검색과 분석 등의 업무 효율도 향상시켰다.

    국내 데이터베이스 산업 시장은 연 평균 6% 정도로 매년 성장하고 있다 (Korea Database Agency, 2009). 이에 따라, 국내 정보 품질 측정에 관련한 기업들의 인식 및 연구도 매년 상승하고 있다. 여러 산업 부문 중 데이터 품질 관리에 가장 성숙 수준이 높은 분야는 금융 산업이다. 하지만, 아직까지 대체로 데이터 품질의 중요성에 대한 인식은 충분한 반면, 구체적인 활동은 미흡하다고 볼 수 있다. 이와 같이 구체적인 활동이 어려운 이유 중 하나는 오류데이터 하나로 즉각적으로 바로 당사자에게 피해가 발생하지 않기 때문이다. 하지만, 이러한 인식으로 인하여 추후에 막대한 피해를 가져올 수도 있기 때문에, 금융산업에서는 여러 가지의 품질들 중 보안성을 중심으로 한 데이터 관리가 이루어 지고 있다. 또한, 최근 들어서는 보안성과 더불어 유용성 및 적시성의 품질 기준들이 주목되고 있다.

    위와 같은 사례를 참고하여, 본 연구에서는 막대한 부재 및 생산 관련 데이터를 관리하는 조선소 시스템을 분석하였고, 이를 기반으로 조선소 시뮬레이션 구현에 필요한 정보 시스템의 데이터 품질을 측정하여 데이터 품질에 대한 평가 방법을 개발하여 실제 사례에 적용하는 연구를 수행하였다.

    3. 조선소 물류 시뮬레이션의 정보

       3.1 조선소 물류 시뮬레이션 정의

    컴퓨터로 실제로 벌어지는 일을 모사하여 물리적인 실험을 대체하는 목적으로 수행하는 일을 시뮬레이션이라고 한다. 공학적인 의미에서 시뮬레이션은 여러 종류가 있으며 그 중 제조 산업에서 수행하는 시뮬레이션을 생산 시뮬레이션이라고 부르는데, 대표적인 분야 중 하나가 물류 시뮬레이션이다.

    물류 시뮬레이션은 설비와 인력, 공간 사이의 제품 이동을 컴퓨터 시뮬레이션으로 수행하고 그 과정에서 나타나는 물량 변화나 제품과 설비 등 단위 시뮬레이션 요소의 속성 변화를 추적한다. 물류 시뮬레이션을 수행해 얻는 결과는 물류 계획의 최적화나 공간과 설비 이용에서 부하평준화를 이루는데 이용하게 된다.

    물류 시뮬레이션이 항만이나 공항을 배경으로 이루어지게 되면 화물 운송과 보관에 대한 시뮬레이션을 수행하게 되고, 자동차나 항공기 등의 제조업에서 이용하게 되면 생산 계획이나 공간 활용의 효용성을 판단하는데 사용하게 된다. 조선소의 경우에도 마찬가지로, 조선소에서 물류를 다루는데 영향을 주는 요소인 정반 및 각 공장의 공간과 크레인, 대차 등의 설비가 어느 정도의 생산 물량을 다루게 되는지 확인하는 목적으로 사용하게 되고 시뮬레이션의 입력 정보로 조선소의 생산 계획과 해당 기간에 생산해야 하는 설계 정보를 이용한다.

       3.2 조선소 물류 시뮬레이션 연구 사례

    앞서 정리한 물류 시뮬레이션을 생산제조 분야에 적용한 것을, 생산물류 시뮬레이션이라고 정의하면, 많은 사례를 찾을 수 있다. 특히, 자동차와 같은 라인 생산 흐름을 갖는 자동화 시스템에서 관련 연구가 활발히 진행 중이다. 또한, 소품종 주문 생산과 셀 기반 생산 시설을 갖추고 있는 항공산업에서도 생산 기간을 단축하기 위해 부품의 작업장 내 최적 경로를 찾는 연구 (Zbigniew, et al., 2008)처럼 생산물류 시뮬레이션 연구가 활발한 편이다.

    조선 역시 생산 고도화를 위한 생산물류 시뮬레이션 연구가 많이 진행되었다. 디지털 조선소를 목표로 모델링 및 시뮬레이션을 위한 프레임워크를 구축하고 상세한 방법론을 고안한 논문 (Woo, et al., 2005)이 대표적이다. 기존 생산물류 시뮬레이션이 항공과 자동차 분야에서 발전한 까닭에 산업적인 특성이 다른 조선 생산 분야를 고려한 체계적인 방법론이 필요했고, 해당 연구는 그런 관점에서 프레임워크와 방법론을 구축한 내용을 다룬다. 연관 논문으로 위에서 다룬 프레임워크를 기반으로 조선 소조립 공정을 모델링한 사례 (Shin, et al., 2002)의 선행 연구가 있었으며, 경정 생산 공정에 적용한 사례 (Lee, et al., 2006b)처럼 후속 연구가 있었다. 또한, 조선소의 레이아웃에 별도의 방법론을 적용하고 생산 시뮬레이션을 통해 검증한 연구 역시 조선 생산물류 시뮬레이션의 한 종류로 볼 수 있다.

    조선 생산물류 시뮬레이션에 대한 연구는 다양한 방향에서 지속적인 성과가 있었다. 앞에서 다룬 연구와는 다르게 대일정 단위의 거시적인 수준의 영역에 시뮬레이션을 적용한 사례 (Kim, et al., 2012)도 있으며, 좀 더 구체적인 시스템 수준의 기반을 연구한 사례 (Lee, et al., 2011) 역시 있었다.

       3.3 조선소 생산물류 시뮬레이션의 정보 특성

    조선소 생산물류 시뮬레이션을 수행하기 위해서는 조선소에서 실제로 사용하는 생산 일정 정보가 필요하다. 해당 정보는 다양한 소프트웨어 시스템을 이용해서 조선소마다 관리를 하고 있는데, 기업용 소프트웨어 영역에서는 대규모의 계층적 일정 관리를 하는 소프트웨어를 APS(Advanced Planning System)라고 부른다. 해당 시스템은 시스템에서 다루는 일정 정보의 규모와 계층이 크고 복잡할수록 별도의 시스템으로 존재하게 된다. 생산계획 시스템의 일정 정보는 생산 구매, 인사, 사업 계획과 밀접하게 연결되어 있기 때문에 별도의 APS시스템이 구축되어 있더라도 다른 기업 소프트웨어 시스템과의 연결이 매우 중요하고 대규모가 아닌 경우라면 다른 정보 시스템에 포함되어 이용되게 된다. 조선소의 상황과 규모에 따라 일정 정보의 계층과 구성이 다르지만 조선소의 생산 계획 평가 프레임워크를 구성한 논문 (Lee, et al., 2006a)에 따르면 성격에 따라 5개 정도의 계층으로 구분된다.

    조선소 생산물류 시뮬레이션의 기반이 되는 정보가 조선소 자체적으로 관리하고 있는 일정 정보라면, 여기에 짝을 이루는 생산 정보가 있어야 시뮬레이션이 가능하다. 여기에는 조선소 설계 시스템에서 생산 수준까지 전개한 생산 도면과 조립 계층 정보가 포함되고, 조선소 내부에서 사용 중인 설비와 인력을 활용하기 위한 구성 정보가 모두 망라된다.

    4. 조선소 생산관리시스템 정보 분석

       4.1 조선소 생산관리시스템 개요

    일반적인 생산 관리 시스템은 총괄 생산 계획에 관련된 생산 일정, 자재, 인력, 외주, 재무, 부분에 대한 계획을 세우는데 필요한 핵심 정보 등을 제공한다. 조선소의 경우 조선소의 생산기반 시설은 고정되어 있는 구조를 가지고 있으나 생산되는 호선에 따라 각기 다른 선종 다른 사양을 가지고 있어 동일 생산라인에서 여러 제품이 동시에 생산되는 혼류 생산 형태를 보이므로 신규 수주가 이루어 졌을 때 기존에 계획되어 있는 생산 물량과 맞물려 신규 생산계획이 수립 되어야 하는 특징이 있다. 신규 수주시 예상되는 부하를 파악하고 각 생산시설에 물량을 배분 하며 필요 시 이전 생산 계획의 수정을 거치게 되며 이에 필요한 일정 계획 정보를 제공한다. 이와 같은 일정을 계획하기 위해서는 조선소의 기반시설에 관한 정보가 요구되며 이런 정보들은 조선소의 크레인이나 공정 중의 절단, 곡가공 등에 관련된 설비 정보, 블록의 이동 에 관련한 대차 등에 관한 사양과 각 단계별 처리량을 알 수 있다. 제품 정보는 각 공정 별로 처리해야 하는 제품에 관한 정보인 제품 처리 머신, 부재나 블록 별 해당 공정을 나타낸다. 이런 정보를 통합하여 통보함으로써 의사결정을 함에 있어 각기 다른 부서들 간의 소통을 원활하게 하고 의사 결정에 신속함을 가질 수 있게 해주는 것이 조선소의 생산관리 시스템이다.

       4.2 조선소 생산관리시스템의 일정 정보

    생산관리시스템의 일정 정보는 선표를 기초로 하여 계획되며 선행중일정, WOP(work package), WOD(work order) 순으로 계획된다. 선표의 경우 전체 건조 일정과 키 이벤트인 스틸 커팅이나 기공 진수식 등의 일정을 대표적으로 나타내며 이것을 기초로 선행중일정이 계획된다.

    Table 2와 같이 선행중일정 단계에서는 블록의 가공, 조립, 의장, 도장과 같은 전체 상부 공정에 대한 계획이 이루어진다. 다음으로 상부 공정 계획을 바탕으로 하여 실행 계획이 수립된다. 실행 계획은 상위 실행 계획인 WOP와 하위 실행 계획인 WOD 두 가지로 분류되며, 이때 WOP는 WBS 코드에 맞추어 구성 공정 별 작업 묶음 단위로 지정된다. WBS는 Work Breakdown Structure의 약자로, 업무 구조를 계층적으로 구성하여 분석하는 방법론이다.

    관리부서 간 생산에 필요한 모든 정보를 WOP코드에 연계하여 관리하며 설계, 자재, 생산, 품질의 공정 및 비용을 계획하고 실적을 집계 및 분석한다. WOP가 대, 중, 소조립 단계까지 나타나 있는 실행계획이고, WOD는 그보다 하위 정보로 각 공정을 세분화 하여 나타내는 공정 별 일일 작업 지시가 가능한 수준의 실행계획이다. 소조립을 예로 들자면 WOP에서는 A라는 블록의 소조립이 언제까지 이루어지는지를 나타내고 WOD는 조립 과정 중의 배제나 용접 등의 공정 일정을 나타낸다. WOD 또한 WBS 코드에 따라 정의되며 조선소의 모든 일정 계획들은 Fig.2에서 확인할 수 있듯이 계층적인 구조를 가지며 상위 요소로 갈수록 세부적이다.

       4.3 조선소 생산관리시스템의 제품 정보 분석

    제품정보는 선박을 건조함에 있어 필요한 부재나 블록들에 해당하는 정보들을 나타내는 것으로 가장 하위인 부재부터 상위 블록까지의 정보들을 포함하고 있다.

    부재에 해당하는 정보들은 A조선소를 기준으로 했을 때 강재 절단 정보, 블록 계층 구조 등이다. 강재절단 정보는 해당 부재의 도면 번호, 다음공정에서의 블록번호, 부재의 종류, 부재의 위치, 공정, 최종조립블록, 부재의 크기정보, 부재를 처리하기 위한 머신 등에 대한 정보들을 나타낸다.

    강재 절단 정보는 해당 부재의 도면 번호, 다음 공정에서의 블록넘버, Table 3에서 확인할 수 있는 부재의 종류, 부재의 위치, 공정, 최종조립블록, 부재의 크기정보, 부재를 처리하기 위한 머신 등에 대한 정보들을 포함한다.

    부재의 공정에서 해당 부재가 곡부재인지 평부재인지에 대한 정보를 알 수 있고 이 정보를 바탕으로 강재가 어느 생산라인으로 분배될지 알 수 있으며 해당 부재의 상위 블록을 확인함으로써 완성된 부재가 곡블록 공정으로 투입될지 평블록 공정으로 투입될지에 대해서도 확인할 수 있다.

    블록 계층 구조는 해당 블록을 조립하기 위해 필요한 모든 블록을 나타낼 수 있어야 한다. 이 정보를 바탕으로 하여 조립 베이에 어떤 블록과 부재들을 가져와서 조립할지를 판단할 수 있으며 조립 대상 블록과 부재 중량의 총 합은 해당 블록의 무게와 동일하며 약간의 차이는 공통 부재 등의 결합여부에 따라 발생한다. 이 중량의 기준은 공통 부재를 포함한 부재로 한다. 조립의 순서는 블록 계층 구조에서 해당 하위 블록들의 코드 중 맨 끝자리 알파벳으로 정하며, 각 알파벳은 조립 순서와 블록 위치에 해당하는 정보를 담고 있다. 동일한 알파벳을 보유한 부재나 블록들은 조립 순서를 고려하지 않는다. 이러한 여러 제품 정보 들은 자원정보 일정 정보와 합쳐져서 조선소의 생산관리시스템을 구성하게 된다.

       4.4 조선소 생산관리시스템의 자원 정보 분석

    조선소의 생산 자원은 일반적인 제조업의 생산시설과 달리 한 가지 제품만을 지속적으로 생산하는 것이 아니라 매 호선마다 다른 사양의 선박이나 플랜트를 생산해야 하기 때문에 공정 자체를 한 호선에 맞추어 최적화할 수 없는 특징을 가지고 있다. 생산 자원은 조선소에서 생산 시 사용 가능한 공간, 설비, 인력을 모두 포함하는데, 해당 공정에 따라 생산 자원이 할당되고 해당 공정으로 블록이나 부재가 들어오게 되면 블록을 제작할 정반이 설치된다. 정반은 공정에 따라 종류를 달리하며 생산 자원을 관리하기 용의하도록 크게는 도크 별로 분류되며 작게는 장비마다 코드를 부여하여 관리하게 된다. A사 장비 코드의 경우 OOO중 두 글자는 장비의 명칭을 나타내며 3번째는 장비가 위치해 있는 베이를 나타내는 방식으로 장비를 관리한다. 크레인의 경우에는 각 공장 별 크레인의 배치에 따라 공장에서 처리 가능한 블록의 기준이 되기도 한다. 한 블록이 해당 공정을 마치고 다음 공장으로 이송될 때, 다음 공장으로 이동할 수 있는 크레인은 블록을 이송하는 대차의 역할 또한 수행한다.

    대차와 같은 트랜스포터(transporter)들은 블록 운반 시 최적의 이동경로가 별도로 지정되는 것은 아니며 운전자의 경험에 의해서 다음 공정으로 옮겨질 이동 경로를 찾는 것이 일반적이다. 또한, 곡블록과 평블록의 처리 공장을 구분하는 조건은 베이 별로 보유하고 있는 장비의 종류에 따라 결정된다. 각 생산라인에서의 진행 과정은 강재가 라인으로 들어온 후 그 시점에 이용 가능한 장비를 선택해서 이루어진다.

    처리 가능한 블록의 크기는 크레인의 사양, 베이의 면적 등에 의해서 결정 되며 대블록 조립장에서는 소, 중조립 블록도 제작이 가능하다.

    5. 조선소 생산관리시스템 정보 품질 분석

       5.1 조선소 생산관리시스템 정보의 연관 관계 분석

    앞서 분석한 일정정보, 제품정보, 자원정보에 대한 데이터들은 실제로 시뮬레이션 구현을 위한 데이터로 가공되어야만 한다. 또한 가공을 위해서는 필요한 데이터에 대한 구조 정의가 선행되어야 한다.

    일정정보에 대한 데이터 계층 구조는 각 데이터의 어트리뷰트 형식에 맞게 조선소의 생산 시스템 데이터로부터 채워진다. 일정정보 데이터들의 계층 구조는 Process, WorkType, WorkPackage, WorkOrder, Activity로 구분하여 정의하였다. 예로, Process-WorkType은 같은 호선에 대하여 Process-ID가 WorkType-ID를 포함해야 한다.

    자원정보에 대한 데이터 계층 구조는 Table 4와 같이 정의되며, 속성(attribute)의 형식에 맞게 조선소의 자원정보 데이터로부터 채워진다. Resource-EquipmentID는 WOD-EquipmentID 와 연결이 되지만, 실제로 해당 작업에 자원정보에 대해서는 상호 참조 형식이 아닌 WOD-EquipmentID에서 시뮬레이션 구현 시 플랜트 정보를 고려하여 참조하는 방식이다. 그렇기 때문에, 자원정보와 다른 데이터 간의 연결성은 본 논문에서는 다루지 않았으며, 자체 데이터의 정합성만 검사하였다.

    제품정보에 대한 데이터 계층 구조는 Table 5와 같이 정의되며, 일정정보와 마찬가지로 채워진다. 제품정보의 데이터는 블록과 부재로 양분되고, ID와 ParentID로 제품 간 상하위 구조를 정의한다. 제품정보는 일정정보의 Activity-ID와 WOD-ID, WOP-ID와 연결성을 유지한다.

       5.2 조선소 생산관리시스템의 정합성 분석 방법

    본 연구에서는 데이터 품질진단에 관한 대표적인 실무 지침서인 데이터 품질진단 절차 및 기법 (Lee, et al., 2009)을 참조하여 데이터를 분석하였다. 데이터 소스 분석은 크게 두 가지 방향으로 진행하였다. 먼저, 데이터 테이블의 각 컬럼 별로 오류현상 및 문제점을 발견해나가는 방식과 각 테이블의 컬럼들 간의 연결성을 규정하여 데이터의 품질을 평가하는 방식이다. 전자는 주로 업무규칙을 도출하여 데이터 프로파일링 분석을 통하여 이루어진다. 프로파일링 분석을 위한 세부 품질 기준은 표준 품질 기준 및 시뮬레이션 구현 및 결과에 미치는 영향력을 고려하여 선정하였다. 그리고 앞서 분석한 조선소 생산관리시스템의 데이터들 중 시뮬레이션 구현 및 활용에 미치는 영향력에 따라서 프로파일링의 대상을 추출하였다. 그리하여 세부 품질 기준 및 프로파일링 대상은 Table 6과 같이 정하였다.

    프로파일링 분석은 컬럼 별 속성을 분석하여 대상 컬럼의 총 건수ㆍ유일값 수ㆍNULL값 수ㆍ공백값 수ㆍ유효값 수 등을 각각 산출하여 그 값들이 유효범위 내에 존재하는가 여부를 일차적으로 판단한다. 보통 데이터베이스로부터 프로파일링 분석을 위한 기초 통계데이터는 SQL문을 사용하여 추출하였다.

    유형별로 데이터들의 프로파일링 기법의 차이가 있다. 본 연구에서는 먼저 데이터 컬럼의 완전성 검증을 실시하였다. 완전성 검증은 모든 컬럼을 대상으로 이루어지며, 누락 값 분석을 통한다. 누락 값 분석은 값의 누락이 발생된 컬럼을 추출하는 필수적인 과정으로 보통 NULL값의 분포와 공백값(“ ”), 숫자’0’ 등의 분포를 파악하여 실시한다. 두 번째는 유효성 검사 중 하나인 값의 허용범위 분석으로 컬럼의 속성값이 가져야 할 범위 내에 속성값이 있는지의 여부를 파악하는 것이다. 보통 해당 속성의 도메인의 유형에 따라서 그 허용 범위가 결정되며, 자료형의 크기ㆍ실수형의 경우 자릿수 및 소수점 등을 고려한다. 세 번째는 허용값 목록 분석으로 해당 컬럼의 허용값 목록이나 집합에 포함되지 않는 값을 발견하는 분석 방법이다. 한 예로 블록 및 부재 정보의 경우, 크기, 무게, 개수 등을 포함하는데, 이는 반드시 0보다 큰 양수여야만 한다. 네 번째는 컬럼의 패턴으로 컬럼 속성값의 특성을 문자열로 도식화한 것이다. 보통 반복되고 변형되는 대표적인 모형을 미리 정형화하여 해당 컬럼의 특성을 파악하기 쉽게 해놓은 데이터 표현 방법 중 하나이다. 일반적으로 패턴 유형은 육안으로 식별할 수 있는 수준에서 패턴을 적용해야 하며 그 패턴의 종류가 너무 다양할 경우에는 적용하지 않는다. 따라서, 육안으로 보았을 때 오류로 추정되는 데이터들을 추출한다. 이 경우, 본 연구에서는 각 테이블의 ID가 대표적인 예이다. 이는 각 각의 자릿수마다의 규칙을 가지기 때문이다. 다섯 번째는 날짜유형 분석으로 보통 2가지의 형태로 구분된다. 데이터베이스에서 제공되는 YYYY-MM-DD와 같은 DATETIME의 형태와 년ㆍ월ㆍ일ㆍ요일ㆍ시간 정보로 나타내는 형태이다. 본 조선 생산 시스템의 데이터베이스에서는 전자의 경우를 사용한다. 보통 날짜는 유효범위에 어긋나는 데이터를 추출한다. 마지막으로 유일값 분석은 작업에서 유일해야 하는 컬럼에 중복이 발생하였는가를 파악하기 위한 것이다. 주로 테이블의 고유 값으로 사용되는 컬럼 속성값들이 주요 유일값 분석의 대상이 되고, 컬럼의 유일한 고유값이 존재하지 않을 경우에는 서로 다른 두 개의 컬럼을 조합하여 고유값으로 변환하여 분석하기도 한다. 본 연구에서는 각 호선에 해당하는 작업 아이디를 들 수 있다. 이러한 분석 및 프로파일링 결과물을 취합하여 각 컬럼 별로 다양한 항목들에 대하여 오류비율을 산출하였다. 이와 같이 프로파일링 결과를 통하여 업무규칙을 도출할 대상 데이터 항목을 사전에 정의하여, 작업의 순서를 정의하여 계층적으로 수행함으로써 작업의 효율을 높일 수 있다.

    데이터 테이블의 컬럼 자체 정합성 검사 후에는, 컬럼 간의 연결성을 검사한다. 5.1장에서 정의한 컬럼들 간의 연결관계를 바탕으로 하여 위와 마찬가지로 해당 호선 별로 테이블 간의 보존율 및 오류율을 산출하였다. 본 연구에서 컬럼 간의 정합성 검사는 품질기준 중 일관성에 포함시켜 검사를 진행하였다.

       5.3 조선소 생산관리시스템 정보의 품질 평가 기준

    앞서 핵심 데이터 항목들에 대하여 세부 품질 기준 및 방법을 결정하였다. 핵심 데이터 항목들은 시뮬레이션 구현에 매우 중요한 영향을 미치기 때문에 핵심 정보항목과 매핑되는 업무규칙은 별도로 분류하여 품질을 측정하도록 하였다.

    본 장에서는 앞서 분석한 데이터들의 오류율을 종합하여 실시간 대상 시스템의 데이터의 정확률을 나타내는 종합 품질 지수를 산출하였다.

    일반적으로 해당 업무규칙 별 중요도를 가중치로 부여하고 가중평균을 계산하여 종합 오류율을 산출하는 방식을 사용한다. 업무규칙 별 가중평균을 계산하기 위해서는 각 컬럼마다 업무규칙 중요도 항목을 산정해야 한다. 조직에서 관리하는 데이터는 관리 목적에 따라 평가되는 중요도가 서로 상이하므로 데이터 항목별로 중요도를 차등 관리할 필요가 있다. 중요도를 산정하여 측정 기준 간의 가중치를 정의하는 방법은 사전정의(predefined)방식이나 임의적(ad-hoc)방식이 일반적이다. 보통 사전정의방식은 기존에 유사한 연구 사례가 있는 경우에 이용하지만, 본 연구에서는 유사 연구 사례가 존재하지 않기 때문에 임의로 중요도를 선정하였다. 이는 사전에 정의된 바가 없으므로 별도의 중요도를 산정해야 하는 경우에 유용하며, 통계적 분석방법을 통해 측정 기준 간의 가중치를 정량적으로 산출하는 방법이다. 본 연구에서는 이와 같은 임의적 방식들 중에서 AHP(Analytic Hierarchy Process)방법을 적용하였다 (Bhushan & Rai, 2004). 시뮬레이션 담당자, 품질 담당자 등을 포함한 관련 전문가들의 의견을 적절히 반영하여 검증된 판단 기준을 정의하고 이에 따라 중요도를 산정하였다. 중요도를 선정할 품질 기준이 계층적으로 구분이 가능하고 범위가 명확하며, 정량적인 평가가 가능한 AHP의 특징이 본 연구의 목적과 잘 들어맞기 때문이다.

    AHP 분석법에 의한 중요도 산정 절차는 Fig. 3과 같다. 본 연구에서는 의사결정을 위한 상대비교 기준으로 중요도를 선정하였다. 지표 간 비교평가를 위해 5가지 지표(테이블의 중요도, 컬럼의 중요도, 시뮬레이션에 미치는 영향도, 일정계획 수립 시 영향도, 다른 테이블과의 연관도)를 선정하여 지표 간에 1:1 상대 비교를 위한 비교평가척도를 정의하였다. 비교평가는 9점 척도 체계를 적용하였다. 이를 바탕으로 하여 Table 7과 같이 지표 간 비교평가 결과에 따른 비교 Matrix(I)를 작성하여 각 컬럼의 합계를 구한다. 다음으로 각 지표의 값을 컬럼 별 지표 합산 값으로 나누어 지표 별 평균을 구하고 각 행(row)에 대해 지표 별 평균의 합을 컬럼 수로 나눈 행평균을 구한다. 마지막으로 각 지표별로의 행의 평균값을 소수점 1자리까지 구하여 합이 1이 되도록 한다. 이와 같이 구한 지표 별 중요도는 품질측정 시 항목별 가중치를 차등 적용하기 위한 목적으로 활용된다.

    이와 같은 AHP 분석법에서 중요한 것은 전문가의 의견을 수렴하여 논리적 일관성을 유지하는 것이다. 본 연구에서는 10명의 전문가들이 평가한 결과로 각 지표 별 중요도를 산정하여 결과의 신뢰성을 향상시키고자 하였다. 지표 간 비교 평가에서 신뢰성 검증과 논리적 일관성 유지에 대한 검사는 일관성 지수 (consistency index; CI)를 적용한다. 일반적으로 CI 값은 0.1 이상이 되면 응답자의 응답을 신뢰할 수 없다고 판단한다. CI는 식 (1)과 같이 구한다.

    image

    여기서 λmax는 최대고유치이고, n은 행렬의 차원(지표수)으로, n x n 행렬 [A]와 n x 1 가중치 행렬[T]를 곱하면 새로운 n x 1 가중벡터행렬 [R]이 산정된다. 이때, 가중벡터행렬의 구성요소 R1, ..., R2를 이용하여 식 (2)와 같이 를 구할 수 있다.

    image

    본 연구에서 산출된 CI 값은 0.0174로서 0.1 보다 작기 때문에 지표 간 비교평가에 대해서 논리적 일관성 유지 및 신뢰성을 가지고 있음을 확인할 수 있다. 최종적으로 산정한 지표 별 가중치는 Table 9와 같다.

    이와 같이 컬럼 별로 업무규칙에 따라 지표에 대한 중요도를 A(3), B(2), C(1)로 점수를 매긴다. 이에 따라 종합 가중치(W)를 다음과 같이 산출한다.

    image

    식 (3)을 이용하여 컬럼 별 종합 가중치를 산정하여 오류율(ei)과 전체 오류율(E)을 구할 수 있으며, 최종적으로 Table 8을 통하여 전체 품질 지수(I)를 산정할 수 있다. 계산식은 다음과 같다.

    image

       5.4 조선소 생산관리시스템 정보 품질 분석 사례

    본 연구에서는 특정 대형조선소의 한 개 호선에 대한 일정정보, 제품정보를 바탕으로 하여 생산관리시스템 데이터 품질을 분석하고 검증하였다. 분석 단계는 크게 2가지로 구분되며, 먼저, 데이터 분석을 진행하기 위하여 5.1절에서 정의한 시뮬레이션을 위한 데이터 구조에 따라 조선소 생산관리시스템 데이터를 재정의해야만 한다. 이를 위하여 데이터들을 앞서 정의한 구조 틀에 따라 재정의 하는 요소프로그램을 개발하였다. 구조에 맞게 재정의된 데이터는 앞서 정의한 세부 품질 기준에 따라 프로파일링된다. 해당 업무규칙에 따라 각 테이블들의 컬럼들의 오류 건수를 측정하였으며, 최종적으로 5.3장에서 설명한 방법론에 따라 Table 10과 같이 하나의 조선소의 한 개의 호선에 대한 최종 종합 품질 지수를 산출하였다.

    이와 같이 산출한 종합 품질 지수를 이용하여 조선소 생산 시뮬레이션 구현을 위하여 입력된 데이터에 대한 신뢰도 및 논리일관성을 판단할 수 있다.

    6. 결 론

    본 연구는 대용량의 기업 정보를 다루는 현장에서 정리된 정보 품질 분석 방법을 그 동안 사례가 전무했던 조선소 물류 시뮬레이션 정보 분석에 적용하였다. 지표 간 비교 평가의 신뢰성 검증과 논리적 일관성 유지에 대한 검사를 위하여 일관성 지수 (consistency index; CI)를 적용하였고, 예제를 통하여 제안된 방법론이 적절하게 작동함을 보였다.

    한국조선업의 미래를 고려할 때, 대용량 기업 정보, 그 중에서도 자동화가 필요한 생산 정보에 대한 체계적인 분석과 활용성 검토를 적용했다는 점이 본 연구의 의의라 하겠다. 물류 시뮬레이션을 위한 기존 생산 일정 및 공장 정보에 분석을 수행하였지만, 다른 조선소의 기업 정보나 미처 전산화 하지 못한 비정형 정보에 대해서도 디지털화와 함께 정보 분석 방법론을 적용한다면 훨씬 효과적이고 실무에 도움이 되는 결과를 얻을 수 있을 것이다.

    추후 연구에서는 물류 시뮬레이션의 결과와 입력 정보 사이의 연관성 분석을 추가하여 시뮬레이션 생애 주기에 걸친 프레임워크를 구성하고 정보 품질을 객관적 지표로 지속적인 개선이 가능한 방법론을 정립하는 방향으로 진행할 예정이다.

  • 1. Bhushan N., Rai K. 2004 Strategic Decision Making: Applying the Analytic Hierarchy Process google
  • 2. Gye C.S., Myung J.H., Park J.S., Park T.H., Lee Y.S., Lee S.H., Jang S.E., Choi M.Y., Park M.S., Kim S.Y., Shin S.S., Kim I.C., Lee B.J., Bae Y.J. 2006 The Guideline for Data Quality Management(Ver2.1) google
  • 3. Kim G.S., Hwang H.J., Lee J.H. 2012 Discrete Event Simulation for the Initial Capacity Estimation of Shipyard Based on the Master Production Schedule [Transactions of the Society of CAD/CAM Engineers] Vol.17 P.111-122 google doi
  • 4. 2009 Data Quality Assessment Procedure Manual google
  • 5. Lee D.W., Park T.S., Park S.K., Park S.C., Wang J.N. 2011 Build an integrated database system for efficient assembly scheduling in ship-building [Proceeding of the Korean Institute of Industrial Engineers Annual Spring Conference] Vol.23 P.684-689 google
  • 6. Lee J.M., Jo S.W., Choi Y.R., Shin J.G. 2006 A development of planning evaluation framework for large scale shipyard [Proceeding of the Korean Institute of Industrial Engineers Annual Autumn Conference] Vol.17 P.44-51 google
  • 7. Lee S.W., Lee K.K., Woo J.H., Choi Y.R., Lee S.H., Shin J.G. 2006 A Simulation approach for improvement of racing boat manufacturing processes [Proceeding of the Korean Institute of Industrial Engineers Annual Autumn Conference] Vol.17 P.71-78 google
  • 8. Lee C.H., Kim S.Y., Shin S.S., Seo J.S., Im S.J., Lee D.H., Park S.Y., Myung J.H., Jegal S.Y. 2009 Data Quality Assessment Procedure Manual(Ver 1.0) google
  • 9. 2012 Korea customs service data quality assessment examples google
  • 10. Shin J.G., Lee J.H., Woo J.H., Kim Y.K., Lee J.M. 2002 A Digital Manufacturing Model of Shipyard Forming-Shop [Journal of the Korean Welding and Joining Society] Vol.20 P.10-17 google
  • 11. Woo J.H., Oh D.K., Kwon Y.D., Shin J.G., Seo J.N. 2005 Simulation Modeling Methodology and Simulation Framework for a Construction of a Digital Shipyard [Journal of the Society of Naval Architects of Korea] Vol.62 P.411-420 google
  • 12. Zbigniew B.M., Manuel N., Mu L., Sean P. 2008 Simulation of a Machining Sequence using Delmia/Quest Software [Computer Aided Design And Applications] Vol.5 P.401-411 google doi
  • [Table 1] Detailed quality standard
    Detailed quality standard
  • [Fig. 1] Data quality assessment of Korea customs service
    Data quality assessment of Korea customs service
  • [Table 2] Example of preliminary master planning of shipbuilding
    Example of preliminary master planning of shipbuilding
  • [Fig. 2] Hierarchical structure of shipbuilding schedule
    Hierarchical structure of shipbuilding schedule
  • [Table 3] Piece shape codes
    Piece shape codes
  • [Table 4] Resource data structure
    Resource data structure
  • [Table 5] Product data structure
    Product data structure
  • [Table 6] Targets for data quality standards
    Targets for data quality standards
  • [Fig. 3] Importance estimation by AHP method
    Importance estimation by AHP method
  • [Table 7] Comparison between Indicators: matrix(I)
    Comparison between Indicators: matrix(I)
  • [Table 8] Comparison between Indicators
    Comparison between Indicators
  • [] 
  • [] 
  • [Table 9] Final weighting factors for indicators
    Final weighting factors for indicators
  • [] 
  • [] 
  • [Table 10] Result of integrated data quality for one line
    Result of integrated data quality for one line