일반적으로 수문현상(강우, 홍수, 가뭄 등) 분석을 위해서는 최대한 장기간의 자료를 수집하는 것이 바람직하나(Kim et al., 1998), 이러한 자료의 수집에는 시공간적인 한계가 있다. 특히 우리나라의 경우에는 측우기를 이용한 강우량자료가 1700년대부터 존재하고 있으나 관측방식과 지점, 기간의 불확실성으로 인하여 적용이 어려우며, 대부분 1970년대부터 관측된 자료를 이용하여야 하는 한계가 있다(Mun and Lee, 2011). 이에 대한 대안으로서 오랜 기간의 자료를 획득할 수 있는 기후적 지표를 활용하려는 연구가 진행되고 있으며 특히, 500년 이상의 자료를 확보할 수 있는 Tree-ring 을 이용하여 실측치 이전의 자료를 추정하는 연구(Kim et al., 1998)는 수문자료에 대한 통계적인 분석 측면에서 의미가 있다.
이에 따라서 Tree-ring을 이용하여 과거의 시계열을 재현하려는 연구가 활발하게 이루어졌다. Ferguson (1968)이 캘리포니아 지역의 나이테 자료를 이용하여 과거의 시계열 자료를 분석하여 적용 가능성을 제시한 이후에, Fritts (1969)이 Tree-ring 분석을 통하여 수자원 분야 연구에 활용할 수 있음을 보이고 기후와의 연관관계를 심도 있게 분석하기도 하였다(Fritts, 1976). 또한, Blasing and Duvick (1984)가 연 강우량 자료를 재생성하는 등 Tree-ring 자료를 통하여 직접적인 기후 인자를 재생성하는 연구들이 수행되기도 하였다(Cleaveland et al., 2003; Díaz et al., 2001; Gray et al., 2004; Hughes et al., 1994). 이와 같이 Tree-ring 자료가 기후요소와 큰 상관성을 가지고 있기 때문에(Fritts, 1965), 수문기상 분야에서 Tree-ring을 관심 있게 다루고 있다. Meko et al. (1980)은 Tree-ring 자료를 이용하여 1700년대의 PDSI (Palmer Drought Severity Index; Palmer, 1965)를 다중회귀분석을 통하여 재생성하고 가뭄 분석을 수행하는 등, 가뭄과 같이 직접적으로 영향을 받는 분야에서 관련 연구가 수행되었다(Cook and Jacoby, 1977; Stahle and Cleaveland, 1988). 또한, Park and Yadav (1998)는 한국 중서부의 5월 강수량을 소나무 연륜을 이용하여 복원하여 한국의 기후자료 복원에 나이테를 이용하는 가능성을 보였다. 특징적으로, Tree-ring과 수문현상에 대한 연구는 년 단위의 수문현상에 대해서 주로 수행되어 왔다(Li et al., 2006; Li et al., 2007; Meko et al., 1995; Raffalli-Delerce et al., 2004;Stahle et al., 2000; Stahle et al., 2007; Tian et al., 2007;Till and Guiot, 1990; Woodhouse and Overpeck, 1998). 이는 Tree-ring 자료를 통하여 연 단위의 자료가 재생성되기 때문에 짧은 지속기간을 가지는 수문현상을 분석하기에는 어려움이 있기 때문이다. 그러나, 최근에는 계절적 특성을 가지는 지역의 Tree-ring을 이용하여 계절단위의 자료와 연관짓는 연구도 수행중이다(Esper et al., 2002; Leavitt, 2002; Liu, Ma et al., 2004; Liu, Shi et al., 2004).
그러나, 지금까지 이루어진 연구에서는 주로 Tree-ring과 기후 자료를 주로 선형적인 상관관계에 있는 것으로 간주하여 재생성하는 문제가 존재한다. 기존의 연구에서 Tree-ring 자료가 가지는 비선형 추계학적 특징이 제시되었으므로(Grassberger, 1986; Kim, 1997) 자료의 비선형성・추계학적 특성을 반영하는 재생성이 필요하다. 그에 따라서, 최근에는 추계학적 특성을 반영할 수 있는 Tree-ring 연구가 이루어지기도 하였으나(Devineni et al., 2013; Gray et al., 2004; Raffalli-Delerce et al., 2004; Stoffel and Bollschweiler, 2009), 최근까지도 선형적인 가정에 기반을 둔 재생성 기법이 많이 사용되었다(Akkemik et al., 2005; Brázdil et al., 2002; Salzer and Kipfmueller, 2005; Woodhouse, 2001;Wilson and Luckman, 2002; Xuemei and Xiangding, 1997). 이에 본 연구에서는 설악산지역의 Tree-ring 자료를 사용하여 강릉 유역의 연 강우량 자료를 비선형 추계학적 특성을 모의할 수 있는 인공신경망과 인공신경망에 전진 전파 알고리즘을 적용한 NARX를 이용하여 재생성하고 그 통계적인 특성을 검토하여 Tree-ring 자료를 이용한 재생성 방법론을 제시하고자 하였다.
신경망 이론(Neural network theory)은 인간의 기억이 신경(Neuron)들의 망으로 구성되고 노드(node) 사이의 연결강도를 바탕으로 기억이 구성되는 구조를 모사하는 이론(Hopfield, 1982)으로서, 미국의 Rosenblatt(1958)가 패턴의 분류를 위하여 퍼셉트론(perceptron)을 제시한 이후에 비선형 또는 비정형 정보를 처리하기 위한 방법으로 널리 사용되고 있다. 신경망 모형에서의 학습은 입력층(input layer), 출력층(output layer), 은닉층(hidden layer)으로 구성된 다층 신경망의 노드(node)의 연결강도를 최적의 상태로 적응시키는 것을 의미하며, 이 과정에서 오차 역전파 알고리즘(error back propagaton algorithm)을 통하여 입력과 출력에 대하여 전달함수를 이용하여 순방향 처리를 수행하고, 발생한 오차를 역방향으로 전달하면서 오차가 최소화 되도록 층과 층의 연결강도를 조정하게 된다(Battiti, 1989). 역전파 알고리즘 및 전달함수의 선택이 중요하며, 본 연구에서는 기존의 수문자료에 대한 연구에서 좋은 결과를 나타낸 Lovenberg-Marquardt-QNBP 역전파 알고리즘 및 Sigmoid 전달함수를 적용하였다(Battiti, 1989, Giill et al., 1981).
또한, 본 연구에서는 일반적인 인공신경망과 더불어서 오차 전진전파 알고리즘(error forward-propagation; FP)을 적용한 Nonlinear AutoRegressive eXogeneous input(NARX) 신경망을 적용하였다. NARX는 입・출력 시계열 간의 비선형성을 고려하여 비선형 시계열에 대해서 신경망을 효율적으로 적용할 수 있게 하는 모형으로서 chaos 또는 fractal 시계열에 대하여 좋은 결과를 내는 것으로 알려져 있다(Diaconescu, 2008). NARX는 크게 open loop와 close loop로 구분되며, 본 연구에서는 close loop로 구성하였다(Menezes Jr. et al., 2008).
Fig. 3에서의
BDS(Brock-Dechert-Scheinkman) 검정은 시계열 자료가 무작위한 분포를 따른다는 가설을 상관적분을 토대로 검증하는 방법으로서, 무작위한 시계열 자료와 비선형 카오스 시스템 혹은 비선형 추계학적 시스템을 구분하는데 매우 유용하다(Brock et al., 1991; Brock et al., 1996; Kim et al., 2003). 시계열 자료가 무작위한 분포를 따른다는 가설 하에 m>1 인 경우의 BDS 검정은 다음과 같은 식 (1)으로 나타낼 수 있다.
m : embedding dimension M : N(m−1), number of vector for m r : radius of vector
BDS 검정을 이용하여 시계열 자료를 무작위(Random) 자료인지 아니면 비선형 시스템(카오스, 비선형 추계학) 자료인지 구분할 수 있다. BDS 통계를 사용하기 위해서는
BDS 검정 이외에도 자료의 무작위성을 판단하기 위한 여러 통계적인 기법이 있으나, 일반적으로 널리 이용되는 방법으로는 Anderson Correlogram, Run Test, Spearman Rank. Correlation Coefficient, Turning point test 등이 있다(Salas et al., 1993).
2.3.1. Anderson’s Correlogram Test
자료의 수
여기서,
2.3.2. Run Test
주어진 계열 자료에 대하여 자료의 평균값보다 클 때를 1, 같거나 작을 때를 0으로 각각 정의하고 이를 다음과 같은 일련의 계열로 나타낼 수 있다.
여기서
여기서,
2.3.3. Spearman’s Rank Correlation Coefficient Test
여기서,
2.3.4. Turning Point Test
본 연구에서는 기존의 연구(Blasing and Stahle, 1988; Brienen and Zuidema, 2005; Worbes, 1999; Xuemei et al., 2005)에서 강우량과 관계가 있는 것으로 제시된 Tree-ring 자료를 이용하여 연강우량의 재생성을 수행하였으며, 이를 위하여 강릉 지역의 기상관측소와 설악산 지점의 Tree-ring 자료를 사용하였다.
강릉 기상관측소는 강원도 강릉시 용강동에 위치하고 있으며, 1911년 10월경부터 관측자료가 존재하고 있다. 또한, Tree-ring 자료는 미국 국립해양대기청(National Oceanic and Atmospheric Administration, NOAA)에서 수집한 고기후학정보(http://www.ncdc.noaa.gov/data-access/paleoclimatology-data/datasets/tree-ring)에서 제공하고 있다. 본 연구에서는 강릉 기상관측소 인근 설악산 관측지점 1개소에 대하여 잣나무(Pinus koraiensis)의 342개1657년 ~ 1998년) Tree-ring 지표를 수집하였다.
수집한 강릉 기상관측소의 연 강우량에 대한 자기상관함수(Fig. 5(b))를 보면 시간의 흐름에 따른 상관관계가 전혀 없는 무작위한 시계열의 특성을 나타내고 있다. 그러나, 설악산 지역의 나이테자료에 대한 자기상관함수(Fig. 5(a))를 보면 전형적인 시계열의 특성을 보인다. 따라서, 나이테 자료를 통한 연 강수량 자료의 재생성을 위해서는 나이테의 시계열적 특성을 반영할 수 있는 모형을 적용하여야 할 것으로 판단된다.
지금까지 나이테를 이용하여 다양한 자료를 재생성하기위한 연구가 수행되어 왔다. 이러한 연구 중에 일부는 회귀분석을 이용하여 재생성(Akkemik et al., 2005; Brázdil et al., 2002; Salzer and Kipfmueller, 2005; Wilson and Luckman, 2002; Woodhouse, 2001; Xuemei and Xiangding, 1997)을 수행하는 과정에서 자료의 시간적인 진행은 고려되지 않았다. 그러나, 수집된 나이테 자료는 자기상관함수를 기준으로 판단하여 볼 때 시계열적인 특성을 지닐 가능성이 있는 것으로 판단되므로, 시계열적인 모의가 필요한 자료인지에 대한 검증이 요구된다. 따라서, 수집된 나이테 자료에 대하여 무작위성 및 비선형성에 대한 검정을 수행하였으며, 본 연구에서는 Anderson Correlogram, Run Test, Spearman Rank. Correlation Coefficient, Turning point test의 4가지 비모수 통계기법(Salas et al, 1993)과 BDS 검정을 이용하였다.
Table 1의 통계검정을 보면 Spearman‘s correlogram 검정의 경우에만 나이테를 무작위 자료로서 판단하고 있으나, 나머지 3개의 검정기법의 경우에는 무작위 자료가 아닌 것으로 판정하고 있다. 또한, BDS(m) 검정치의 경우에 모든 차원에서 유의수준인 ± 1.96을 벗어나고 있어서 무작위 시계열 자료로 판정하고 있다. 이미 시계열 자료에 대해서 BDS 통계치의 설명력이 있는 것으로 제시되었으므로(Choi et al., 2009; Kim et al., 2003) 나이테 자료가 비선형 추계학적 또는 카오스 시계열의 특성을 가지고 있는 것으로 판단할 수 있다. 또한, 기존의 Tree-ring과 관련된 연구(Grassberger, 1986)에서 상관차원 분석을 통하여 비선형 계열임이 제시되었고, Kim (1997)의 연구에서도 비선형 불규칙 시계열임을 재차 확인한 바 있다. 따라서, 한국 설악산 지역의 나이테 자료는 비선형 추계학 또는 카오스 시계열로 판단되며, 나이테를 이용한 연 강수량의 재생성 시에는 비선형 시계열의 특성을 반영하는 재생성 방법이 필요할 것으로 판단된다.
[Table 1.] Test statistics of tree-ring data
Test statistics of tree-ring data
본 연구에서는 나이테 자료를 통하여 강릉 기상관측소의 연 강우량자료를 신경망, NARX을 통하여 재생성 하였다. 신경망과 NARX의 경우 Tree-ring을 입력층 자료로, 연 강수량을 출력치로 구성하였으며, 그 사이에 14개의 은닉층을 적용하였다. 또한, NARX의 시간지연(Time delay)는 Fig. 5(a)의 자기상관함수를 기반으로 1년으로 설정하였다. 신경망과 NARX의 입력자료로는 강원도 설악산 지점의 1912년부터 1998년까지의 설악산 지역 Tree-ring 자료를 적용하였으며, 강릉 기상관측소의 동일 기간 강우량 실측자료를 이용하여 구성하였다. 연 강수량 자료의 재생성 및 비교 결과는 Table 2 및 Fig. 5와 같다.
[Table 2.] Basic statistics of reconstruction data (1912 to 1998)
Basic statistics of reconstruction data (1912 to 1998)
실측 자료와 재생성된 자료간의 결정계수(coefficient of determination)가 상당히 낮기 때문에 생성된 자료의 통계적인 특성치와 NRMSE(Normalized Root Mean Square Error; Anderson and Woessner, 1992)을 사용하여 비교 하였다. Table 2에 따르면 인공신경망 보다 NARX 기법이 실측 유량자료와 유사한 기본 통계치를 지니고 있는 것으로 나타났다. 특히, Skewness 의 경우에는 자료의 분포와 관련이 있으므로 NARX가 실측 유량자료와 유사한 Skewness를 가지는 것에 의미가 있다 하겠다.
또한, Fig. 6에서의 재생성 된 자료의 CDF를 보면 직관적으로 NARX으로 재생성된 연강우량의 분포가 매우 유사함을 알 수 있다. 연 강우량의 분포 유사성을 검증하기 위하여 이표본 콜모고로프-스미르노프 검정(이하 이표본 K-S 검정; Justel et al., 1997)을 수행하였다. 이표본 K-S검정은 두 개의 표본이 동일한 분포에서 나온 것인지 확인하기 위한 방법론으로서 다음과 같이 정의될 수 있다.
실측 강우량이 존재하는 기간(1912 to 1998)에 대해서 검정을 수행한 결과, NARX을 통하여 강우량을 재생성하는 것이 가장 좋은 결과를 나타내는 것으로 나타났다. 따라서 본 연구에서는 1657년부터 1911년까지의 강우량을 NARX을 통하여 재생성 하였다. 재생성한 강우량 계열은 Fig. 8과 같으며 강우량 계열의 CDF는 Fig. 9와 같다. 다만, NARX의 경우에는 재생성 초기 10%의 자료는 안정화를 위하여 초기 30년의 자료는 분석에서 제외하였다.
재생성된 자료의 CDF를 보면 재생성된 강우량에 대해서도 전진 전파 알고리즘을 적용한 NARX이 관측기간의 CDF와 유사한 것으로 판단된다. 95%의 유의수준을 지니는 이 표본 콜모고로프-스미르노프 검정에서도 인공신경망(
최근에 국외에서 수행된 나이테와 연 단위 기후요소 및 수문요소에 대한 연구(Kim et al., 1998; Li et al., 2006; Li et al., 2007; Raffalli-Delerce et al., 2004; Stahle et al., 2000; Stahle et al., 2007; Tian et al., 2007)를 볼 때 나이테와 수문요소 사이에 양의 상관관계가 존재하는 것은 설득력이 있는 주장으로 보인다. 그러나, 재생성된 강우량 자료에 대하여 실측 기간을 포함한 기간에 대한 검증결과, 모의정도가 낮은 것으로(결정계수
[Table 3.] Test statistics for reconstruction data
Test statistics for reconstruction data
본 연구에서는 강릉 유역의 Tree-ring과 연 강우량 자료를 이용하여 1687-1911년 사이의 연 강우량 자료를 재생성하였다. 이를 위하여 각각의 Tree-ring과 연 강우량 자료에 대하여 BDS 검정을 포함한 통계적 검토를 통하여 비선형 추계학적 시계열임을 제시하였으며, 이를 모의하기 위하여 신경망과 전진 전파 알고리즘을 적용한 신경망인 NARX을 이용하여 연 강우량 자료를 재생성하고 그 효율을 비교 검증한 결과 NARX이 Tree-ring을 이용하여 강우량을 재생성하기에 강점을 지니고 있는 것으로 제시하였다. Tree-ring 자료를 이용할 경우 가장 큰 장점은 통계적으로 신뢰할 수 있는 재생성 방법을 통하여 장기간(약 3-400년 이상)의 자료를 확보할 수 있다는 점이다. 장기간의 자료를 통계적으로 분석하는 수문현상 분석기법에 대해서 이러한 자료의 재생성 기법은 그 적용성이 높을 것으로 판단된다.