A Study on the Statistical Analysis of Korea Patent Information

한국특허정보의 통계분석에 관한 연구

  • cc icon
  • ABSTRACT

    Most research about patent data analyzes the trend of technologies using a Patent Map(PM), and suggests the frequencies and trend of patents in a certain topic using tables or graphs in Excel. However, more advanced analysis tools are recently needed to compare the trends among national and international industries. This research discussed why statistical analysis is needed to improve the reliability in PM analysis, and the research compares the trends of patents in Korea between 1990 and 2004 by years, International Patent Classification(IPC) sections, and countries using the frequencies and Poisson regression model. The statistical analysis is also suggested and applied to R&D studies.


    지금까지 특허분석에 관한 연구는 특허지도(Patent Map; PM)분석을 수행하여 기술동향을 분석하고 있으나, 주제에 대한 검색결과를 엑셀 등을 이용하여 그래프화하여 출원빈도에 대한 추이를 나타내는 것이 대부분이다. 이러한 분석은 특정주제에 대한 것으로 국가의 산업이나 국제적인 산업의 동향을 직접 비교·분석하기에는 미흡한 실정이다.본 연구에서는 PM분석의 신뢰성을 높이기 위해 통계분석의 필요성을 제시하고, 1990년부터 2004년에 출원된(출원번호 기준) 한국특허 전체를 대상으로 연도별, 분류별(IPC Section 분류)로 각 국가(한국, 미국, 일본, 독일)의 출원빈도를 통계적으로 유의한 수준을 분석하였다. 또한 국가 및 기술 분류에 대한 출원빈도에 대해 포아송 회귀분석을 수행하고, 통계적으로 유의한 수준에 따른 평가를 R&D에 활용할 수 있도록 하였다.

  • KEYWORD

    Patent Information Analysis , Patent Map(PM) , International Patent Classification(IPC) , Statistics Analysis , Poisson Regression Analysis

  • 1. 서 론

    창조적인 기술개발에 의해 산업의 지식집약화를 가능하게 하는 필수적인 요소로 특허정보를 들 수 있다. 기술변화를 확실하고 신속하게 접할 수 있는 가장 좋은 자료 역시 특허정보이다. 따라서 오늘날 기술개발의 성공률을 높이기 위해 특허정보분석을 수행하고 있다. 이러한 특허정보분석을 통하여 기술의 변화를 감지하고, 기술의 변화를 미리 예측하고 이에 대해 어떻게 대처할 것인가의 전략에 고심하고 있다.

    또한, 지식재산의 대명사인 특허는 지식기 반사회의 초석으로 산업성장의 핵심엔진 역할을 수행하고 있다. 특허권이 기술패권 중심의 시대에 국제통상마찰의 핫이슈로 등장하였으며, 선진국들은 개도국의 추격을 경계하기 위해 특허권을 통상무기로 삼고 있다. 이러한 지식기반사회는 산업재산권, 새로운 지식재산권등과 같은 지식재산권 제도로 축약해서 설명 할 수 있다.

    일반적으로 특허는 객관적이고 정형화된 기술, 권리, 경영 및 전략정보로서 기술수준과 기술혁신 흐름뿐만 아니라 기술동향 등을 전망하는 데 유용하게 활용되고 있다(Mogee 1991; Archibugi and Piant 1996; Paci, Sassu and Usai 1997). 특허는 공지기술(state of art)로 해결되지 않은 문제점을 극복하기 위하여 발명자가 새로운 아이디어를 발명하고, 이 아이디어를 특허로 인정받기 위해 신규성, 진보성 및 산업상 실시이용 가능성에 대한 심사를 통하여 등록받게 된다.

    따라서 특허는 기술적, 산업적 정보 측면에서 풍부한 자료의 원천이며, 특허가 갖는 자체의 기술적 내용뿐만 아니라 이전에 출원되었던 특허정보분석을 통하여 기술변화 추세와 새로운 기술출현의 방향을 제시할 수 있고, 특정기술영역에서의 국가나 기업, 연구자의 기술수준도 추출해 낼 수 있다(Griliches 1990).

    이러한 특허정보의 특성을 고려하여 최근에는 국가적으로 시행하고 있는 기술개발과제에는 선행기술조사 형태로 특허지도(Patent Map; PM)분석으로 특허기술동향을 파악하고, 기술의 경쟁우위를 비교분석하는 경향이 점차적으로 확대되고 있다. 그러나 지금까지 수행된 PM분석은 주제에 대한 검색결과를 엑셀 등의 프로그램을 이용하여 그래프화하여 출원빈도에 대한 추이를 나타내는 것이 대부분이다. 이러한 동향은 특정주제의 검색에 대한 빈도수를 단순하게 비교함으로써 통계적으로 유의한 분석에는 미흡하다. 유의성 분석을 생략한 채국가 간의 산업이나 국제적인 산업의 동향을 분석함으로써 잘못된 분석결과를 발표하는 경우도 있다.

    본 연구에서는 특허동향분석을 통계적으로 유의한 분석을 위해 1990년부터 2004년에 출원된(출원일 기준) 한국특허 전체를 대상으로 통계분석을 수행한다.한국특허의 연도별, 분류별(IPC Section 분류), 국가별(한국, 미국, 일본, 독일)의 출원빈도를 분석함에 있어서 범하기 쉬운 오류를 해소하고자 한다. 또한 통계적 유의한 항목을 파악하고, 이들의 관계를 포아송 회귀분석(Poisson Regression Analy- sis)을 실시한다. 이러한 특허정보를 통계적 분석을 통하여 산업 및 기술의 동향을 통계적 유의한 수준에 따른 평가를 수행하고, 이를 R&D에 활용할 수 있도록 한다.

    2. 관련연구

    특허는 특허 자체의 기술적 내용뿐만 아니라 선출원 특허에 대한 인용 정보, 권리 청구 범위등의 분석을 통해 기술 변화 추세와 새로운 기술 출현의 방향을 예측할 수 있다. 이러한 특허정보의 특징을 살려서 정부에서는 2000년부터 PM분석을 지금까지 추진하고 있다1).최근의 특허정보분석과 관련한 연구는 각 분야별로 검색한 특허출원빈도를 비교한 것이 대부분이다.

    유성오 등(2007)은 생물환경 분야의 수경재배에 대한 국내 특허정보분석 연구로 수경재배 관련 기술개발 및 수경재배의 효율화를 위한 기초 자료 수집 측면에서 온라인 특허검색 유료사이트(http://www2.wips.co.kr)를 이용해 1983년부터 2006년 1월까지의 수경재배와 관련된 한국 특허출원정보를 분석하였다.수경재배에 관련된 특허출원은59건이 검색되었다. 특허의 내용은 수경재배 장치에 관한 것 19건(32.2%), 수경재배 자재에 관한 것 13건(22.0%), 양액의 조성에 관한 것이 11건(18.6%), 수경에 의한 재배방법에 관한 것 9건(15.3%), 수경재배배지에 관한 것 7건(11.9%) 순으로 많았다. 특정의 작물을 대상으로 한 양액의 조성 및 수경에 의한 재배방법의 대상 작물로는 토마토가 5건, 감자가 4건으로 많았다. 특허 출원시기는 전체적으로 2000년 이전에 출원된 것이 33건(55.9%)을 차지하였으며, 2000년 이전에는 양액조성과 자재와 관련된 것이 상대적으로 많았고, 2000년 이후에는 수경 재배방법과 배지에 관한 것이 상대적으로 많은 것으로 분석하고 있다.

    정인성 등(2006)은 전기전자 분야에서 PCB층간 접속기술 중 일괄적층에 관한 특허동향을 분석한 연구가 있다. 2001년을 기점으로 일괄적층 기술관련 출원량이 증가하기 시작하였으며, 이를 통해 기존의 순차적층기술에서 일괄적층으로 기술의 흐름이 변화하고 있다는것을 특허동향분석으로 파악하였다.

    유선희 등(2006)은 기술수명을 추정하는 데있어 분석결과의 객관성을 담보할 수 있도록 계량적인 데이터로 특허정보를 사용하여 특허군내 전체특허를 대상으로 한 전수조사를 실시하여 샘플링에 따른 결과 왜곡기능을 최소화하고, 특허인용정보를 이용하여 특허 ‘활성화’에 대한 강한 가정(인용이 되면 특허가 살아 있음)을 근거로 분석함으로써 특허갱신기간과 기술수명간 종속 문제를 벗어난 기술수명을 예측하였다.

    강희종 등(2006)은 국제적으로 정형화되어 있는 특허정보를 이용하여 정량적 분석을 수행하고, 그 결과를 바탕으로 유망기술을 예측함으로써, 정성적 예측의 단점을 극복하고 특허출원빈도수와 증가율을 동시에 고려하여 IT분야에 실증적으로 적용하였다.

    박용태 등(2004)은 한국, 일본, 미국의 특허인용 관계를 활용하여 기술-산업 간의 비체화 지식의 흐름 행렬을 연구하였다. 이와 같은 지식 흐름을 바탕으로 네트워크 분석을 실시 하였다. 또한, 각 기술과 산업에 대하여 지표를 산출하여 국가별 기술과 산업의 특성을 살펴보고, 전체 네트워크의 특성을 설명하는 지수를 산출하여 국가별 기술-산업간 연계구조의 비교를 수행하였다. 또한 특허 인용을 통해 이루어지는 비체화 지식의 확산에 초점을 두고 기술-산업간 연계구조를 위해 미국 특허정보를 대상으로 제한적인 연구를 수행하였다.

    이우형 등(2003)은 미국의 특허에 나타난 한국 특허의 양적 및 질적 수준을 특허색인지수인 CII 등을 이용하여 한국의 기술혁신 수준을 1980년부터 2001년까지 약 20여 년간의 변화모습을 분석하였다. 분석의 근거는 해당 특허에 대한 인용빈도를 활용하였다.

    이상의 연구에서 확인된 바와 같이 특허정보분석은 검색된 결과의 출원빈도를 통하여 기술동향을 파악하고자 하는 것으로 기술동향 및 비교분석의 객관화를 확보하기 위해서는 해당 특허정보의 통계적 유의 수준 분석이 필요하다.

    3. 특허정보의 체계

       3.1 특허정보의 특성

    특허제도는 일정기간동안 특정발명에 대한 독점권을 허용하는 대신에 발명에 대한 정보를 세상에 공개함으로써 누구나 알 수 있도록하는 것이다. 문제는 발명자의 입장에서는 가급적 정보를 공개하지 않고 특허를 취득하려고 하기 때문에 각국의 특허법은 정보공개의 실효성을 높이기 위한 조항을 두고 있다. 한국의 경우 “발명의 상세한 설명에는 그 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있을 정도로 그 발명의 목적 구성 및 효과를 기재하여야 한다”라고 규정하고 있어, 발명의 내용을 상세히 기술하게 되어있다2). 이를 어겼을 경우 특허를 거절 할 수 있다3).

    과학기술자들이 특허정보를 능동적으로 활용하기 위해서는, 특허정보의 가치에 대한 충분한 이해가 전제되어야 할 것이다. 특허정보는 다음과 같은 특징을 갖고 있다(윤권순 등 2005).

    첫 번째, 새로운 과학기술 정보를 제공한다는 기술정보적인 기능과 재산권을 부여하는 법적인 문서라는 기능을 함께 가지고 있다. 즉 권리정보적 기능을 갖는다는 점에서 학술논문이 갖지 못하는 영역에서 커다란 유용성을 가지고 있다.

    두 번째, 기술정보적 기능과 관련하여 포함 되어야 할 내용이 법적으로 정해져 있다. 즉 발명의 목적, 구성, 효과를 기술하되 각각에 대해서도 구체적인 항목을 정해 놓았다. 발명의 목적은 관련분야의 종래기술 및 그 한계를 기술하도록하여 기술동향 파악에 유익하고, 구성에 있는 실 시례(best mode)는 구체적인 실험방법 등이 상세하게 작성되어 있어 특정 기술을 익히는데 유용하며, 효과는 연구성과의 상업적 이용에 대한 아이디어를 제공하는데 탁월한 장점을 가지게 한다. 이와 같이 특허는 학술논문과 같은 기술정보를 제공하는 역할을 하지만, 연구개발에 특별하고 소중한 정보를 제공하고 있다.

    세 번째, 특허문헌은 정보의 형태가 정형화되어 있고 논문과는 달리 모든 분야를 포함하기 때문에 시계열적 정보분석이 가능하다. 즉 동향파악과 기술예측등에 유익하다. 이를 통상 특허지도라고 부르며 널리 활용되고 있다.

       3.2 특허정보의 구조

    3.2.1 특허공보의 주요 구성

    특허정보의 구조는 법으로 정해져 있다. 따라서 구성요소와 용어는 특허법이 추구하는 목적에 따라의도적이고 정교하게 만들어졌다. 예컨대, 특허정보의 핵심이라 할 수 있는 명세서 구조의 경우 특허법시행규칙 제21조에 규정되어 있다.

    특허정보는 법적인 성격을 가지고 있어서 학술논문에 익숙한 과학기술자들이 보기에는 다소 복잡하고 어렵게 보일 수도 있다. 그러나 그 구조를 잘 이해한다면 훨씬 다양하게 연구개발 활동에 활용할 수 있다. 가장 기본적인 특허정보는 각국 특허청에서 발간하는 특허공보이다. 특허공보는 각국마다 다소간의 차이가 있으나 중요한 부분은 대체로 유사하다고 할 수 있다.

    특허공보에는 <표 1>과 같이 공개특허공보와 등록특허공보가 있다. 특허정보를 발간시기에 따라 구분하면, 출원 후 1년 6개월 후 발간되는 공개특허공보와 심사 후 특허등록이 결정 된 후 발간되는 등록특허공보로 대별된다. 즉 공개특허공보는 세상에 정보를 공개하는 것으로써, 특허권을 받게 될지 여부는 아직 모르는 상태이며, 이들 중 일부분이 등록이 결정되어 등록특허공보로 발간된다. 따라서 공개특허정보가 등록특허정보보다 많으며 기술적인 측면에서 특허정보를 활용하는 데 주목적이 있다면 공개특허정보가 유리할 것이고 권리적인 측면에 주목적이 있는 경우 등록특허 정보가 보다 유효할 것이다.

    또한, 특허공보는 내용상으로 구분하면 크게 서지사항과 명세서로 대별되며 그 구조는 <표 2>와 같다.

    3.2.2 특허정보의 과학기술정보적 기능

    ‘발명의 상세한 설명’은 새로운 과학기술정보의 공개라는 면에서 학술논문과 유사하다고 하겠다. 그러나 그 구조를 살펴보면 중요한 차별성을 가지고 있는 것을 알 수 있고 그 차이가 바로 연구개발정보이다. ‘발명의 상세한 설명’은 <표 3>과 같이 세 부분으로 구성되어 있다. 즉 발명의 목적, 발명의 구성, 발명의 효과로 구성되어 있다.

    ‘발명의 목적’과 관련해서 특허법은 연구성과의 기술 분야, 종래의 연구성과, 해결해야 할 문제점을 기술하도록 하였다. 이 같은 형식은 특허정보가 기술동향을 파악하기 위한 리뷰(review) 문헌의 기능을 충실히 가지고 있음을 말해준다. 특히 ‘그 분야의 종래기술’ 부분에는 관련 문헌들을 기재하도록 하고 있어서,연구성과와 관련된 연구자들이나,근원이되는 연구들을 추적하는 데 유용하다.

    ‘발명의 구성’과 관련해서는 기술적 수단, 기능,실 시례를 서술하도록 하고 있다.이 중에서 특히 실시례의 경우는 구체적인 구성, 재료, 공정, 수치 등이 기재되어 용이하게 실시할 수 있도록 하고 있다. 미국의 경우 특히 가장 효과가 높은 실 시례를 기재하도록 하고 있다. 따라서 특허정보를 통해 특정한 실험기법을 알 수 있다.

    ‘발명의 효과’란 요소가 있다는 것은 학술논문과 특허정보의 차이점을 명확히 하고 있다. 특허법의 궁극적인 목적은 새로운 기술이 산업계에서 활용되어 경제발전에 이바지하는 것이기 때문에, 기술의 산업적 응용에 커다란 관심을 가지고 있으며 이것이 특허를 부여하는 요건 중의 하나이다. 예컨대, 과학기술자가 심장에서 피가 흐르는 메커니즘을 규명했다고하면 학술지에는 등재가 가능하겠지만, 그 산업적 활용을 생각해 내지 못한다면 특허를 받지 못한다. 이것이 연구자들에게 시사하는바 는 자신의 연구성과가 어디에 응용될 수 있는지 아이디어를 얻기 위한 매우 쓸모 있는 정보원이 바로 발명의 효과라는 것이다.

    이와 같이 특허명세서의 구조를 보면 특허는 주로 특정 문제 해결을 위해 구체적인 수단을 통해 산업적인 이용을 하는 것에 초점을 맞추고 있다. 예를 들어 어떤 물질을 쥐에 투여

    하여 몇 번 실험했더니 비만억제효과가 나타난 경우 특허가 요구하는 정보를 갖추게 된다. 그러나 어떻게 그러한 효과가 있는지가 밝혀지지 않는다면 학술논문에는 수록되기 어려울 것이다. 반대로 기존 물질이 비만 억제효과가 있다는 것은 이미 알려져 있고 그 메커니즘을 밝혔다면 특허문헌에는 수록되기는 어렵고 학술논문에는 수록될 가능성이 높을 것이다.

    3.2.3 특허분류

    특허정보는 모든 분야의 과학기술을 포함하지만 국제특허분류에 맞추어 분류되어 있다는 장점이 있어 이를 활용하면 필요한 해당기술정보를 빠르게 검색할 수 있다.

    전 세계적으로 통용되고 있는 국제특허분류 IPC(International Patent Classification)는 특허문헌에 대해 국제적으로 통일된 분류를하고 검색을 할 수 있도록 하기 위해서 1954년 국제특허분류에 관한 유럽조약의 규정에의해 만들어졌다. 이후 1971년 Strasbourg조약(IPC조약)이 체결되어 IPC를 이용하여 국가간의 기술을 교류하고 외국특허문헌의 원활한이용과 검색이 가능하게 되었다.

    특허정보를 활용하는 데 있어서 국제특허분류(IPC)를 이용하는 방법은 매우 유용하다. 우리나라는 물론 미국, 일본, 유럽 특허청에서도 IPC에 의한 분류체계를 기본적으로 표기하고 있으므로 IPC를 제대로 이해하고 활용하면 검색 노이즈4)를 쉽게 제거할 수 있을 뿐만 아니라 검색된 다량의 정보 중에서 IPC를 통하여 상호 관련된 기술로 분류 및 추출함으로써 특정 분야에 있어서의 세부 기술동향도 파악할 수 있다.

    또한,연구자가 해당기술 분야의IPC 분류코드를 이용할 수도 있고 또 다른 기술 분야와 의 접목을 시도한 정보를 찾을 때에도 그 기술의 IPC 분류코드와의 조합을 통해서 얻어낼 수 있다. 예를 들면, 다양한 유전자 재조합 과정과 단백질 분리 과정을 통한 간염 치료물질을 개발하는 기술에 대하여 연구자가 특허를 검색하였다면 신물질 발견부터 제조과정까지 다양한 특허정보가 검색되겠지만 연구자는 이 물질이의약품으로 제제화된 것을 원할 때 IPC 분류코드 A61K5)를 사용하게 된다.

    특히, IPC는 다음과 같은 특징을 갖고 있다. 첫째, <표 4>와 같이 8개의 섹션(section)을 갖고 있으며, 국제특허청(World Intellec- tual Property Organization; WIPO)에서 분류하는 기준과 호환이 되고 있다.

    둘째, 섹션(section), 클래스(class), 서브클래스(subclass), 메인그룹(main group), 서브그룹(subgroup)으로 이어지는 계층구조를 갖는다.

    셋째, 응용(application) 위주와 기능(func- tion) 위주의 관점을 혼합한 절충형의 관점을 취한 분류표이다.

    넷째, 각국의 상황에 따라 주분류와 부분류를 분류한다.

    4. 통계분석

    N개의 분할표에서 관측도수를 ni , i=1, 2, ..., N로 정의할 때, ni는 평균이 E(ni)=mi인 양의 확률변수로 정의할 수 있다. 확 률변수 ni의 통계확률분포를 포아송분포(Po- isson distribution)로 가정하면, 포아송 확률 밀도함수는 다음과 같이 정의된다.

    image

    포아송분포는 분산과 평균이 같은 특성 ( VAR(ni) = E(ni) = mi)을 가지고 있고, 지수함수와 지수함수의 역함수인 로그함수를 이용하여 다음과 같이 다른 형식으로 정의될 수 있다.

    image

    여기서 포아송분포가 지수족(exponential family)이고, In (mi)는 자연모수(natural pa- rameter)임을 확인할 수 있다(Rao and Toutenbug 1995).

    일반적으로 통계적 선형모형은 독립변수와 종속변수 간의 선형결합을 이용해 두 변수간의 관계를 설명하고 이해할 수 있다. 종속변수를 관측도수로 정의하는 경우, 일반화 선형모형(Generalized linear model) 중 로그 선형 모형(log-linear model)은 표준연결함수(ca- nonical link function)로 포아송분포의 자연 모수인 (mi)를 사용한다. p개의 독립변수 xi가 주어지고, β를 계수라 할 때, 로그 선형모형은 다음과 같이 정의된다.

    image

    독립변수의 자료형태에 따라, 분산분석이나 선형회귀분석의 방법을 응용할 수 있지만, 로그 선형모형은 일반화 선형모형으로 이론전개에 있어서는 구분할 필요가 없다. 계수 β는 로그 가능도함수(Log-likelihood function) 로부터 뉴턴-라프슨 방법(Newton-Raphson method)을 이용해 최대가능도추정량(Maxi- mum likelihood estimator)을 구할 수 있다. 로그 선형모형은 포아송 회귀모형(Poisson re- gression model)이라고도 불리며, 환자의 건강조건에 따라 발생되는 특정 질병의 환자숫자나 작업환경에 따른 불량품의 개수 등을 모형화 시킬 경우 적용할 수 있다.

    관측도수인 확률변수 ni를 포아송분포로 가정한 경우, 로그 가능도함수는 다음과 같이 로그함수를 취한 포아송 확률밀도함수의 합으로 정의되고,

    image

    모형의 적합도는 실제 관측도수와 기대도수를 이용한 로그 가능도함수의 차로 정의되는 편차함수(Deviance function)를 이용하여 확인할 수 있고,

    image

    mi의 값이 클 때, 자유도 N-(p+1)을 갖 는 피어슨의 카이제곱통계량(Pearson's chi-square statistic)으로 근사된다.

    image

    도수의 분포가 과대산포(Over-dispersion) 되어져 있는 경우, 즉 Var(ni) > E(ni) 일때, 포아송분포 가정에 위배된다. 이때, 모형의 적합도는 수정된 통계량 D/φ와 X2/φ를 사용하 고, 과대산포계수 φ를 다음과 같이 정의한다.

    image

    점근적으로 과대산포계수 φ는 X2/(N-(p+1))로 추정한다(McCullagh and Nelder 1989).

    5. 한국특허정보의 통계분석

       5.1 연구분석 대상 데이터 선정

    우리나라에 출원된 특허의 통계분석을 위해 본 논문에서는 15년(1990년부터 2004년까지 출원일 기준) 동안 한국특허청에 출원된 한국특허정보를 분석대상으로 한다. 데이터의 정보원(source)은NDSL 특허(http://patent.ndsl. kr, 한국과학기술정보연구원)에서 제공하는 한 국특허 데이터베이스와 KIPRIS(http://www. kipris.or.kr, 한국특허정보원)에서 제공하는 데이터베이스를 사용하여 분석대상 데이터를 모집단별로 선정하였다.

    특허정보분석을 통한 지금까지의 연구경향은 검색된 모집단을 중심으로 연구자 임의의 수준에서 출원빈도 차이를 비교분석하여 기술동향을 설명한 것이 대부분이다. 이러한 연구결과는 연구자의 주관적인 비교분석으로 연구자에 따라 다른 해석 및 잘못된 해석을 야기할 가능성이 내포되어 있었다.

    따라서 본 논문에서는 분석대상 모집단을 분류별(국제특허분류8개 섹션), 국가별(한국, 미국, 일본, 독일)로 구분하여 “통계적으로 유의한 차이가 있는가?”에 대한 유의성분석을 먼저 실시하고, 이에 따른 출원빈도의 차이를 비교분석함으로써 분석결과의 신뢰성을 확보 하고자 하였다.

    <표 5>는 선정된 데이터 중에서 한국특허정보의 1990년부터 2004년까지 전체 출원특허를 대상으로 출원인이 한국, 미국, 일본, 독일에 대해 연도별/IPC분류별로 정리한 것이다.

       5.2 포아송 회귀분석

    5.2.1 연구가설

    “우리나라에 출원된 특허 중에서 한국, 미국, 일본, 독일의 출원빈도는 차이가 있는가?”와 “한국특허정보 중에서 IPC 8개 섹션 분류의 출원빈도 차이가 있는가?”를 확인하기 위하여 유의수준 α=0.05를 설정하여 다음 가설을 설정하였다.

    가설 1 1990년부터 2004년에 출원된 한국특허는 출원인의 국가(한국, 미국, 일본, 독일)에 따라 출원빈도의 차이가 있다.

    가설 2 1990년부터 2004년에 출원된 한국특허는 국제특허분류(A∼H섹션)에 따라 출원 빈도의 차이가 있다.

    가설을 검증하기 위하여 SAS 버전9에서GENMOD 프로시저를 이용하여 포아송 회귀분석을 실시하였다.

    5.2.2 연구결과

    연구가설1의 경우 출원빈도를 종속변수로, 출원인의 국가를 4개의 수준으로 독립변수로 정의하고, 독립변수와 종속변수 간의 관계를 포아송 회귀분석을 이용해 이해하고 설명한다.

    1990년부터 2004년까지 각 국가의 모든 출원빈도를 연도별로 구하여 비교하였다. <그 림 1>은 우리나라에서 출원된 특허이므로 매년 한국이 가장 많은 출원빈도수를 나타내고 있다. 따라서 <그림 2>에서는 한국을 제외한 나라의 출원빈도를 확대 비교해 보았다. 일본, 미국, 독일의 순으로 출원빈도를 나타내고 있으며, 전체적인 경향은 1997년까지 증가추세 였다가 감소하고, 다시 1998년부터 1999년에 다시 증가하고 있음을 볼 수 있다. 2001년 미국을 시작으로 전체적으로 2004년까지 감소 한다.

    한국과 미국, 일본, 독일을 출원인 대상국

    으로 1990년부터 2004년까지 국제특허분류 (A∼H) 8개, 모두 N=480의 표본을 이용하였 다.과대산포를 확인하고,포아송분포 가정을 만족시키기 위해 GENMOD 프로시저에서 스케일 옵션(scale = pearson)을 이용하여 과대 산포계수를 1로 보정하였다. 연구가설 1에 대해 포아송 회귀모형은 다음과 같이 정의되고,

    image

    독립변수 ?xi, i=1, 2, 3,는 출원인국가에 따라 다음과 같이 정의한다. 예를 들어 한국이 기준국인 경우,

    image

    각 나라의 기대도수 mi는 추정된 포아송 회귀모형의 계수로부터 m한국 = exp(β0), m미국=exp(β01), m일본=exp(β02), m독일 =exp(β03)로 각각 계산된다. 한국은 기준이 되는 나라로 절편만 가지고 기대도수를 계산한다. 따라서 계수추정값은 한국을 기준으로 각 나라가 얼마나 적은(혹은 많은) 출원빈도를 갖는지 알 수 있는 상대적인 값으로 설명되어 진다.계수추정값이 음(양)의 값으로 유의하다면,그 나라는 한국에 비해 통계적으로 적(많)은 출원빈도를 갖는다고 해석할 수 있다.

    한국 내에서 출원되어지는 출원인국가별 출 원빈도수는 월등히 한국이 많음을 <그림 1>에 서 확인하였듯이, 포아송 회귀모형의 계수의 추정값 역시,한국을 기준으로,모두 음수이고 유의수준 α=0.001에서 매우 유의함을 볼 수 있다(<표 6> 참조). 가장 적은 출원빈도수를 나타낸 독일을 기준으로 적합시켜 보면, 한국과만 유의한 차이를 타나내고 미국과 일본은

    독일과 비슷한 출원빈도수를 나타냄을 통계적 으로 확인할 수 있다(<표 7> 참조). 연구가설 1로 설정한 “1990년부터 2004년에 출원된 한국특허는 출원인의 국가에 따라 출원빈도의 차이가 있다.”는 유의수준 0.001에서 유의하다고 할 수 있다. 즉, 한국만이 통계적으로 많은 출원빈도수를 나타내고, 나머지 세 나라는 차이가 없다는 결론을 내릴 수 있다.

    연구가설 2는 1990년부터 2004년까지 한국특허 중에서 국제특허분류에 따라 출원빈도에 차이가 있는지 검증하는 것으로, <그림 3> 에서 보면 H섹션이 가장 높은 출원빈도를, D와 E섹션이 가장 낮은 빈도를 나타냄을 볼 수 있다.전반적으로 비슷한 추세를 나타내는데,

    B섹션과 F섹션이 1996년 전후로 다른 섹션과비교해 상대적으로 높은 출원빈도수를 확인할수 있다.

    포아송 회귀분석에서는 가장 빈도수가 높은 H섹션을 기준으로 비교하였다.계수추정값 모두 음수로 유의수준 α=0.001에서 모두 H섹션 보다 적은 출원빈도수를 나타낸다. 추가적인 통계적인 추론은 실시하지 않아도, 계수추정값을 비교해 보면 D와 E섹션(-2.67과 -2.64), A와 F섹션(-1.25와 -1.21)이 거의 비슷한 값을 나타낸다(<표 8> 참조). 즉, 우리나라에서의 출원빈도가 비슷한 섹션임을 계수추정값을 통해 확인할 수 있다.

    결과적으로 연구가설 2 (“1990년부터 2004년에 출원된 한국특허는 국제특허분류(A∼H 섹션)에 따라 출원빈도의 차이가 있다.”)의 경우, 유의수준 0.01에서 유의하며, H섹션의 빈도수가 가장 높고, D와 E섹션이 가장 적다.

    특허자료와 같은 시계열 자료의 경우 유사한 기술동향을 나타내는 섹션을 분류하는 데 시계열자료를 이용한 군집방법을 이용한다면, 보다 체계적이고 객관적인 결과를 얻을 수도 있을 것이다(홍한움 등 2009). 따라서 본 연구 이후의 수행할 과제라고 판단된다.

    6. 결론

    기술변화를 확실하고 신속하게 접할 수 있는 가장 좋은 자료는 특허정보이다. 기술의 변화를 감지하여 기술의 변화를 미리 예측하고 이에 대해 어떻게 대처할 것인가에 대한 대안과 기술개발의 성공률을 높이기 위해 어떻게 대처할 것인가에 대한 대안으로 특허정보분석을 수행하고 있다.

    특허정보의 특성을 고려하여 국가적으로 시행하고 있는 기술개발과제에는 선행기술조사 형태로 PM분석을 실시하고 있다. 이를 통하여 특허기술동향을 파악하고, 기술의 경쟁우위를 비교분석하는 경향이 점차적으로 확대되 고 있다. 그러나 지금까지 수행된 특허지도 작성사업은 주제에 대한 검색결과를 엑셀등을 이용하여 그래프화하여 출원빈도에 대한 추이를 나타내는 것이 대부분이다. 이러한 동향은 특정주제의 검색에 대한 빈도수를 단순하게 비교함으로써 통계적으로 유의한 분석에는 미흡하다. 유의성 분석을 생략한 채 국가 간의 산업이나 국제적인 산업의 동향을 분석함으로써 잘못된 분석결과를 발표하는 경우도 있다.

    본 연구에서 사용된 포아송 회귀분석은 독

    립변수와 종속변수 간의 선형결합을 이용해 두 변수간의 관계를 잘 설명하고 이해할 수 있는 통계기법으로 특허자료를 모형화하는 데 적용할 수 있다.

    본 연구에서는 1990년부터 2004년도에 한국특허청에 출원된 특허를 중심으로 각 국가별(한국, 미국, 일본, 독일) 출원빈도 비교분석과, IPC분류(A∼H섹션)에 따른 출원빈도 비교분석을 통계분석(포아송 회귀분석)으로 수행하여 기존의 미흡한 분석을 보완할 수 있는 대안을 제시하고자 하였다.

    첫째, 기존의 PM분석에서 검색된 결과의 단순한 출원빈도를 비교하여 기술동향을 파악하고자 하는 연구의 신뢰성을 높이기 위해서는 검색된 결과의 데이터가 통계적으로 유의한 수준인가 파악하는 것이 필요하다.

    둘째, 한국에 출원된 특허를 중심으로 국가간의 출원빈도를 통계적으로 분석한 결과, 출원인의 국가(한국, 미국, 일본, 독일)에 따라 출원빈도의 차이가 유의하므로 이를 객관적인 방법으로 검토한 후에 국가 간의 기술동향을 비교하는 것이 필요하다.

    셋째,한국에 출원된 특허를 중심으로 IPC분류 섹션 간의 출원빈도를 통계적으로 분석한 결과, 국제특허분류(A∼H섹션)에 따라 출원빈도의 차이가 유의하므로 이를 객관적인 방법으로 검토한 후에 기술 분야 간의 우위를 비교하는 것이 필요하다.

    본 연구에서 제시한 통계분석은 PM분석에서 범하기 쉬운 단순분석의 신뢰성을 높이기 위한 분석방법이지만, 향후 통계분석을 통하여 각 분야의 기술의 동향 예측하고, 국가 간의 경쟁력을 비교분석할 수 있는 후속 연구 및 사업이 필요하다.

  • 1. 강 희종, 엄 미정, 김 동명 2006 특허분석을 통한 유망융합기술의 예측 [기술혁신연구] Vol.14 P.93-116 google
  • 2. 박 용태, 이 원영, 최 창우, 이 승훈 2004 특허 인용분석을 통한 기술-산업 연관관계 분석:한국미국일본의 비교를 중심으로 [대한산업공학회 추계학술대회 논문집] P.1-8 google
  • 3. 유 선희, 이 용호, 원 동규 2006 특허인용분석을통한 기술분야의 수명예측에 관한 연구 [한국경영과학회지] Vol.31 P.1-11 google
  • 4. 유 성오, 배 종향, 박 윤점, 조 자용, 장 홍기, 허 북구 2007 과학기술자를 위한 특허정보 핸드북 [생물환경조절학회지] Vol.16 P.13-20 google
  • 5. 윤 권순, 손 은화, 백 상규, 신 한영, 이 종욱, 철희 2005 과학기술자를 위한 특허정보 핸드북 google
  • 6. 이 우형, 안 규정, 이 명호 2003 특허인용분석을 통한 한국의 기술혁신 [한국경영과학회춘계학술대회논문집] P.1011-1017 google
  • 7. 정 인성, 정 인성, 이 영욱 2006 PCB일괄적층에 관한 특허동향분석 [한국전기전자재료학회 하계학술대회 논문집] Vol.7 P.14-15 google
  • 8. 홍 한움, 박 민정, 조 시섭 2009 시계열자료 군집 방법의 비교연구 [응용통계연구] Vol.22 P.1203-1214 google
  • 9. Archibugi D, Pianta M 1996 Measuring technological change through patents and innovation surveys [Technovation] Vol.16 P.451-468 google
  • 10. Griliches Z 1990 Patent Statistics as Economic Indicators: A Survey [Journal of Economic Literature] Vol.XXVIII P.1661-1707 google
  • 11. McCullagh P, Nelder J.A 1989 Generalized linear models google
  • 12. Mogee M.E 1991 Using patent data for technology analysis and planning [Research-Technology Management] Vol.34 P.43-49 google
  • 13. Paci R, Sassu A, Usai S 1997 International patenting and national technological specialization [Technovation] Vol.17 P.25-38 google
  • 14. Rao C.R, Toutenburg H 1995 Linear models: Least Squares and Alternatives(Springer series in Statistics) google
  • 15.
  • 16.
  • [표 1] 공개특허공보와 등록특허공보의 비교
    공개특허공보와 등록특허공보의 비교
  • [표 2] 특허공보의 구조
    특허공보의 구조
  • [표 3] ‘발명의 상세한 설명’의 구조 및 연구개발에의 유용성
    ‘발명의 상세한 설명’의 구조 및 연구개발에의 유용성
  • [표 4] WIPO 기준 31개 기술분류표(7판 기준)
    WIPO 기준 31개 기술분류표(7판 기준)
  • [표 5] 한국특허정보 연도별/IPC분류별 출원현황
    한국특허정보 연도별/IPC분류별 출원현황
  • [그림 1] 출원인의 국가에 따른 출원빈도 비교
    출원인의 국가에 따른 출원빈도 비교
  • [그림 2] 한국을 제외한 출원인의 국가에 따른 출원빈도 비교
    한국을 제외한 출원인의 국가에 따른 출원빈도 비교
  • [표 6] 연도별 포아송 회귀모형 추정값 (한국기준)
    연도별 포아송 회귀모형 추정값 (한국기준)
  • [표 7] 연도별 포아송 회귀모형 추정값 (독일기준)
    연도별 포아송 회귀모형 추정값 (독일기준)
  • [그림 3] 국제특허분류에 따른 한국특허의 출원빈도 비교
    국제특허분류에 따른 한국특허의 출원빈도 비교
  • [표 8] 국제특허분류에 따른 포아송 회귀모형 추정값
    국제특허분류에 따른 포아송 회귀모형 추정값