A Study on the Analysis of Intellectual Structure of Korean Veterinary Sciences*

국내 수의과학 분야의 지적 구조 분석에 관한 연구*

  • cc icon
  • ABSTRACT

    The purpose of this study is to see the intellectual structure in the field of veterinary sciences in Korea, using author profiling analysis(APA), a bibliometric approach. Three journals are selected on the basis of citation data, exchanging most citations with Korean Journal of Veterinary. And then, 50 authors who published most articles at selected journals during the given period of time were chosen. The analysis of similarity and dissimilarity among authors by comparing co-word appearance patterns from article title, abstracts, and keywords was made. Authors can be grouped 11 minor clusters under 4 major clusters, depending on their interests in the area of veterinary sciences in Korea. The subjects for each cluster at the veterinary sciences are decided by the matching the keyword, representing author's research interest. As a result, it is possible to figure out the current research trends and the researcher network in the field of veterinary sciences.


    이 연구는 저자프로파일링 기법을 활용하여 국내 수의과학 분야의 지적 구조에 대한 계량적인 접근을 시도하였다. 계량적인 접근은 인용 데이터를 기본으로 수의과학 분야의 국내 3개 주요 학술지를 선정하고, 선정된 학술지에 수록된 740편의 논문 가운데 주요 저자 50인의 논문을 대상으로 분석하였다. 분석결과 분석 대상 50인의 저자는 주제적 연관성에 따라 4개의 상위 클러스터와 11개의 하위 클러스터를 형성하는 것으로 나타났다. 이 연구에서는 주제분야별 지적 구조의 시각화를 위하여 다차원척도법을 이용하여 지도를 생성하였으며, 각 클러스터별로 선정된 저자의 논문 제목, 초록 및 키워드를 이용하여 4개 상위 클러스터 및 11개 하위 클러스터의 주제를 판정하였다. 또한 각 주제분야 클러스터별로 저작 활동이 활발한 연구자를 선정하고 연구자의 관심 주제 분야를 표현하였다. 이 연구를 통하여 수의과학 분야의 주제별 연구자간의 네트워크와 최근 연구 동향 파악이 가능하였다.

  • KEYWORD

    Text Mining , Author Profiling , Knowledge Domain Analysis , Intellectual Structure , Veterinary Medicine

  • 1. 서 론

       1.1 연구의 배경 및 목적

    연구자들이 논문을 작성함에 있어 참고하는 문헌이나 논문을 이용하는 서지결합이나 동시 인용 분석과 같은 계량서지학적 기법은 학문의 발전 과정이나 기술의 진보 동향을 파악하는 데 매우 유익하게 활용될 수 있다. 일반적으로 연구자들은 논문을 생산하는 과정에서 과거 선행 연구를 기반으로 새로운 연구를 수행하며, 따라서 논문에서 인용된 자료와 인용한 자료 사이 혹은 해당 주제를 연구하는 연구자 사이에는 주제적으로 연관성이 있다고 보는 것이다. 특히 연구자 간 혹은 연구 논문 간의 연결고리를 통한 연관 관계의 파악을 통하여 학문간 연계나 융합과 같은 변화 과정에 대한 추적이 가능하며, 다양한 주제 분야에 적용이 가능하다.

    지금까지 학문분야별로 지적 구조에 대한 분석은 Kessler(1963)의 서지결합법과 이후 동시인용분석(Small 1973), 저자동시인용분석(White, Griffith 1981) 등과 같이 인용정보를 이용한 기법들이 전통적으로 활용되어 왔다. 그 외에도 인용정보를 대신하여 논문의 제목이나 초록에 나타나는 용어(디스크립터나 색인어)를 분석하여 문헌간의 관계를 파악 분석 기법으로 Callon, Law, 그리고 Rip(1986)에 의해 개발된 동시출현단어분석(co-word analysis) 기법이 있다. 또한 최근에는 컴퓨터를 이용한 텍스트 처리기술의 발달과 더불어 텍스트 마이닝 기법으로 통칭할 수 있는 저자프로파일링과 요인분석, 클러스터 분석 등을 활용하여 학문의 지적 구조를 분석하는 연구가 점차 확산되고 있다(이재윤, 김희전, 유종덕 2010; Kim and Lee 2008; 이재윤, 문주영, 김희정 2007).

    김판준, 이재윤(2007)에 의해 제안된 프로파일링 기법은 동시인용이나 동시출현 관계를 파악하지 않고 저자나 학술지 또는 문헌에 나타나는 디스크립터를 분석 단위로 하면서, 분석 단위와 함께 사용된 단어를 이용하여 주제간 혹은 저자간 연관관계를 분석할 수 있는 유용한 방법이다. 프로파일링 기법의 분석 단위로는 저자, 저널, 디스크립터 등이 사용되며, 사용되는 분석단위에 따라 저자프로파일링, 저널 프로파일링, 디스크립터 프로파일링으로 구분할 수 있다(김판준, 이재윤 2007; Kim and Lee 2009; Lee, Kim, and Kim 2010).

    계량적 방법을 통한 학문의 발전 과정에 대한 객관성과 신뢰성을 담보할 수 있는 연구가 문헌정보학을 중심으로 제안되어 왔다. 그러나 저자프로파일링 분석 기법은 새롭게 제안된 방법으로 학문 분야의 지적 구조 분석에 유용하게 활용될 수 있으며, 그 대상 주제 분야 또한 점차 확대되고 있는 실정이다. 이 연구에서는 저자프로파일링 기법을 활용하여 국내 수의과학 분야의 지적 구조에 대한 계량적인 접근을 시도하였으며, 계량적인 접근을 위한 기본 데이터는 기존 수의과학 분야의 국내 주요 학술지에 수록된 연구 논문에 나타난 주제어의 동시 출현 패턴과 인용 자료를 이용하였다.

    이 연구의 목적은 국내 수의과학 분야의 연구자들이 연구를 수행하거나 정보를 생산하는 과정에서 인용하는 주요 정보원과 논문에 나타난 주제어의 동시 출현 패턴을 분석해 봄으로써 수의과학 분야의 중점적으로 연구되는 주제 분야를 파악해 보고, 활동적으로 연구를 수행하는 연구자 간에는 어떠한 네트워크가 형성되고 있는 가 등의 지적 구조를 분석해 보는데 있다.

       1.2 연구의 방법 및 절차

    이 연구에서는 저자를 중심으로 하여 해당 논문의 저자들을 선정하고, 선정된 저자와 문헌에서 추출한 용어간의 저자-색인어 프로파일을 통하여 군집을 구분한 다음, 연구 영역의 주제를 식별하여 지적 구조를 시각화하는 McCain(1990)과 김판준, 이재윤(2007) 저자프로파일링 분석기법을 활용하였다.

    저자프로파일링 분석기법을 적용하기 위하여 필요한 단계별로 사용된 방법은 다음과 같다. 저자프로파일링 분석기법의 수행에 필요한 저자의 선정은 먼저 대상 학술지의 선정으로 출발하였다. 수의과학 분야에서 발행되고 있는 국내 학술지 가운데 핵심 학술지는 학술지 간의 인용 빈도에 기반하여 선정하였다. 인용 빈도 조사는 한국과학기술정보연구원의 한국과학기술인용색인 데이터베이스(KSCI, Korea Science Citation Index)를 활용하였다. 선정된 학술지에 수록한 논문의 수를 기준으로 50명의 저작자를 선정하였으며, 50명의 저작자의 논문에 대한 제목, 초록, 그리고 키워드를 Microsoft Excel 2007 프로그램을 이용하여 수작업으로 입력하였으며, 입력된 데이터를 대상으로 포함된 단어를 추출하기 위하여 Porter 스태머를 사용하였다. 이 때 단어의 가중치는 로그 TF X IDF 공식을 활용하였다.

    구성된 저자와 색인어 행렬에 따라 코사인 유사도 행렬을 구하고 저자간 클러스터를 생성하기 위하여 계층적 클러스터링 기법 가운데 하나인 Ward 기법을 활용하였다. 다음으로 다변량 분석을 통해 저자 간의 관계를 2 저자간의 유사성 혹은 상이성 정도에 따라 2차원 공간상에 표현하기 위하여 SPSS의 PROXSCAL 프로시저로 다차원척도법(MDS, Multidimensional Scaling)을 수행하였다.

    이 연구에서 데이터 분석을 위하여 사용된 도구로는 기본 데이터 구축과 저자 선정, 저자 동시인용빈도 산출을 위하여 Microsoft Excel 2007 프로그램을 사용하였고, 다차원척도법은 SPSS Statistics ver. 17.0을 이용하였다.

    *이 연구는 2010년 경기대학교 학술 연구비 지원에 의하여 수행되었음.

    2. 이론적 배경

       2.1 수의과학 분야의 연구영역 구분

    수의과학은 동물을 대상으로 생명과학과 관련된 기초학문부터 의학 분야 전반에 이르기까지 다양한 분야를 다루는 학문이다. 따라서 인간과 함께 생활하는 반려동물은 물론 소나 돼지와 같은 산업동물의 환경과 질병을 연구, 관리하는 등 위생관리와 품질검사를 하고 이를 분석하는 기술과 방법을 종합적으로 연구하는 학문이다.

    수의과학이 사람을 제외한 모든 동물을 대상으로 하는 의과학이긴 하지만 동물과 인간이 함께 생활하고 인간의 삶에 직접 혹은 간접적으로 영향을 미치기 때문에 수의과학에서 수행되는 연구는 궁극적으로 사람의 건강과도 직접 관련되어 있다. 수의과학의 학문적 특성은 대상이 인간이 아닌 동물이라는 것을 제외하면 의학과 공유하는 학문적 연구 분야가 유사하다. 물론 수의과학이 전통적으로 자연과학, 생명공학, 공중보건학, 축산학, 농학 등과 밀접한 관련을 맺고 있지만 본질적 학문의 특성은 의학과 동일하다. 따라서 의학과 마찬가지로 수의과학도 다양한 세부 전문분야가 존재한다.

    다음의 <표 1>은 국가과학기술표준 분류표 상의 수의과학의 위치를 나타내고 있다. 국가과학기술표준 분류표에 따르면 대분류인 농림수산식품의 14개 하위체계(중분류) 가운데 하나로 수의과학이 속해 있으며, 이는 다시 수의전염병 등 11개의 세부 항목으로 구분되어 있다. 11개 세부항목은 수의전염병, 수의 공중보건학, 수의병리학, 수의 미생물 및 기생생물, 수의 약리 및 독성학, 수의 생리 및 생화학, 수의 해부 및 조직학, 임상수의학, 실험동물학, 동물질병

    예방, 그리고 기타 수의학으로 구성되어 있다.

    국내의 수의과대학은 서울대학교를 비롯하여 10개 대학에서 개설되어 있다. 수의과학의 학문적 특성상 많은 실험과 연구가 이루어지고 있으며, 이러한 연구결과를 공표, 공유하기 위하여 현재 국내에서 발행되는 수의과학 및 관련 분야의 학술지는 대한수의학회지를 비롯하여 모두 20여 종에 이르고 있다. 이 연구에서는 수의과학분야의 지적구조 분석을 통하여 수의 과학분야의 학술지 수록 논문을 중심으로 어떠한 분야가 활발하게 연구가 수행되고 있는지, 그리고 분야별로 어떠한 연구자가 활동하고 있는 가를 분석해 보고자 한다.

       2.2 지적 구조 분석을 위한 저자프로파일링 기법

    Kao와 Poteet(2007)는 텍스트마이닝을 자유롭거나 비구조화된 텍스트로부터 흥미로운 지식을 발견하고 추출하는 것으로 정의하면서 정보추출, 정보검색, 자연어 처리, 텍스트 요약, 자동분류 등에서 사용되는 기법을 결합하여 사용할 수 있다고 주장하였다. 텍스트 마이닝은 자연어 텍스트에서 구조를 추론하는 것이며, 특정한 목적에 유용한 메타데이터 정보를 추출하기 위하여 텍스트를 분석하는 과정으로, 분석 대상인 텍스트의 급증과 디지털 텍스트의 입수가 용이해짐에 따라 텍스트 마이닝의 유용성에 대한 활발한 논의가 이루어지고 있다(Witten 2004; 이재윤, 문주영, 김희정 2007).

    텍스트 마이닝을 지적 구조 분석에 적용한 연구는 분석 단위와 세부 기법에 따라서 용어 클러스터링ㆍ용어 네트워크 분석 연구, 문헌 클러스터링ㆍ문헌 네트워크 분석 연구, 저자ㆍ저널ㆍ디스크립터 프로파일링 분석 등으로 구분할 수 있다(이재윤, 김희전, 유종덕 2010). 또한 프로파일링 기법은 목적에 따라 학술지의 논문, 석ㆍ박사 학위논문, 단행본 등과 같은 분석자료를 대상으로 원문헌 또는 인용 데이터를 분석 데이터로 선택할 수 있으며, 분석단위를 디스크립터나 주제명과 같은 주제어, 저자 및 저자 그룹, 저널 등을 분석 단위로 선택하여 분석할 수도 있다(김판준 2011).

    디스크립터 프로파일링은 주제를 대표하는 개체로 통제어인 디스크립터를 사용하되, 각 디스크립터 및 디스크립터 간의 관계는 해당 디스크립터가 부여된 문헌 집합의 단어 즉 문헌의 표제와 초록에 출현한 단어를 기반으로 표현하는 방법이다.

    저자프로파일링은 디스크립터 프로파일링과 달리 디스크립터로 주제를 표현하는 것이 아니라 저자로 주제를 표현하는 방법이다. 그러나 분석절차는 디스크립터 프로파일링분석과 동일하다. 저자프로파일링 기법에서는 분석을 위하여 해당 문헌의 저자들을 선정하고 선정된 저자들과 문헌의 표제와 초록에서 추출한 텍스트 용어들과의 관계를 저자-색인어 프로파일을 통하여 군집을 나누고, 연구 영역의 주제를 식별하여 표현한다.

    지금까지 주제 분야의 지적 구조분석을 위하여 저자프로파일링 기법이 사용된 사례는 다음과 같다.

    Kim과 Lee(2009)는 프로파일링분석 기법을 이용하여 문헌정보학 분야의 관점에서 기록 관리학분야의 연구동향을 제시하기 위하여 연구를 수행하였다. 분석 대상은 LISA DB에서 “archiv*”라는 키워드를 이용하여 검색한 결과 나타나는 단어를 대상으로 디스크립터 프로파일링과 저널 프로파일링을 이용하였으며, 분석 결과 기록관리와 밀접하게 관련된 6개의 대표저널, Archivaria, Advanced Technology Li-braries, Journal of the Society of Archivists, American Archivist, Archifacts, and Re-cords Management Bulletin을 제시하였다. 가장 포괄적인 주제는 디지털도서관이고, 핵심 매체는 전자 매체로 밝혀졌으며, 또한 많이 사용되는 간행물로 사진, 인터넷, 도서, 음악, TV, 영상, 신문 등이 이용된다고 주장하였다.

    이재윤 등(2010)은 국내 주거학 분야의 지적 구조를 분석하고자 저자프로파일링과 요인 분석 기법을 적용하였다. 요인분석을 통하여 요인사이의 상관관계를 전제로 하는 비직교회전 방식을 채택하여 요인 구조행렬과 요인 상관행렬을 분석에 활용하였다. 또한 김판준(2011)은 저자프로파일링 기법을 이용하여 국내 독서 및 독서교육 분야의 연구 영역 및 동향을 분석하여 향후 독서 및 독서교육 분야의 연구방향을 제시하였다.

    유종덕, 최은주(2011)는 건축학 분야의 지적 구조를 분석하기 위하여 저자프로파일링분석과 저자동시인용분석을 동시에 활용하여 그 유용성을 비교ㆍ검증하였다. 연구 결과 저자동시인용분석 기법이 가지고 있는 약점을 저자프로파일링이 보완하여 최근의 건축학 분야의 연구경향과 신진 연구자들의 파악이 가능함을 밝혔다. 또한 저자프로파일링 기법은 문헌의 출판과 함께 즉시 분석이 가능하고, 인용색인을 사용하는 분석 방법보다 분석을 위한 데이터 준비가 간단하여 인용색인 데이터베이스가 상대적으로 덜 구축되어 있는 국내 문헌을 대상으로 지적 구조를 활용하기에 매우 유용한 분석 기법임이 확인되었다.

    지금까지 살펴본 바와 같이 김판준과 이재윤(2007)의 연구에서 제안된 저자프로파일링 기법은 저자가 발표한 논문에 출현한 단어를 색인 자질로 하여 저자의 프로파일 벡터를 구축한 후 저자 간의 관계를 파악하는 방법이다. 이 방법은 분석 대상을 문헌에 비해서 주제 표현력이 뛰어난 저자를 사용하므로 분석 결과의 해석이 용이하다는 장점이 있다. 이 연구에서는 수의과학분야의 지적 구조 분석을 위하여 저자프로파일링 기법을 활용하였다. 지금까지 저자프로파일링 기법을 이용하여 수의과학 분야의 지적 구조를 분석하기 연구는 시도된 바 가 없으며, 또한 해당 학문 분야의 연구 영역과 동향을 분석한 연구는 찾아볼 수 없다.

    3. 저자프로파일링을 위한 데이터 수집

       3.1 저자프로파일링 분석 절차

    이 연구에서는 McCain(1990)과 김판준, 이재윤(2007)이 제안한 저자프로파일링 기법을 활용하였으며, 저자프로파일링 분석기법을 이용하여 수의과학 분야의 지적 구조를 분석하기 위한 절차는 다음과 같이 정리할 수 있다.

    1단계는 분석 대상인 저자를 선정하는 것이다. 연구 대상 기간 동안 저자가 발표한 논문의 투고 가중치 점수를 기준으로 분석 대상 저자를 선정한다. 이 연구에서 저자를 선정하기 위한 가중치 점수는 대상 학술지에 수록한 저자별 논문의 수로 한다.

    2단계는 저자의 선정을 위하여 먼저 수의과학 분야의 핵심 학술지와 수록된 논문의 저자를 분석하고, 1단계에서 선정된 분석 대상인 저자가 수록한 논문을 수집하는 것이다. 이 단계에서 수행되는 업무는 선정된 저자의 연구 대상 기간 동안에 투고한 논문으로부터 제목, 초록, 키워드 등을 수집하는 것이다.

    3단계는 수집된 국영문 제목, 국영문 초록과 키워드에 자동색인을 실행하여, 저자와 그 저자의 논문에 나타난 단어와의 벡터를 생성한다.

    4단계는 선정된 저자에 대한 저자-색인어 프로파일 행렬작성 단계로 선정된 저자와 문헌에서 추출한 단어와의 프로파일에서 유사도를 작성하여 저자-색인어 프로파일 행렬을 작성한다. 이 단계에서는 선정된 저자의 논문에서 대표적으로 출현하는 단어들의 빈도를 조사하여 선정된 저자와 추출된 용어를 이용하여 순위행렬을 작성한다.

    5단계는 선정된 저자 사이의 문헌유사성 행렬을 작성한다. 이 단계에서는 특정 백터간 유사도를 측정하는 유사계수인 코사인 계수를 코사인 유사도 행렬을 작성한다. 또한 값의 크기에 따라 나타나는 효과를 줄이기 위하여 피어슨 상관계수행렬을 작성한다.

    6단계는 다변량분석 단계로 상관계수행렬을 입력데이터로 하여 다변량분석을 수행하는데 이때 사용되는 다변량분석에는 군집분석, 다차원척도법, 요인분석 등이 있다. 이 연구에서 수의과학 분야의 저자 지도는 코사인 상관계수행렬을 기반으로 다변량분석 기법 중 다차원척도법을 이용하여 작성한다. 저자군집에 사용된 기법은 계층적 응집방법으로 저자프로파일링 분석의 경우 Ward기법을 적용한다.

    7단계는 분석결과를 해석하고 유효성을 조사하고, 분석 결과를 바탕으로 학문의 지적 구조를 분석하고 평가를 실시한다.

       3.2 데이터 수집

    이 연구의 분석 대상은 수의과학 분야의 핵심 학술지인 한국가축위생학회지, 대한수의학회지, 한국임상수의학회지 3종을 대상으로 하고, 분석 대상 시기는 자료 수집 당시 인용 데이터가 확보된 2009년을 기준으로 2007년까지 3년으로 설정하였다. 수의과학 분야의 핵심 학술지를 선정하기 위해서 역사가 가장 오래된 대한수의학회지(1961년 창간)를 기준으로 인용 데이터를 활용하여 관련 학술지를 탐색하는 방식을 취하였다.

    2007년부터 2009년까지 3년 간 선정된 3개 학술지에 수록된 분석대상 논문 수는 한국임상수의학회지가 380건, 대한수의학회지가 194건, 한국가축위생학회지가 166건으로 3년간 3개 학회지의 누계는 740건이다.

    논문 740편에 대하여 학술지명, 권호정보, 발행년도, 논문명, 논문 저자명의 데이터를 수집하였고, 분석 대상 논문 740편의 저자는 총 1,583명으로 나타났다. 저자프로파일링 분석을 위하여 저자 1,583명 중 3년간 12편(연평균 4편) 이상의 논문 발표한 저자를 기준으로 저자를 선정하였으며, 기준에 부합되는 저자는 50명이다.

    다음으로 선정된 저자 50명에 대한 1차 프로 파일 행렬을 구성하고, 코사인 유사도행렬을 작성하였다. 수의과학 분야의 저자 지도는 코사인 상관계수행렬을 기반으로 다변량분석 기법 중 다차원척도법을 이용하여 작성하였다. 저자군집에 사용된 기법은 계층적 응집방법으로 저자 프로파일링 분석은 Ward기법을 적용하였다.

    데이터 분석 도구로는 기본 데이터 구축과 저자 선정, 저자동시인용빈도 산출을 위하여 Microsoft Excel 2007 프로그램을 사용하였고, 다차원척도법은 SPSS Statistics ver. 17.0을 이용하였다.

    3.2.1 대상 학술지의 선정

    저자프로파일링 분석을 이용하여 학문의 지적 구조 분석을 위한 첫 번째 단계는 데이터 수집단계이다. 이 연구에서 차용한 저자프로파일링 분석 기법의 장점 가운데 하나는 개별 논문에 대한 인용 데이터를 필요로 하는 저자동시인용분석이나 저자서지결합분석과는 달리 학술지간 인용빈도 데이터를 이용하는 것으로 데이터 수집이 비교적 용이하다는 것이다.

    저자프로파일링 분석기법을 수행하기 위해서는 우선 분석 대상 저자의 선정이 선행되어야 한다. 대상 저자의 선정은 먼저 대상 학술지의 선정으로 출발하였다. 현재 국내에서 발행되는 수의과학 및 관련 분야의 학술지는 모두 20여 종에 이르고 있다. 여기에서 수의과학 분야에서 발행되고 있는 국내 학술지 가운데 핵심 학술지는 학술지 간의 인용 빈도에 기반하여 선정하였다. 인용 빈도 조사에 앞서 수의과학 분야에서 역사가 가장 오래되고 해당 학문 분야의 핵심 학술지로 인식되고 있는 대한수의학회지(1961년 창간)를 기준으로 관련 분야의 학술지를 탐색하였다. 인용 빈도 조사는 한국과학기술정보연구원의 한국과학기술인용색인 데이터베이스를 활용하였다.

    데이터베이스 검색 결과 2002년부터 2009년까지 대한수의학회지로부터 가장 많이 인용된 학술지는 한국가축위생학회지(23회), 대한수의학회지(17회, 자기인용), 한국임상수의학회지(8회), 그리고 한국수의공중보건학회지(8회)의 4종이었다. 이들 가운데 한국임상수의학회지와 한국수의공중보건학회지는 인용된 횟수가 8회로 동일하게 나타났으나 나머지 2개 핵심 학술지로의 인용 횟수가 상대적으로 높은 한국임상수의학회지를 포함하여 핵심 학술지를 3개로 한정하였다.

    3년간 3개 학술지에서 수록된 논문에 인용된 학술지를 한국과학기술인용색인 데이터베이스를 통해 검색해본 결과 3개 학술지에서 3년간 인용된 빈도 합계가 2회 이상인 학술지는 모두 19종으로 다음의 <표 2>와 같다. 농업생명과학연구를 비롯한 3종은 다른 두 학술지에서 각각 1회씩 인용되어 인용빈도 합계가 2회 이상이므로 대상에 포함하였다.

    핵심 학술지별로 수록된 논문에 인용된 학술지별 빈도 순위를 살펴보면 대한수의학회지의 경우 한국가축위생학회지, 대한수의학회지, 한국임상수의학회지의 순이었으며, 한국가축위생학회지는 한국가축위생학회지, 한국임상수의학회지, 그리고 대한수의학회지의 순으로 나타났다. 또한 한국임상수의학회지는 한국임상수의학회지, 대한수의학회지, 그리고 Journal of Veterinary Science를 많이 인용하고 있는 것으로 조사되었다.

    자기 인용을 제외하고 3개 대표 학술지로부터 3년간 총 2회 이상 인용된 학술지는 중복을 제외하면 모두 19종이다. 다음 <그림 1>은 3개

    대표 학술지와 나머지 16개 학술지 사이의 인용 관계를 나타낸 것이다.

    <그림 1>에서 나타난 바와 같이 대상 3개 학술지 중에서도 대한수의학회지와 한국임상수의학회지의 두 학술지에서 함께 인용된 학술지가 많은 것으로 나타났다. 대한수의학회지의 경우 자기 인용을 제외하고 14개 학술지를, 그리고 한국임상수의학회지는 16개 학회지를 인용하였으며, 2개 학술지가 공동으로 인용한 학술지는 13개에 이르고 있다.

    대한수의학회지와 한국임상수의학회지의 경우 한국가축위생학회지와 자기 인용을 포함 할 경우 4개 학회지를 공동으로 인용하였으며, 공동으로 인용한 학술지의 수는 동일한 것으로 나타났다. 자기 인용을 제외하고 3개 학술지에 공동으로 1회 이상 인용된 학회지는 한국수의공중보건학회지와 Journal of Veterinary Science이다.

    분석 대상 시기는 한국과학기술인용색인 데이터베이스에 인용 데이터가 확보된 2009년을 기준으로 2007년까지 3년으로 설정하였다. 2007년부터 2009년까지 3년 간 대상 3개 학술지에 수록된 분석대상 논문 수는 총 740건이다. 이를 학회지별로 살펴보면, 한국임상수의학회지가 2007년(134건), 2008년(114건), 2009년(132)건으로 총 380건, 대한수의학회지가 2007년(73건), 2008년(70건), 2009년(51)건으로 총 194건, 한국가축위생학회지가 2007년(61건), 2008년(54건), 2009년(51)건으로 총 166건으로 3년간 3개 학회지의 누계는 740건이다.

    2007년부터 2009년까지의 논문 740편에 대하여 학술지명, 권호정보, 발행년도, 논문명, 논문 저자명의 데이터를 수집하였다. 다음의 <표 3>은 분석대상 3개 학술지와 학술지별 수록 논문 수이다.

    3.2.2 분석 대상 저자의 선정

    대상 학술지가 선정되면 다음 단계는 대상 학술지에 수록된 논문 현황을 파악하고 논문별로 저자를 파악하는 것이다. 3개 학술지에 포함된 분석 대상 논문 740편의 저자는 총 1,583

    명으로 나타났으며, 이 가운데 1편의 논문을 발표한 저자가 885명으로 전체의 55.9%를 차지하였다. 분석의 편의성을 도모하기 위하여 White와 McCain의 연구와 유종덕, 최은주(2011)의 연구를 근거로 대상 저자를 50명 내외로 제한하였다. 총 저자 1,583명 중에서 50명 내외의 저자를 선정하기 위하여 발표한 논문의 수에 따라 저자를 순위화 하였다. 이 결과 12편 이상의 논문을 투고한 저자로 기준이 확정되었으며, 기준을 충족시키는 저자 50명을 선정하였다. 선정된 50명의 명단과 발표 논문 수는 다음의 <표 4>와 같다.

    4. 수의과학 분야의 지적 구조 분석

       4.1 저자프로파일링 분석

    저자를 선정하고 문헌을 수집한 다음 단계는 저자프로파일링 분석을 위해 문헌에 대한 자동색인을 수행하는 것이다. 문헌의 자동색인을 위하여 50명의 저자에 대하여 각자가 발표한 논문의 주제어를 반영하는 색인어를 추출할 수 있도록 논문의 제목과 영문제목, 저자명, 영문저자명, 영문초록 및 영문 키워드를 Microsoft Excel 2007 프로그램을 이용하여 수작업으로 입력하였다.

    입력된 데이터를 이용하여 50명의 저자의 논문에 대한 제목과 초록, 키워드에 포함된 단어를 자동색인으로 추출하여 저자 프로파일을 구축하였다. 자동색인을 위해서 Porter 스태머(Porter stemmer)를 사용하였으며, 단어의 가중치는 로그 TF X IDF 공식(정영미, 이재윤 2001)으로 설정하였다. 저자 프로파일에는 각 저자마다 저자가 사용한 논문의 제목과 초록에 포함된 단어 및 단어 가중치가 할당되었다. 다음으로 분석 대상인 50명의 저자 단위를 단어 벡터로 표현하여 문헌 자동색인을 실시하였으며, 이를 토대로 문헌-색인어 행렬을 도출하였다.

    저자프로파일링 단계에서 수행하여야 할 업무는 미리 선정한 50명의 주요 저자 각자가 발표한 문헌의 색인어 벡터를 병합하여 문헌-색인어 행렬을 구성하는 것이다(이재윤, 김희전, 유종덕 2010). 50명의 저자마다 저자 프로파일벡터를 도출한 다음 이를 모아 저자-색인어 행렬을 구성하였다.

    저자-색인어 프로파일 행렬이 작성되면 상관계수 행렬을 작성하여야 한다. 이 연구에서는 저자 프로파일 사이의 코사인 유사도 행렬을 생성하였으며, 저자 코사인 유사도 행렬을 입력 데이터로 하여 저자 클러스터링을 수행하였다. 이 연구에서는 클러스터의 생성을 위하여 계층적 응집방식을 이용하였으며, 계층적 클러스터링기법의 일종인 Ward 기법을 사용하였다.

    다음의 <그림 2>는 Ward 기법에 의해 50명의 저자가 결집하면서 클러스터가 형성되는 과정을 보여주는 덴드로그램이다. 덴드로그램에서 클러스터의 수를 결정하는 기준선은 4개 클러스터와 11개 클러스터로 나뉘는 지점에 표시하였다. 분석결과 4개의 상위 클러스터와 세분화된 11개의 하위 클러스터가 형성되었다.

    <그림 2>를 바탕으로 각 저자의 소속 클러스터를 정리하면 다음의 <표 5>와 같다. 대군집 A는 소군집이 한개만 나타나고 있으며, 소군집 A-1에 해당하는 저자는 박희명, 유종혁, 박철, 강병택, 정동인, 김주원이다. 대군집 B는 총 3개의 소군집으로 나타나는데 소군집 B-1에 해당하는 저자는 이영원, 최호정, 박성준, 정성목, 조성환, 송근호이고, B-2에 속하는 저자는 김명철, 박창식, 이재연, 그리고 B-3에 속하는저자는 김덕환, 전형규, 김상훈이다. 대군집 C는 총 3개의 소군집으로 나타나고 있으며, 소군집 C-1에 해당하는 저자는 김대용, 김재훈, 정지열, 강상철이고, C-2에 속하는 저자는 송희종,

    박진호, 박선일, 한정희, 추금숙, 이정원, 김남수, 손화영, 그리고 C-3에 속하는 저자는 장광호, 이근우, 오태호이다. 대군집 D는 총 4개의 소군집으로 나타나는데 소군집 D-1에 해당하는 저자는 윤정희, 김준영, 김현욱, 장재영, 최지혜, 정주현이고, D-2에 속하는 저자는 현창백, 이승곤, 문형선이고, D-3에 속하는 저자는 김세은, 서강문, 정순욱, 최석화, 김휘율이며, D-4에 속하는 저자는 이희천, 이효종, 연성찬이다.

    소군집 중 C-2는 8명의 저자가 군집을 이루

    고 있어 가장 큰 클러스터를 나타내고 있으며, B-2, B-3, C-3, D-2, D-4가 각각 3명의 저자가 속해있는 작은 클러스터를 구성하는 것으로 나타났다.

       4.2 지적 구조 분석 결과

    4.2.1 저자간 주제적 연관관계 분석

    상관계수행렬이 작성되면 다변량분석을 수행하여 지적 구조를 분석할 수 있다. 다변량분석은 변량분석의 확장으로 한 개의 독립변인이 미치는 영향이 두 개 이상의 종속변인임을 가정할 경우 다변량분석은 단변량분석에 비해 여러 종속변인을 함께 고려함으로써 복잡한 요인으로 발생하는 사회현상을 분석하는 데 적합한 분석법으로 사회과학 연구에서 활용도가 높다(김석우, 조영기 2005).

    주제분야별 지적 구조의 시각화를 위하여 다차원척도법을 사용한 지도의 생성과 생성된 지도를 바탕으로 군집분석의 결과를 표시하는 방법이 사용되고 있다. 이 연구에서는 다변량분석을 통해 저자 간의 관계를 2차원 공간상에 나타내기 위하여 저자 코사인 행렬을 입력 데이터로 하여 두 저자 간의 유사성 또는 상이성에 따라 지도상에 저자의 위치를 점으로 표시하여 공간적으로 나타내는 다차원척도법을 이용하였다. 이재윤(2007)은 다차원척도법을 사용한 지도작성 방식의 장단점을 비교하기 위하여 실제 지적 구조 데이터를 이용하였다. 실험결과 ALSCAL 알고리즘은 관계가 가까운 변수 간의 거리로 구성되는 국지적인 배치 상태를 상대적으로 잘 나타내지 못하는 문제점으로 인하여 학문의 세부 구조의 표현 능력이 취약한 것으로, 반면에 PROXOSCAL 알고리즘은 다른 방식과 비교하여 지적 구조를 시각적으로 잘 표현할 수 있음을 밝힌 바 있다. 따라서 이 연구에서는 상관계수를 z점수로 표준화하여 유클리드 거리를 산출한 후 ALSCAL 알고리즘 대신 PROXCAL 알고리즘을 이용하였으며, SPSS의 PROXSCAL 프로시저를 이용하여 다차원척도법을 수행하였다.

    <그림 3>은 3년간 12편 이상의 논문을 수록한 저자 50명을 대상으로 저자 간 프로파일 유사도 행렬을 입력하여 SPSS의 PROXSCAL 프로시저로 다차원척도법을 수행한 결과로 생성된 다차원척도법 지도이다.

    <그림 3>에서는 연구자들의 연구 관심분야에 대한 주제적 유사성을 시각적으로 보여준다. 즉, 지도상에서 두 저자 간의 유사도가 높고 상이도가 낮을수록 두 점은 공간상에서 가까이 배열된다. 반대로 유사도가 낮고 상이도가 높은 저자의 경우 멀리 떨어져서 나타나며, 다른 저자들과 유사성이 높은 저자들은 지도의 중심

    에 위치하고, 유사성이 낮은 저자들은 지도의 주변에 위치하게 된다.

    그러나 실제 지도상에 나타나는 사실만으로는 저자간의 관계를 보여주기 위한 시각화에는 한계가 있다. 보다 명확한 시각화를 위하여 SPSS의 PROXSCAL 프로시저로 다차원척도법을 수행한 결과로 생성된 다차원척도법 지도에 저자 클러스터를 표시하면 저자간 주제적 연관성을 보다 명확하게 볼 수 있다. 저자 코사인 유사도 행렬을 입력 데이터로 하여 저자 클러스터링을 수행하고 계층적 클러스터링 기법의 일종인 Ward 기법에 의해 50명의 저자에 대한 클러스터를 4개의 대군집(A부터 D)과 11개의 소군집을 다차원척도 지도에 표시한 결과는 다음의 <그림 4> 및 <그림 5>와 같다.

    4.2.2 수의과학 분야의 주제 분포

    다음으로 11개 클러스터의 주제를 파악하기 위해서 클러스터 내 논문간 비교를 통하여 논문간 유사도가 가장 높은 논문을 각 클러스터

    별로 추출하였다. 다음의 <표 6>은 클러스터별로 대표할 수 있는 논문의 제목과 저자 키워드를 포함하고 있다.

    <표 6>에 나타난 각 클러스터별 대표 논문과 저자 키워드를 이용하여 11개 클러스터의 주제를 판정하였으며, 그 결과는 다음의 <그림 6>과 같다. 클러스터 A에 포함된 박희명을 비롯한 6명이 유사한 분야의 연구를 수행하고 있으며, 그들이 연구하는 주제는 가축의 뇌종양에 관한 것으로 나타났다. 클러스터 B에 해당되는 주제분야는 영상진단, 외과치료, 그리고 한방 요법으로 나타났으며, 클러스터 C는 선암종 및 종양, 바이러스성 질환, 그리고 인진쑥 추출물 및 항암효과를, 그리고 마지막으로 클러스터 D는 심혈관질환, 치과 및 안과질환, 소화기계, 그리고 생리 및 행동 분석 분야의 주제를 포함하고 있는 것으로 판정되었다.

    다음으로 11개 소분류 클러스터의 주제를 고려하여 4개 대분류 클러스터의 주제를 판정하였으며, 그 결과는 다음의 <그림 7>과 같다. 3개의 소주제를 포함하는 클러스터 B를 대표하는 주제 분야는 진단 및 치료법이며, 클러스터 C는 종양 및 바이러스성 질환, 그리고 마지막으로 클러스터 D는 기타질환 및 생리로 표현될 수 있다.

    지금까지 분석된 데이터를 기반으로 <표 7>은 2007년부터 2009년 3년 동안 수의과학 분야의 3개 학술지에 수록된 논문의 주제 분야와 당해 분야에서 활발하게 저작활동을 수행한 주요 저자를 포함하고 있다. 각 주제분야별로 발표된 논문을 기준으로 볼 때 뇌종양 분야, 외과치료, 그리고 바이러스성 질환과 관련된 주제가 타 분야에 비해 활발한 연구 활동을 보이고 있다. 또한 뇌종양(클러스터 A)과 심혈관질환(클러스터 D-2) 분야의 연구는 핵심 연구자간 공동 연구가 활발하게 진행되고 있는 것으로, 반면 치과 및 안과 질환(클러스터 D-3)과 바이러스성 질환(클러스터 C-2) 분야는 핵

    심 연구자간 공동 연구보다는 단독 연구를 수행하는 것으로 나타났다.

    5. 결 론

    이 연구는 국내 수의과학 분야 연구자들의 연구 수행 과정에서 인용하는 주요 정보원과 문헌에 나타난 주제어의 동시 출현 패턴을 분석해 봄으로써 최근 중점적으로 연구되는 주제 분야와 해당 주제 분야에서 활동적으로 연구를 수행하는 연구자 간에 형성된 네트워크를 파악해 볼 수 있도록 수의과학분야의 지적 구조를 분석해 보는데 그 목적이 있다.

    이 연구는 저자프로파일링 기법을 활용하여 국내 수의과학 분야의 지적 구조에 대한 계량적인 접근을 시도하였으며, 계량적인 접근을 위한 기본 데이터는 기존 수의과학 분야의 국내 3개 주요 학술지에 수록된 740편의 연구 논문에 나타난 주제어의 동시 출현 패턴과 인용 자료를 이용하였다. 저자프로파일링을 통하여 수의과학 분야의 국내 연구 동향에 대한 지적 구조를 분석하고자 시도한 결과 밝혀진 사항은 다음과 같다.

    첫째, 분석 대상 50인의 저자 코사인 유사도 행렬을 입력 데이터로 계층적 클러스터링 기법인 Ward기법을 사용하여 저자 클러스터를 구성하였다. 여기에서 저자 지도는 다변량 분석 기법 중 다차원척도법을 이용하였다. 분석결과 수의과학 분야의 저자는 4개의 상위 클러스터와 11개의 하위 클러스터를 형성하였다.

    둘째, 4개의 상위 클러스터 가운데 클러스터 A는 하나의 하위 클러스터를 가지고 있으며, 클러스터 B와 C는 각 3개의 하위 클러스터를, 그리고 클러스터 D는 4개의 하위 클러스터를 가지는 것으로 나타났다.

    셋째, 각 저자 클러스터별로 대표 논문의 제목, 초록 및 저자 키워드를 이용하여 11개 하위클러스터의 주제를 판정하였다. 분석결과 11개 하위 클러스터별 중심 연구자와 관심 주제 분야에 대한 해석이 가능하였다.

    넷째, 11개 하위 클러스터의 주제를 고려하여 4개 대분류 클러스터의 주제를 판정하였으며, 그 결과 클러스터 A의 대표 연구 주제는 뇌종양, 3개의 소주제를 포함하는 클러스터 B의 대표 주제 분야는 진단 및 치료법이며, 클러스터 C는 종양 및 바이러스성 질환, 그리고 마지막으로 클러스터 D는 기타질환 및 생리로 표현하였다.

    마지막으로 각 소분야 주제 클러스터별로 가장 저작 활동이 활발한 연구자를 선정하고 연구자의 관심 주제 분야를 표현하였다.

    이 연구는 인용빈도를 기본 데이터로 수의과학분야의 3개 핵심 학술지와 대표 저자를 대상으로 저자의 논문의 제목이나 초록에 포함된 키워드를 분석하여 수의과학분야의 지적 구조를 분석하였다. 다만 대상 데이터를 3년으로 제한하였기 때문에 수의과학 분야의 학문 발전 과정이나 연구자들의 연구 분야에 대한 관심의 변화 추세를 확인하지는 못하였다. 보다 장기간 동안 수록된 논문과 저자를 분석한다면 수의과학분야에 학문적 발전과정을 포함 지적 구조를 보다 명확하게 살펴볼 수 있는 기회가 될 것이다.

  • 1. 2008 국가과학기술표준분류표. google
  • 2. 김 석우, 조 영기 2005 다변량 분석 google
  • 3. 김 판준 2011 저자프로파일링 기법을 이용한 국내 독서 연구 영역 분석. [한국비블리아학회지] Vol.22 P.21-44 google
  • 4. 김 판준, 이 재윤 2007 연구영역분석을 위한 디스크립터 프로파일링에 관한 연구. [정보관리학회지] Vol.24 P.285-303 google
  • 5. 유 종덕, 최 은주 2011 저자프로파일링분석과 저자동시인용분석의 유용성 비교 검증. [정보관리학회지] Vol.28 P.123-144 google
  • 6. 이 재윤 2007 지적 구조 분석을 위한 MDS 지도 작성 방식의 비교 분석. [한국문헌정보학회지] Vol.41 P.335-357 google
  • 7. 이 재윤, 김 희전, 유 종덕 2011 저자프로파일링과 요인분석을 이용한 국내 주거학 분야의 지적 구조 분석. [한국문헌정보학회지] Vol.44 P.285-308 google
  • 8. 이 재윤, 문 주영, 김 희정 2007 텍스트 마이닝을 이용한 국내 기록관리학 분야 지적구조 분석. [한국문헌정보학회지] Vol.41 P.345-372 google
  • 9. Callon M, Law J, Rip A 1986 Mapping the Dynamics of Science and Technology: Sociology of Science in the Real World. google
  • 10. Kao A, Poteet S. R 2007 “Overview." In A. Kao and S. R. Poteet eds. Natural Language Processing and Text Mining. P.1-7 google
  • 11. Kessler M. M 1963 “Bibliographic coupling between scientific papers." [American Documentation] Vol.14 P.10-25 google
  • 12. Kim Heejung, Lee Jae-Yun 2008 “Explo-ring the emerging intellectual structure of archival studies using text mining: 2001-2004." [Journal of Information Sci-ence] Vol.34 P.356-369 google
  • 13. Kim Heejung, Lee Jae-Yun 2009 “Ar-chiving research trends in LIS domain using profiling analysis." [Scientometrics] Vol.80 P.75-90 google
  • 14. Lee Jae Yun, Kim Heejung, Kim Pan-Jun 2010 “Domain analysis with text mining: Analysis of digital library re-search trends using profiling methods." [Journal of Information Science] Vol.36 P.144-161 google
  • 15. McCain K. W 1990 “Mapping authors in intellectual space: A technical over-view.” [Journal of the American Society for Information Science] Vol.41 P.433-443 google
  • 16. Small H. G 1973 “Co-citation in the scientific literature: a new measure of the rela-tionship between two documents." [Journal of the American Society for Information Science] Vol.24 P.265-269 google
  • 17. White H. D, Griffith B. C 1981 “Author co-citation: a literature measure of in-tellectual structure." [Journal of the Amer-ican Society for Information Science] Vol.32 P.163-171 google
  • 18. White H. D, McCain K. W 1989 “Bibliometrics." [Annual Review of In-formation Science and Technology] Vol.24 P.119-186 google
  • 19. Witten I. H 2004 “Adaptive text mining: Inferring structure from sequences." [Journal of Discrete Algorithms] Vol.2 P.137-159 google
  • [표 1] 국가과학기술표준 분류표 상의 수의과학
    국가과학기술표준 분류표 상의 수의과학
  • [표 2] 3개 학술지에서 3년간 2회 이상 인용된 학술지
    3개 학술지에서 3년간 2회 이상 인용된 학술지
  • [그림 1] 분석 대상 3개 학술지와 2회 이상 인용된 16개 학술지의 인용 관계도
    분석 대상 3개 학술지와 2회 이상 인용된 16개 학술지의 인용 관계도
  • [표 3] 분석대상 3개 학술지별 논문 수
    분석대상 3개 학술지별 논문 수
  • [표 4] 12건 이상 발표한 저자 50인
    12건 이상 발표한 저자 50인
  • [그림 2] WARD 클러스터링 결과 덴드로그램
    WARD 클러스터링 결과 덴드로그램
  • [표 5] Ward 기법으로 분류된 저자 클러스터
    Ward 기법으로 분류된 저자 클러스터
  • [그림 3] 연구자 50인의 다차원척도법 (PROXSCAL) 지도
    연구자 50인의 다차원척도법 (PROXSCAL) 지도
  • [그림 4] 다차원척도법 지도에 표시한 Ward 방식의 4개 대분류 클러스터
    다차원척도법 지도에 표시한 Ward 방식의 4개 대분류 클러스터
  • [그림 5] 다차원척도법 지도에 표시한 Ward 방식의 4개 대분류 클러스터와 11개 소분류 클러스터
    다차원척도법 지도에 표시한 Ward 방식의 4개 대분류 클러스터와 11개 소분류 클러스터
  • [표 6] 11개 클러스터별 대표 논문과 키워드
    11개 클러스터별 대표 논문과 키워드
  • [그림 6] 11개 소분류 클러스터의 주제 해석 결과
    11개 소분류 클러스터의 주제 해석 결과
  • [그림 7] 4개 대분류 클러스터의 주제 해석 결과
    4개 대분류 클러스터의 주제 해석 결과
  • [표 7] 수의과학분야의 클러스터 별 주제 및 주요 저자
    수의과학분야의 클러스터 별 주제 및 주요 저자