평가자의 직업윤리

Comparison of Evaluation Ethics

  • cc icon
  • ABSTRACT

    As the movement of performance evaluation prevails in governments and public sector, the more outside evaluators such as professors, accountants and consultants have been involved in the evaluation process. In this respect, we have much doubts whether the evaluators have the evaluation ethics. With these research questions in mind, we aim to review and compare the ethical principles and evaluation standards of USA, UK, France, Canada and Australia. This article shows that evaluation ethics have been adopted to improve the quality and the usefulness of evaluation and the establishment movement led by the evaluation communities of each countries have reflected the professionalization of evaluation. We found evaluation ethics have some limitations, of which the compliance of ethical principles and evaluation standards are most important. In this regard, we propose some recommendations such as improvement of the sensitivity of evaluation ethics, establishment and execution of ethical principle and evaluation standards, institutionalization and enforcement of the ethical program, and professionalization of evaluation. We expect this article would trigger the researches on the evaluation ethics.

  • KEYWORD

    평가윤리 , 평가윤리원칙 , 평가표준 , 직업윤리 , 전문직업화

  • Ⅰ. 서 론

    본 연구는 선진 각국이 채택하고 있는 평가윤리의 원칙과 표준(ethical principles and standards for evaluation)에 관한 주요내용과 특징 및 한계를 살펴보고, 이를 바탕으로 한국적 실정에 맞는 시사점을 도출하는데 목적이 있다.

    우리나라의 경우,「정부업무평가기본법」을 비롯한 각종 법령을 통해서 정부 및 공공부문에 성과평가(performance evaluation)가 확산되어 왔으며, 이에 따라 정부업무평가에 대한 외부전문가들의 참여범위와 빈도 및 역할도 강화되고 있다. 그러나

    이처럼 외부전문가들이 정부업무와 공공기관의 평가과정에 활발하게 참여하는 만큼 이에 상응하여 평가자들의 윤리가 작동하는지에 대해서는 의문이 있다(송희준, 2006).

    평가윤리의 중요성이 더욱 강조되어야 할 근본적인 이유는 평가의 본질적인 속성에서 기인한다. 기존의 평가연구들은 평가방법이나 평가지표의 개발 등과 같은 기술적인 문제에 치중해 온 경향이 있다. 그러나 ‘평가’(evaluation)라는 단어에 가치(value)라는 말이 내포되어 있는데서 알 수 있는 것처럼, 평가는 가치판단과 관련될 수밖에 없다. 또 평가대상인 정책은 중립적인 것이 아니라, 정치적 협상의 산물이다. 평가는 그 본성상 정책의 문제점과 정당성 등에 관한 정치적 함축성에 관심을 가지며, 정책결정에의 환류를 통해서 정치적 장(場)에 들어오게 된다(Weiss, 1987 : 47-48). 따라서 평가는 불가피하게 정치적 안건으로 다루어지고, 정치적 주장을 위한 수단이 된다(Guba & Lincoln, 1987 : 216). 이러한 점들은 평가의 본질이 기술적이고 관리적인 것이 아니라, 정치적이라는 점을 의미한다. 따라서 실제의 상황에서 평가자들은 정치적 이해관계와 관련된 딜레마에 다양하게 당면할 수 있기 때문에 무엇이 옳고 그른지에 관해서 지침이 될 수 있는 평가윤리강령이나 윤리원칙이 요구된다(Russ-Eft & Preskill. 2009 : 123).

    평가윤리의 필요성은 실증조사 결과들을 통해서도 확인되고 있다. Blazer가 미국, 호주, 캐나다, 영국, 스웨덴의 평가전문가들을 대상으로 실시한 설문조사 결과에 따르면, 평가과정에서 윤리에 대한 고려가 절대적으로 필요하다고 밝힌 것으로 나타났다(Berends, 2007 : 40). 또 호주평가협회(AES) 산하의 윤리위원회가 인터넷 설문조사 방식을 통하여 조사한 바에 따르면, 대부분의 응답자들은 평가과정에서 윤리적 난제와 딜레마에 당면한 경험이 있다고 보고했다(Turner, 2003). 이러한 점들은 평가에 있어서 윤리문제가 매우 핵심적인 과제로 대두되고 있음을 보여준다.

    그러나 송희준(2006)홍준현(2004)문태현(1995) 등의 연구를 제외하면, 평가윤리에 관한 국내의 연구는 매우 미흡한 실정이다. 이에 본 연구에서는 미국, 영국, 프랑스, 캐나다, 호주 등이 채택하고 있는 평가윤리원칙과 평가표준을 살펴보고, 이를 바탕으로 평가윤리의 제고를 위한 개선과제를 도출하고자 한다. 논의의 순서는 다음과 같다. 먼저, 평가윤리의 의의와 역할에 관한 이론적 논의를 제시하고, 제3장에서는 미국, 영국, 프랑스, 캐나다, 호주 등이 채택하고 있는 평가윤리원칙과 평가표준의 내용을 소개한다. 제4장에서는 외국사례를 바탕으로 평가윤리원칙과 평가표준의 특징과 한계를 살펴보고, 마지막으로 우리나라의 평가윤리에 관한 시사점과 개선방안을 제시한다.

    Ⅱ. 평가윤리에 관한 이론적 논의

       1. 평가윤리의 의의

    윤리(ethics)는 인간이 어떤 사회적 집단을 이루고 사는데 있어서 서로 약속되고 공인된 행동기준이며, 그 집단에 속하는 모든 구성원들에 대하여 그것을 당위적으로 준수할 것을 요구하는 사회적 규범을 말한다. 일반적으로 윤리는 ‘무엇이 옳고 그른가를 규명하기 위하여 이성을 사용하는 과정’으로 정의되며, 이의 기본적인 개념은 ‘해를 끼치지 않는다’(do no harm)는 것이다. 이러한 윤리는 두 가지 측면으로 구분하여 살펴볼 수 있다. 그 하나는 모든 사람들에게 적용되어야 하는 도덕적 행동의 기본적 원칙(fundamental principle of moral behavior)에 관한 것이고, 다른 하나는 특정한 직업에 종사하는 사람들에게 적용되는 행위원칙(principle of conduct)이다(Newman & Brown, 1996 : 20). 전자가 일반윤리에 해당된다면, 후자는 직업윤리에 관한 것이라고 할 수 있다.

    한편, 평가윤리의 중요성을 언급한 문헌들은 종종 발견되지만, 평가윤리(evaluation ethics)가 무엇인지에 대한 정의한 경우는 많지 않다. 후술하는 것처럼, 각국의 평가협회들은 평가윤리를 구체적으로 정의하지 않은 채 지침(guidelines), 원칙(principles), 표준(standards), 강령(codes), 규범(norms) 등과 같이 다양한 용어들을 사용하고 있는 실정이다.1) 본 연구와 관련해서는 문태현(1995 : 89)의 논의를 참고할 만한데, 그는 정책윤리를 “올바른 정책이 갖추어야 할 원리나 기준 및 올바른 정책 결정 절차”로 정의하였다. 이를 원용하면, 평가윤리는 ‘올바른 평가가 갖추어야 할 원리나 표준’을 의미하는 것으로, 캐나다재무위원회(Treasury Board of Canada Secretariat, TBCS, 2006 : 15)의 정의와 일치한다.2)

    일반적으로 윤리는 인간에 관한 관계적 개념으로 이해된다. 이에 따라 Simons(2011)는 윤리를 개인적 차원(personal)과 공동체 차원(community) 및 직업적 차원(professional)으로 구분한다. 이와 유사하게 송희준(2006)은 정책평가자의 역할을 과학기술자, 고객옹호자 및 쟁점옹호자로 구분하고, 각각의 역할에 필요한 평가윤리로서 분석적 정직성, 고객책임성, 선 사회구현을 제시한다. 또한 홍준현(2004)은 정책윤리를 정책가 자신과 관련된 윤리, 고객과 관련된 윤리, 동료 및 직업과 관련된 윤리, 일반국민과 관련된 윤리로 구분하고 있다. 송희준(2006)의 고객책임성을 직업적 차원으로 이해하고, 홍준현(2004)이 직업적 차원의 윤리를 고객 및 동료에 대한 윤리로 세분화한 것으로 보면, 윤리적 차원에 관한 논의들은 차이가 크지 않은 것으로 볼 수 있다.

       2. 평가윤리의 기능과 역할

    평가윤리를 이해하기 위해서는 평가윤리가 수행하는 기능과 역할을 살펴볼 필요가 있는데, 이는 다음과 같이 정리할 수 있다.

    먼저, 평가윤리는 평가자와 피평가자를 포함한 이해관계자들과 공익을 보호하는 역할을 할 수 있다. 직업윤리강령을 개발하는 주된 이유 가운데 하나는 전문가에 비해서 상대적으로 열악한 위치에 있는 의뢰인을 보호하기 위한 것이다(Welfel, 2006). 이를 평가자와 피평가자의 관계에 원용하면, 평가윤리는 평가의 의뢰자나 피평가기관에 대한 평가자의 의무를 명확하게 함으로써 의뢰인과 피평가자의 이익을 보호하는 것으로 이해된다. 또 평가윤리를 통해서 평가에 관한 사회적 정의와 형평성을 확보하고, 평가과정과 평가결과의 보고과정에서 발생할 수 있는 피해를 최소화하는데 관심을 기울인다.

    둘째, 평가윤리는 윤리적 평가문화를 구축하는데 기여할 수 있다. 평가의 본질적인 속성은 중립적인 것이 아니라, 정치적이다. 따라서 평가를 수행하는 과정에서 평가자들은 윤리적 딜레마 상황에 당면할 수 있다.3) 이러한 문제들은 평가자 자신은 물론, 평가자와 상호작용하는 사람들의 윤리적 행동에 관한 의사결정과 관련되어 있다. 이런 경우, 평가윤리는 무엇이 옳고 그른지에 관해서 지침을 제공함으로써 평가자들이 윤리문제들에 좀 더 효과적으로 대처할 수 있도록 도와준다. 평가윤리가 구체적인 상황에서 ‘무엇을 어떻게 해야 한다’고 알려주는 것은 아니지만, 평가과정에서 평가자들이 준수해야 할 사항이 무엇인지를 알려줌으로써 윤리적 평가문화를 구축하는데 기여할 수 있다.

    셋째, 전문직업으로서 평가(evaluation as profession)의 위상을 강화시키는데 도움이 될 수 있다(Simons, 2011 : 7).4) 윤리강령(code of ethics)이나 행동강령(code of conduct), 혹은 윤리적 표준(ethical standards)의 존재 여부가 전문직을 구성하는 중요한 구성요소라는 점은 대체로 인정되고 있다(TBCS, 2006 : 5). 평가윤리는 평가분야의 직업윤리로서 평가자들의 비윤리적 행위를 방지하고, 구성원들에게 윤리교육을 실시함으로써 평가자 집단에 대한 평판을 높여준다. 미국이나 캐나다 등이 평가협회를 구성하고 평가윤리와 평가표준을 개발해 온 배경에는 평가영역의 발전에 따라 평가분야도 점점 직업적 범주의 특징을 띠게 되었다는 점이 작용하고 있다(Morris, 2008 : 7).

    끝으로, 바람직한 평가관행을 촉진시키고, 평가관리(management of evaluation)를 강화하는데 도움이 될 수 있다. 평가윤리의 원칙이나 표준들은 평가과정에서 당면하는 실제적인 문제들을 해결하기 위한 일반적인 원칙을 제공함으로써 평가자들이 가장 좋은 방법으로 평가할 수 있도록 도움을 준다. 또한 평가에 방향성을 제공하고, 평가자와 이해관계자들의 의사소통과 협력을 촉진시켜 준다. 이를 통해 평가에 대한 고객의 신뢰성(credibility)을 제고하고, 유해하거나 부패한 관행으로부터 고객과 사회를 보호한다. 나아가 평가표준은 평가가 올바로 수행되었는지를 점검할 수 있는 객관적인 기준이 되므로 이를 통해 평가에 대한 책임성(accountability)을 제고할 수 있다. 궁극적으로 불공정 행위 등에 대한 논란을 판단할 수 있는 기초를 제공하고, 평가에 관한 연구를 유도하는 개념적 틀이나 논리를 제공함으로써 평가제도의 발전이 기여할 수 있다.

    1)Simons(2011)에 따르면, 원칙(principles)은 어떤 행동을 유도하기 위한 윤리적 교훈을 구체화한 일반적인 진술(general statements)로서 규범적이고 바람직한 행동을 희구하고, 표준(standards)은 다른 사람들이 따라야 할 구체적인 진술(specific statements)로서 규범적이고 모범적인 행동을 나타낸다. 평가표준은 평가자와 고객들이 효과적으로 의사를 교환하고, 평가를 통해 충족되어야 할 기준(criteria)에 관해서 상호간에 명확하게 이해하도록 해준다. 평가표준은 평가자나 이해관계자들이 자기들에게 맞추어 평가결과를 부당하게 왜곡시킬 수 있는 가능성을 제거해준다는 점에서 평가윤리와 관련되는데, 이런 점에서 평가표준이 평가윤리원칙보다 협의의 개념이라고 할 수 있다.  2)TBCS(2006)는 윤리(ethics)를 ‘올바른 행동에 대한 원칙(principles)이나 표준(standards)’으로 정의한다.  3)Morris & Cohn(1993)이 미국 평가협회 회원 450명을 대상으로 실시한 실증조사에 따르면, 응답자 가운데 65%가 평가과정에서 윤리적 문제를 경험한 적이 있는 것으로 응답하였으며, 평가경험이 많을수록 윤리문제에 대한 경험도 많은 것으로 나타났다.  4)평가가 별도의 ‘직업’인지에 대해서는 추가적 논의가 필요하지만, 평가윤리가 평가자들의 평가업무 수행과 관련된 윤리기준이라는 점에서 직업윤리의 성격을 가진다고 볼 수 있다. 이는 일반인들에게는 별다른 문제가 되지 않는 행동들이 평가자에게는 허용되지 않는다는 것을 의미한다.

    Ⅲ. 각국의 평가윤리 원칙과 평가표준

    직업표준과 윤리규범은 국제적으로 많이 개발되어 왔다. 일반적으로 평가표준을 출발점으로 활용하여 자국의 문화적 맥락이나 국가적 가치를 반영하여 자체적인 원칙과 표준을 개발하여 운영하는 것이 보통이다. 아래에서는 외국에서 채택하고 있는 평가윤리의 원칙과 평가표준의 주요내용을 살펴보기로 한다.

       1. 미국

    미국의 경우에 평가윤리와 관련하여 중요하게 적용되는 지침은 두 가지이다. 하나는 미국평가협회(American Evaluation Association, AEA)의「평가자를 위한 지도원칙」(Guiding Principles for Evaluators)이고, 다른 하나는 교육평가표준합동위원회(Joint Committee on Standards for Educational Evaluation, JCSEE)가 개발한 「프로그램 평가표준」(Program Evaluation Standards)이다.

    1)「평가자를 위한 지도원칙」(Guiding Principles for Evaluators)

    미국평가협회는 1986년에 평가네트워크(Evaluation Network)와 평가연구회(Evaluation Research Society)가 통합하여 창설되었다. 미국평가협회는 1994년에 평가에 관한 다섯 가지의 기본적인 원칙에 합의하였는데, 이를 수립한 목적은 평가실무에 대한 지침의 제공, 고객과 일반대중에 대한 평가원칙에 관한 정보 제공, 평가의 전문직업화와 전문직업인으로서 평가자의 사회화를 위한 것이었다(AEA, 2004). 미국평가협회의 채택한 다섯 가지 원칙은 체계적 탐색, 역량, 청렴성/정직성, 인간존중, 공익에 대한 책임 등이다.

    먼저, 체계적 탐색(systematic inquiry)은 자료를 근거로 체계적으로 탐색을 수행해야 한다는 것으로, 이의 세부내용은 다음과 같다.

    역량(competence)은 평가를 통해서 이해관계자에게 유용한 성과를 제공해야 한다는 것으로, 이에 관한 세부내용은 다음과 같다.

    청렴성/정직성(integrity/honesty)은 평가자가 정직하고 성실하게 행동해야 할 뿐 아니라, 전체 평가과정에서 성실성과 정직성을 유지하도록 노력해야 한다는 것을 말한다. 이를 위해 평가자는 다음과 같은 세부규정을 준수할 것이 요구된다.

    인간존중(Respect for People)은 평가에 있어서 응답자와 프로그램 참여자, 고객 및 다른 이해관계자의 안전성과 존엄성 및 가치(self-worth)를 존중해야 한다는 것으로, 이의 세부내용은 다음과 같다.

    공익과 공공복지에 대한 책임(Responsibilities for General and Public Welfare)은 평가와 관련하여 일반대중의 이익이나 공익 및 가치를 고려해야 한다는 것으로, 이를 위한 세부규정은 다음과 같다.

    2)「프로그램 평가표준」(Program Evaluation Standards)

    교육평가표준합동위원회(JCSEE)의「프로그램 평가표준」은 교육프로그램이나 자료의 설계, 채택 및 비판을 지도하기 위한 목적으로 개발되었다(JCSEE, 1994).5) 이 표준은 교육프로그램을 대상으로 작성되었지만, 교육영역에만 적용되는 것은 아니다. 실제로 ‘교육’이라는 용어가 30개의 표준 가운데 어디에서도 나타나지 않는다. 따라서 프로그램 평가윤리는 교육분야 이외의 여타 평가윤리에 관한 논의에서 나타나며, 앞에서 설명한 미국평가협회의「평가자를 위한 지도원칙」에 비해 매우 구체적이기 때문에 평가자들에게 유용성이 높은 것으로 평가된다(Morris, 2008 : 13).6)

    프로그램 평가표준은 유용성, 실행가능성, 적합성, 정확성, 및 책임성의 네 가지 범주로 구분되며, 각각의 범주는 평가의 중요한 속성을 반영하고 있다.

    유용성(utility)은 평가가 수요자에게 유용하고 적합하게 활용된 정도를 의미한다. 이는 8개의 세부표준으로 구성되는데, 여기에는 평가자의 신뢰성, 이해관계자에 대한 존중, 평가목적의 명확화, 평가의 기초가 되는 개인적 및 문화적 가치의 명료화, 평가정보의 적정성, 평가과정과 산출물의 적응성, 의도하지 않았던 부정적 결과나 오용의 방지 등이 포함된다.

    둘째, 실행가능성(feasibility)은 평가의 효과성과 효율성을 제고하기 위한 것으로, 이를 위해서는 프로젝트 관리전략의 효과성, 실용적 절차의 활용, 문화적 및 정치적 이해관계 등의 고려, 자원의 효율적 활용 등이 요구된다.

    셋째, 적합성(propriety)은 평가가 적정하고, 공정하며, 합법적이며 정당한지에 관한 것이다. 여기에는 이해관계자와 공동체의 요구에 대한 반응성, 평가계약의 공식적 합의, 참여자와 이해관계자의 존엄성과 법적 권리를 고려한 평가설계 및 평가수행, 이해관계의 명확성과 공정성, 투명성과 공개성, 평가와 관련된 이해갈등의 회피 등이 포함된다.

    넷째, 정확성(accuracy)은 평가가 신뢰할 만하고, 정확하며, 진실된 것으로 믿을 만한 정도를 의미하는 것으로, 이를 위해서는 평가결과나 결정의 정당성, 평가정보의 일관성, 해석의 타당성, 정보수집, 점검, 검증 및 저장의 체계성, 평가설계와 분석의 정확성, 평가논리의 명확성과 무오류성, 의사소통을 통한 오해나 왜곡의 방지 등이 요구된다.

    마지막 원칙은 평가책임성(evaluation accountability)으로, 이는 평가에 관한 사항들을 적절하게 기록하고, 평가과정과 평가결과의 향상 및 책임성에 초점을 두고 메타평가적 관점을 적용하는 것이다.

       2. 캐나다

    캐나다평가협회(Canadian Evaluation Society, CES)는「윤리적 행동을 위한 지침」(guidelines for ethical conduct)을 운영하고 있다. 이 지침이 강조하는 윤리원칙은 역량, 성실성 및 책임성의 세 가지로, 이의 주요 내용은 다음과 같다(www.evaluationcanada.ca).

    먼저 역량(competence)은 평가자는 고객에게 서비스를 제공함에 있어서 유능해야 한다는 것으로, 이를 위해 평가자는 평가에 알맞은 체계적인 방법을 적용해야 하고, 평가에 적합한 내용적 지식을 보유하고 제공해야 한다.

    성실성(integrity)은 고객과의 관계에 관한 것으로, 평가와 관련된 자기의 지식수준을 정확하게 나타내야 하고, 평가를 수행하기에 앞서서 혹은 이해관계의 갈등이 발생한 시점에서 고객에게 이해관계의 상충(conflict of interest)을 선언해야 한다. 또한 평가자는 모든 이해관계자들의 문화적 및 사회적 환경에 민감해야 하고, 이러한 환경에 적합한 방법으로 평가를 수행해야 한다. 끝으로, 비밀엄수, 사생활보호, 의사소통 및 평가결과의 소유권 등에 관해서 고객들과 협의해야 한다고 규정하고 있다.

    책임성(accountability)은 평가자가 평가의 산출물과 성과에 대해서 책임을 져야 한다는 것이다. 이를 위해 평가자는 평가전략과 평가방법의 선택과 관련하여 고객들이 의사결정을 원활하게 할 수 있도록 고객들에게 정보를 제공해야 할 책임을 진다. 또한 평가자는 평가를 통해서 발견한 사실, 한계 및 권고사항 등을 명확하고 정확하며 공정하게 제시해야 한다. 아울러 평가자는 지출에 대해 설명하고, 고객들이 좋은 서비스를 받을 수 있도록 재정적 의사결정에 책임을 져야 한다.

       3. 영국

    1994년에 설립된 영국평가협회(UK Evaluation Society, UKES)는 평가윤리에 관한 원칙이나 방침을 명확하게 제시하지 않고 있다. 다만, 2003년에 평가활동에 관한 수범사례를 구축하기 위하여「모범적 평가를 위한 지침」(Guidelines for good practice in evaluation)을 개발하고, 이를 통해「평가자를 위한 지침」(guidelines for evaluators)을 제시하고 있다.7)

    영국평가협회는 평가자들에게 평가의 목적과 방법 및 의도된 산출물과 산출결과를 밝히고, 기대하지 않았던 효과에 주의해야 하며, 목적의 변화에 대응해야 한다는 점을 강조한다. 또 평가과정에서 평가의 접근방법과 실제의 행동이 변경될 수 있다는 점을 평가책임기관에게 미리 알려주고, 평가의 진행과정에서 발생하는 변화된 사항들을 대화를 통해 알려주도록 권고하고 있다. 평가를 위한 계약과 관련하여 외부의 지원이나 중재를 계약에 포함시키는 것이 유용한지를 검토하고, 계약에 합의하기 전에 평가책임기관과 사전에 토론을 실시하며, 계약의 합의사항을 준수하고, 평가의 설계와 실행의 요건에 중대한 변화가 있을 때에는 평가책임기관과 협의할 것을 제안하고 있다. 아울러 평가품질을 제고하기 위해 경과보고서(progress reports)를 통해서 다른 사람들에게 평가의 품질을 알려주고, 계약에 합의된 품질확보절차를 준수할 것을 강조하고 있다. 이밖에 평가에 참여하는 사람들의 지위와 경력 등에 유해한 영향을 미치지 않도록 노력하고, 평가설계부터 평가수행에 이르는 모든 과정이 투명하고 목적에 부합하게 진행되도록 노력해야 한다는 점을 제시하고 있다.

    이와 함께 영국평가협회는 평가자들이 증빙자료를 적절하고 폭넓게 활용하여 증빙자료에 따라 평가결론을 도출하고, 평가과정에서 자료보호법(Data Protection Act)을 위반하지 않도록 자료를 안전하게 저장할 수 있는 절차를 마련하도록 하고 있다. 또 다른 사람의 지적재산권이나 작업결과를 침해하지 않도록 하고, 평가방법과 평가를 통해서 발견된 사실들, 자료 및 출판물 등에 대한 판권에 대해서는 계약을 통해서 합의하는 것이 바람직함을 밝히고 있다. 나아가 평가를 통해서 발견될 사실들을 기록하고 소통해야 하며, 평가의 활용도를 극대화하기 위해서 평가를 시작할 때부터 평가결과의 공표에 관해서 평가책임기관과 합의하는 것이 바람직하다는 점을 강조한다.

    또한 실제로 평가를 수행함에 있어서 평가자들은 공공영역의 학습을 증진시키기 위한 평가목적에 성실하게 임해야 하고, 달성가능성과 평가자의 능력에 관해서 현실성을 가져야 하며, 평가과정의 청렴성을 훼손할 우려가 발생할 경우에는 평가계약을 거절하거나 종결할 것을 권고하고 있다. 나아가 특정한 맥락에서 평가에 관해서 알아야 할 대중의 권리를 인식하고, 평가과정과 평가결과의 공표과정에서 모든 사람들을 형평성 있게 처우해야 한다는 점을 강조하고 있다.

       4. 프랑스

    프랑스평가협회(French Evaluation Society, SFE)는 1999년에 창설되었으며, 평가방법과 윤리적 원칙 및 품질표준의 개발을 주도하고 있다. 2003년 10월에 프랑스평가협회의 총회에서 채택된 「평가지도원칙에 관한 강령」(Charter of Evaluation Guiding Principles for Public Policies and Programmes)은 프랑스평가협회 회원들이 공유하고 있는 가치를 표현한 것이다. 이 강령에 규정된 지도원칙(guiding principles)은 다원성, 독립성, 역량, 인간 존중, 투명성, 조언가능성 및 책임성의 일곱 가지 원칙으로 구성된다(www.sfe-asso.fr)8).

    먼저, 다원성(pluralism)은 평가의 실행과정이 공공관리(public management), 민주주의 및 과학적 논의와 같은 상이한 논거에 의해서 영향을 받는다는 점을 전제로, 평가대상이 되는 정책이나 프로그램에 관한 다양한 관점들을 균형적으로 고려해야 한다는 것이다.

    독립성(distance)은 평가가 불편부당하게(impartially) 수행되어야 하며,9) 이를 위해 평가자는 상대방에게 이해관계의 상충(conflict of interest)이 발생할 수 있음을 알려주어야 한다. 또한 독립성은 평가과정이 프로그램 관리와 의사결정과정과 독립적으로 수행된다는 것을 의미하기도 하는데, 이는 정책결정자의 선택의 자유를 보호하는 역할을 수행한다.

    평가의 설계, 평가의 관리와 의뢰(commission), 자료수집과 방법론 선택, 사실의 해석 등에는 특별한 역량이 필요하다. 따라서 역량(competence)은 평가에 참여하는 사람들은 전문적 기법들을 구축하고 부단히 갱신해야 할 것을 요구한다.

    인간존중(respecting the integrity of individual)은 평가의 영향을 받는 모든 사람들의 권리(rights)와 고결성(integrity) 및 안전(safety)을 존중해야 한다는 것을 말한다. 이런 점에서 평가자는 당사자의 동의없이 자기들이 수집한 정보와 의견의 출처를 공개해서는 안 된다.

    투명성(transparency)은 평가에서 발견된 사실들(평가결과)을 제시할 때 평가대상, 목적, 의도했던 관련자들, 물어봤던 질문들, 사용된 방법들과 방법론적 한계, 주장들, 그리고 이러한 사실들에 이르게 된 기준들(criteria)을 명확하게 기술해야 한다는 것을 말한다. 평가에서 발견된 사실들(평가결과)은 공표되어야 하며, 평가결과의 공표방법은 평가를 시작할 때 미리 결정해 두어야 한다.

    조언가능성(advisibility)은 2006년의 개정안을 통해 신설된 내용으로, 이는 평가의 촉진과 민주적 보고, 공공지출의 효율성, 조직학습 등 이 헌장의 서문에서 언급된 목표와 관련된 결과를 산출할 가능성이 있을 때에만 평가를 하기로 결정하고 설계해야 한다는 것을 말한다.

    책임성(responsibility)을 확보하기 위해 평가를 시작할 때 관련된 행위자들 사이에 책임성을 어떻게 할당할 것인지를 결정해야 하며, 이러한 책임성은 평가의 각 기능별(예, 정의, 관리과정, 연구 및 분석, 사실 및 권고안의 작성, 평가결과의 배포 등)로 명확하게 배분되도록 해야 한다. 이를 위해 평가과정에 관여하는 개인이나 조직들은 평가를 수행하기 위해서 필요로 하는 적합한 자원이나 정보를 이용할 수 있어야 한다.

       5. 호주

    호주평가협회(Australisian Evaluation Society, AES)는 1년 이상 회원들과의 협의과정을 거쳐서 1997년에 이사회의 승인을 받아「윤리적 평가를 위한 지침」(Guidelines for the Ethical Conduct of Evaluations)을 채택하였다.10) 2000년 11월에는 평가윤리지침과「호주평가협회 윤리강령」(AES Code of Ethics)을 통합하여 모든 회원들에게 적용하고 있다. 즉, 호주평가협회는 2000년에 윤리강령을 채택하고, 이 강령의 제1항에서 회원들이 평가를 위임, 수행 및 보고할 때, 평가윤리지침의 윤리적 원칙과 절차를 준수하도록 규정하고 있는 것이다.

    호주평가협회가 평가윤리에 관한 지침을 마련한 목적은 이론적으로나 실무적으로 평가의 윤리성을 향상시키고, 평가과정에서 나타나는 윤리적 문제를 해결하는데 도움을 주며, 일반조직이나 단체들이 자체적인 평가매뉴얼과 지침을 개발하기 위한 준거를 제시하는데 있다(www.aes.asn.au). 호주평가협회의 평가윤리지침은 평가의 주된 과정을 준비단계, 수행단계 및 보고단계로 구분하고, 각 단계별로 윤리원칙을 준수하기 위한 절차들을 제시하고 있다.

    준비단계에서 준수해야 할 윤리원칙은 윤리적 위험을 가늠하고, 평가로 인해서 영향을 받는 사람들에 대한 위험을 감소시킬 수 있는 방법을 알아내는 것이다. 이를 위한 지침으로 서면보고, 평가한계와 상이한 이해관계의 파악, 계약절차, 여건변화에 대한 조언, 잠재적 위험이나 해악의 탐색, 역량 확보, 잠재적 이해갈등의 공개, 공정한 경쟁, 공개성과 공정성 등을 제시하고 있다.

    평가의 수행단계에서 준수해야 할 윤리원칙은 평가에 영향을 받거나 기여하는 사람들의 권리와 사생활, 존엄성 등을 존중하면서 건전하고 완전한 정보에 바탕을 두고 평가를 수행해야 한다는 것이다. 이를 위한 지침으로 호주평가협회는 차이와 불공평성에 대한 고려, 평가목적과 평가의뢰자의 확인, 동의의 확보, 평가의 엄밀성, 한계의 인정, 비밀엄수, 문제상황의 보고, 부정행위에의 대응 등을 제시하고 있다.

    마지막 단계인 보고단계(reporting the results of an evaluation)에서 준수해야 할 윤리원칙은 평가결과를 공정하고 균형 있게 보고해야 한다는 것이다. 이를 위해 호주평가협회는 명확성과 간명성, 공정성과 포괄성, 출처와 인용, 평가자 의견을 반영한 보고서 작성, 보고서의 충실성 등을 제시하고 있다.

    5)교육평가표준합동위원회(JCSEE)는 1975년에 12개의 직업조직들이 연구와 평가연구를 함께 수행하기 위해서 구성되었다. 이 위원회는 많은 연구자와 평가자의 검토와 비평 및 공청회 등을 거쳐서 1981년에 30개의 표준을 명시한 평가표준을 발간하였다. 이어 1994년과 2008년 두 차례의 수정을 거쳤는데, 본 연구에서는 2008년의 제3차 개정안을 중심으로 논의한다.  6)JCSEE의 평가표준은 미국은 물론 캐나다와 호주 및 뉴질랜드 등에서도 중복적으로 채택하고 있는데, 이점은 JCSEE의 평가표준이 체계적이고 관련 분야에서 존중되고 있음을 보여준다.  7)영국평가협회의「모범적 평가를 위한 지침」은 네 개의 절로 구분되며, 각각의 절은 평가자 자신과 평가주관부처, 평가참여자 및 자체평가와 관련된 사람들에 관한 내용으로 구성되어 있다. 이 가운데 본 연구목적과 관련된 내용은「평가자를 위한 지침」이므로 여기서는 이를 중심으로 논의한다.  8)2003년에 채택된 프랑스평가협회의「프로그램평가 지도원칙에 관한 강령」(Charter of Evaluation Guiding Principles for Public Policies and Programmes)은 2006년에 개정되었다. 이를 통해 기존의 여섯 가지 원칙에 조언가능성(principle of advisibility)을 추가하여 일곱 가지 원칙으로 확대하고 다원성의 내용을 다소 변경하였으나, 나머지 내용은 차이가 없다(www.sfe-asso.fr).  9)independence라는 용어가 2006년에 principle of distance로 변경되었으나, 그 내용이 개정 이전과 동일하고 내용적 적절성 등을 고려하여 여기서는 ‘독립성’이라는 용어를 사용하였다.  10)호주평가협회(AES)는 Joint Committee의 평가표준, 미국평가협회(AEA)의 평가자를 위한 지침 및 캐나다평가협회(CES)의 윤리적 행동지침 등을 보완적으로 적용하고 있다(www.aes.asn.au).

    Ⅳ. 평가윤리 원칙 및 평가표준의 특징과 한계

       1. 특징

    앞에서 살펴본 미국, 영국, 프랑스, 캐나다 및 호주가 채택하고 있는 평가윤리에 관한 원칙과 평가표준과 관련된 주요한 특징들을 정리하면 다음과 같다.

    첫째, 평가윤리원칙과 평가표준을 수립한 배경과 목적은 평가품질과 평가의 유용성을 제고하기 위한 것이다. 미국의 경우, 존슨대통령의「빈곤과의 전쟁」에 따라서 수많은 정부프로그램을 평가했는데, 평가비용에 비해 평가의 품질이나 유용성은 낮았다. 이에 대한 반성으로 20세기 후반에 들어서 실무자들 사이에서 평가자의 행동에 관한 규약이 필요하다는 인식이 대두되어 1981년에 The Program Evaluation Standards for Evaluations of Educational Programs, Projects and Materials를 개발하였고, 1994년에 이를 개정하여「프로그램 평가표준」을 수립하였으며, 미국평가협회의 창설을 계기로「평가자를 위한 지도원칙」을 마련한 것이다. 캐나다가 교육평가표준합동위원회(JCSEE)의 평가표준 개발을 지원하고 자체적인 윤리지침을 마련한 것이나, 영국이 평가활동에 관한 수범사례를 수집하여 평가지침을 수립한 것도 이와 동일한 맥락이라고 할 수 있다.

    둘째, 평가윤리원칙과 평가표준의 정립과 확산을 위한 활동은 각국의 평가협회를 중심으로 이루어지고 있다는 점이다.「평가자를 위한 지도원칙」이 수립된 것은 평가연구회(ERS)와 평가네트워크(Evaluation Network)를 합병하여 미국평가협회가 창설된 이후이며, 캐나다의「윤리적 행동을 위한 지침」을 채택한 것도 캐나다평가협회이다. 영국과 프랑스 및 호주 등의 경우에도 전문가들이 평가협회를 설립하고, 이들을 중심으로 평가윤리나 평가지침 등을 마련하였다. 이처럼 선진 각국이 평가협회를 설립하고, 이를 중심으로 평가윤리를 정착 및 확산시키고자 노력하는 현상은 ‘평가’가 전문직업적 활동영역으로 전환되는 사회적 변화를 반영한 것으로 볼 수 있다. 각국이 평가협회를 설립하게 된 것은 그만큼 평가업무에 종사하는 실무자와 연구자가 증가하였다는 점을 의미한다. 왜냐하면, ‘평가’가 지속적이고 전문적인 활동이 아니라면 평가윤리원칙과 평가표준을 수립할 필요성이 없었을 것이기 때문이다.

    셋째, 각국이 채택하고 있는 평가윤리의 원칙이나 표준들은 Kitchener(1984)의 윤리원칙들이 잘 반영된 평가분야의 직업윤리로 이해되고 있다는 점이다.11) 미국과 캐나다 및 프랑스가 채택하고 있는 성실성과 정직성은 Kitchener(1984)의 성실성(fidelity) 원칙과 부합하며, 호주는 공정성과 균형성의 세부내용에서 정직성을 규정하고 있다. 미국과 호주의 인간존중과 프랑스의 다원주의와 독립성의 원칙은 자율성 존중의 원칙과 일치하며, 공익에 대한 책임성은 미국과 프랑스 및 캐나다가 공통적으로 채택하고 있다. 또한 호주는 윤리적 위험의 최소화 원칙을 명시하고 있고, 미국은 인간존중 원칙의 세부내용으로 고객이나 이해관계자의 피해최소화와 이익극대화에 관한 사항을 규정하고 있다. 프랑스와 캐나다는 이에 관한 명시적인 원칙을 규정하고 있지 않지만, 각국이 채택하고 있는 평가윤리의 원칙들이 궁극적으로 비유해성(nonmaleficence)과 수혜성(beneficence)과 관련된 것으로 볼 수 있다. 영국의「평가자를 위한 지침」도 미국이나 프랑스 등과 유사하다. 그러나 영국은 평가윤리의 일반적 원칙을 명시적으로 규정하지 않은 채 평가에 필요한 사항들을 나열하는데 그치고 있다는 점에서 미국이나 프랑스 등과 차이가 있다. 반면에 영국은 평가자와 평가책임기관, 평가참여자 등이 준수해야 할 지침을 구분해서 제공한다는 점에 장점이 있다.

    넷째, 각국이 채택하고 있는 평가윤리의 원칙과 평가표준은 개인적 차원과 직업적 차원 및 공동체 차원을 포괄하고 있음을 알 수 있다. 미국과 캐나다 등이 채택하고 있는 체계적 탐색이나 역량 및 실행가능성 등의 원칙은 개인적 차원에 해당된다고 볼 수 있고, 성실성/정직성, 독립성, 책임성 및 유용성 등은 이해관계자 등과의 관계에 관한 것으로 직업적 차원으로 분류될 수 있다. 또한 인간존중이나 공익에 대한 책임성 등은 공동체 차원의 윤리원칙이라고 할 수 있다.12) 이런 점들은 평가윤리 원칙과 평가표준이 평가분야의 직업윤리로 기능하고 있으며, 이는 평가분야가 하나의 전문직업으로 전환되고 있음을 시사하는 것으로 이해될 수 있다.

    끝으로, 평가윤리의 정립을 위한 각국의 노력은 각국의 문화적 차이를 반영하고 있으며, 수렴과 발산의 과정을 거치면서 지속적으로 진행되는 과정에 있다는 점이다. 미국과 캐나다 및 호주의 평가협회는 자체적인 평가윤리원칙을 채택하고 있을 뿐 아니라, 이와 함께 교육평가표준합동위원회(JCSEE)가 개발한「프로그램 평가표준」을 적용하고 있다. 이는 JCSEE의 평가표준이 가장 먼저 개발되었을 뿐 아니라, 평가를 위한 체계적 틀을 잘 갖추고 있어 각국의 평가협회에서 인정받고 있음을 보여준다. 그러나 영국과 프랑스는 JCSEE의 평가표준을 명시적으로 채택하지 않고 있는데, 이 점은 미국을 비롯한 북미국가와 유럽국가의 차이를 반영한 것으로 보인다. JCSEE의 평가표준을 채택한 국가들도 평가윤리에 관한 별도의 원칙을 채택하고 있는데, 이는 각국의 고유한 문화적 특성과 가치를 반영하기 위한 노력으로 이해된다. 이를 위해 선진 각국들은 평가윤리의 원칙과 표준들을 지속적으로 개정하고 있는데, 이는 선진 각국의 평가윤리 정립 노력이 여전히 진행중인 과정에 있음을 시사한다.

       2. 한계

    평가과정에 윤리문제가 존재하고 있음에도 불구하고 평가자를 비롯한 이해관계자들의 윤리의식이 미흡하다는 사실은 평가윤리의 원칙과 평가표준의 당위성을 지지하는 근거가 된다. 그러나 앞에서 살펴본 각국의 평가윤리 원칙과 평가표준 들은 몇 가지 한계를 내포하고 있는데, 이를 부연하면 다음과 같다.

    첫째, 적용상의 한계이다. 평가윤리에 관한 원칙과 표준이라는 것들은 본질적으로 일반적이고 추상적이다. 따라서 이들은 문제해결을 위한 원칙을 제공할 수 있지만, 평가자가 당면하는 복잡하고 미묘한 구체적인 상황에서 완전히 적용할 수 있는 것은 아니다. 가령, 특정한 상황에서 평가윤리의 원칙이나 표준들을 적응시킬 때, 어떤 원칙이나 표준을 적용해야 할 것인지 명확하지 않을 수 있다. 또 두 가지 이상의 원칙이나 표준에 해당될 때에는 어떤 원칙이나 표준을 우선적으로 적용해야 하는지가 모호한 상황이 발생할 수도 있다.「평가자를 위한 지도원칙」이나「평가표준」등은 일반적인 원칙에 불과할 뿐 아니라, 우선순위가 존재하지도 않기 때문에 구체적인 상황에 적용하는데 한계가 존재할 수밖에 없다.

    둘째, 적용의 일관성 문제이다. 평가윤리원칙과 평가표준들이 평가자에 따라서 상이하게 적용될 수 있다는 것이다. 예컨대, 평가자들이 인간존중이나 공익에 대한 책임성과 같은 평가원칙을 일관성 있게 적용할 것으로 기대하는 것은 불가능하다. 또 동일한 상황에 부합하는 평가윤리원칙과 표준이 무엇인지에 대한 평가자들의 합의를 도출하는 것도 매우 어렵다. 왜냐하면 평가윤리원칙과 평가표준에 관한 합의된 기준이 없어 구체적인 상황에서 평가자는 자기의 지식과 경험 및 가치에 의존할 수밖에 없기 때문이다(AEA, 2004). 이런 경우, 평가윤리의 원칙이나 평가표준을 적용함에 있어서 일관성을 확보하기 어려운 문제가 발생한다.

    셋째, 윤리적 행위와 비윤리적 행위의 모호성에 관한 문제이다. 평가윤리원칙과 표준만으로는 윤리적 행위와 비윤리적 행위를 구분하기가 어렵다는 것이다. 가령, 평가윤리의 원칙과 표준만 준수하면 평가윤리가 준수되는가? 이와 반대로 평가윤리원칙과 표준에 위반되는 것은 모두 비윤리적 행위에 해당되는가에 관한 의문이 제기된다. 평가윤리원칙과 평가표준이 평가와 관련된 윤리문제를 모두 포괄하는 것은 아니다. 또 평가윤리원칙과 평가표준에는 순수하게 윤리적인 내용과 방법론적인 내용이 혼재되어 있어 기술적 결함이 있는 평가는 모두 비윤리적이라고 말하기도 어려운 것이다.13)

    넷째, 실효성 확보에 관한 문제이다. 이는 평가자들이 평가윤리원칙이나 평가표준을 준수한다는 것을 보장할 수 없다는 것이다. 이런 문제점은 평가윤리원칙이나 평가표준에도 불구하고 평가자들이 자기의 개인적인 경험이나 가치를 더욱 우선시할 경우에 발생하게 된다. 이는 평가윤리원칙이나 평가표준 만으로는 평가윤리를 확보할 수 없으며, 평가윤리를 확보하기 위한 추가적인 노력이 필요하다는 점을 의미한다.

    11)Kitchener(1984)는 인적 서비스를 수행하는 전문직의 윤리원칙으로 자율성 존중(respect for autonomy), 비유해성(nonmaleficence), 수혜성(beneficence), 정의(justice), 성실성(fidelity) 등을 제시하는데, 이러한 원칙들은 평가분야에도 적용될 수 있다.  12)이러한 구분이 항상 명확한 것은 아니다. 가령, JCSEE 평가표준의 적합성 기준에는 공식적 합의(formal agreement)와 인권존중(human right and respect)에 관한 내용이 동시에 포함되어 있어 직업적 차원과 공동체 차원으로 명확하게 구분하기 어렵다. 이러한 문제는 각국이 설정한 평가윤리의 원칙과 표준이 포괄적이어서 세부적인 내용이 중첩되기 때문으로 보인다. 더욱 근본적으로 각각의 차원들이 상호 연계되어 있어 경계를 명확하게 구분하기 어렵기 때문이라고 생각된다.  13)이와 관련해서 Smith(2002)는 무능력과 무경험 및 비윤리적 행위를 구별할 것을 제안하는데, 무능(incompetence)은 바람직한 평가가 무엇인지(what)를 모르는 것이고, 무경험(inexperience)은 바람직한 평가가 무엇인지 알고 있지만 그 달성방법(how)을 모르는 것이며, 비윤리적 행위(unethical)는 바람직한 평가와 그 달성방법을 알면서도 그것을 준수하지 않는 것이라고 한다.

    Ⅴ. 결론 및 시사점

    우리나라의 경우, 정부업무 및 각종 정책에 대한 평가가 일상적으로 이루어지고 있음에도 불구하고 평가윤리에 관한 민감성은 높지 않은 것으로 보인다. 본 연구는 한국적 상황에서 평가윤리의 제고를 위한 시사점을 제시해주는데, 이를 정리하면 다음과 같다.

    먼저, 평가윤리에 대한 인식을 제고하기 위하여 평가윤리원칙이나 평가표준을 제도화할 필요가 있다. 미국을 비롯한 선진국들이 평가윤리에 관한 원칙이나 표준을 도입하게 된 배경은 평가의 품질이나 유용성이 낮다는 인식에서 출발한다. 특히, 평가자를 비롯한 평가참여자들이 ‘평가윤리’를 평가품질과 평가의 유용성을 제고하기 위한 핵심적인 요인으로 인식하고 있다는 점에 주목할 필요가 있다.

    우리나라의 경우, 성과평가가 범정부적으로 확산됨에 따라서 정부업무의 평가과정에 민간컨설팅 조직이나 외부전문가들의 참여가 폭넓게 확대되어 왔다. 그러나 외부평가자의 참여가 확대된 만큼 평가윤리가 확보되어 있는지에 대해서는 의문이 있다(송희준, 2006). 가령, 평가자의 전공분야와 평가분야가 일치하지 않거나, 평가자료를 이해하는데 충분한 시간과 노력을 기울이지 않는 경우가 발생할 수 있다. 또 피평가자와의 의사소통을 소홀히 하거나, 자료분석 및 해석에 있어서 합리적인 근거를 제시하지 않은 채 평가자의 개인적인 의견을 지나치게 강조할 수도 있다. 나아가 평가자가 부적절한 영향력을 행사하거나, 다른 사람의 역할과 이익을 침해하거나, 고객이 아니라 평가자 개인의 이익을 추구할 가능성을 배제하기 어렵다.

    이런 점을 감안하여「정부업무평가기본법」제7조에는 정부업무평가의 원칙으로 평가의 자율성과 독립성, 평가방법의 객관성과 전문성, 평가결과의 신뢰성과 공정성, 평가에의 참여보장, 평가결과의 공개성과 투명성 등을 규정하고 있고, 동법 제25조에서는 평가제도의 운영실태에 대한 확인·점검을 통하여 필요한 조치를 취할 수 있도록 명시하고 있다. 그러나 실제로 평가품질이나 평가의 유용성을 점검하려는 노력은 미흡하며, 평가윤리의 실태를 확인하려는 노력은 더욱 발견하기 어렵다. 학문적으로도 일부 학자들이 ‘평가를 위한 평가’, 혹은 ‘성과급 지급을 위한 평가’에 불과하다는 비판을 제기한 경우가 있지만(배용수, 2006), 단편적으로 언급하는데 그치고 있다. 최근 들어 메타평가에 관한 연구들(신열·박충훈, 2009; 김인자·전진석, 2009; 라휘문·최덕묵, 2010; 윤상오, 2011)이 평가품질 등에 관심을 가지는 것은 긍정적이지만, ‘사후적’ 성격으로 인해서 평가윤리를 제고하는데 근본적인 한계가 있다.

    요컨대, 정부와 공공기관은 물론 각종 정부정책과 사업 등에 대한 평가가 일상화되어 있지만, 평가윤리에 대한 인식과 개선노력은 매우 미흡한 것이다. 이런 문제점을 개선하기 위해서는 평가윤리에 관한 학문적 및 실무적 논의를 활성화하고, 한국적 상황에 맞는 평가윤리의 원칙을 정립할 필요가 있다. 또 평가윤리에 관한 실태조사를 통하여 평가과정에서 발생하는 윤리문제를 지속적으로 발굴하고, 이를 평가참여자와 이해관계자들에게 학습시킴으로써 평가윤리에 대한 민감성(sensitivity)을 제고시킬 필요가 있다.14)

    둘째, 평가윤리원칙이나 평가표준의 실효성 제고방안을 마련할 필요가 있다. 앞에서의 사례분석 결과를 보면, 선진국의 평가윤리 원칙이나 평가표준들은 몇 가지 한계를 가지고 있으며, 이 가운데 가장 핵심적인 것은 평가윤리원칙의 실효성에 관한 것이다. 이는 평가자들로 하여금 평가윤리의 원칙이나 평가표준을 어떻게 준수시킬 것인가 하는 점이다.

    이에 관해서는 의사나 변호사와 같은 전문직 단체들을 참조할 필요가 있다. 전문직 단체들은 전문지식이나 기술과 함께 전문가의 윤리의식을 핵심적인 요소로 간주한다(Cheetham & Chievers, 1996). 전문가의 본래적 역할과 기능에서 벗어나지 않고 고객에 대한 의무와 책임을 다하기 위해서 직업윤리(professional ethics)를 발전시켜 온 것이다. 이를 위해 전문직 단체들은 윤리강령에 관한 가치나 원칙, 윤리강령이나 윤리지침, 회원의 자격요건으로서 윤리교육 및 훈련, 지속적인 재교육과정, 윤리자문역(ethics counsellor)의 확보, 소식지 등을 통한 윤리정보의 배포, 공개장치(disclosure mechanism), 강제장치(enforcement mechanism) 등을 활용하고 있다(TBCS, 2006 : 22).

    이와 같은 전문직 단체의 윤리정책은 평가분야에도 적용될 수 있다. 의사나 변호사와 같은 전문직 종사자들의 특징은 전문지식을 바탕으로 독립적으로 업무를 수행한다는 점에 있으며, 이는 평가자들도 마찬가지이다. 전문직 종사자들이 직무수행과정에서 갈등에 당면하는 것처럼 평가자들도 평가과정에서 법과 정책, 과거의 평가관행, 개인적 신념 등에 의해서 영향을 받는다. 특히, 평가수요가 주로 정부와 공공부문에서 발생하는 상황에서 정치적 및 관료적 압력으로부터 평가자 자신을 보호하고, 평가자로서 공공에 대한 책임과 의무를 확보하기 위해서는 평가윤리에 대한 인식을 제고할 필요가 있다.

    주목해야 할 점은 전문직 단체들의 경우, 윤리강령이나 윤리지침 등은 윤리정책(ethical program)의 일부에 불과하다는 것이다. 이는「정부업무평가기본법」에서와 같이 평가원칙을 제시하는 것만으로는 충분하지 않다는 것을 의미한다. 공공기관 경영평가를 주관하는 기획재정부와 같이 평가자의 윤리에 관한 사항을 운영하는 경우도 있다. 그러나 이는 평가참여자의 합의가 아니라, 정부의 필요에 따른 윤리요건(ethical requirement)에 불과하다는 점에서 실효성에 의문이 있다. 평가윤리의 실효성을 제고하기 위해서는 평가윤리강령이나 지침 등을 명확하게 설정해야 할 뿐 아니라, 평가윤리에 관한 교육과 훈련, 평가윤리와 관련된 정보의 제공, 사후검증을 위한 메타평가의 제도화, 윤리위반 사례에 대한 공개장치, 윤리원칙을 준수하지 않을 경우의 강제조치 등을 마련할 필요가 있다.

    끝으로, 관료적 및 정치적 개입으로부터 평가의 독립성을 확보하기 위한 방안을 마련하는 것이 긴요하다. 우리나라의 경우 평가를 수행하는 평가자는 주로 대학교수나 회계사 등이지만, 이들을 선발 및 조직화하는 실무조직은 정부부처의 공무원이거나 정부의 지도감독을 받는 준정부기관이다. 이들은 평가업무를 하나의 직업적 영역으로 인식하지 않을 뿐 아니라, 평가윤리에 관한 인식도 높지 않다. 심지어 평가를 엄정하게 관리해야 할 정부와 준정부기관이 스스로 평가윤리를 훼손하는 경우도 발견된다. 이런 문제는 주로 평가결과에 영향을 미치기 위해서 평가자에게 암시를 주거나 압력을 행사하는 방식으로 이루어질 수 있다.15) 가령, 정치적 임용이 관행화된 실정에서 정부와 자치단체장은 산하기관의 장을 임명하거나 해임하기 위한 목적으로 평가결과에 영향을 미치려고 할 수 있다. 또 대통령이나 자치단체장의 공약사업이라는 이유로 우호적으로 평가하도록 압력을 행사할 수도 있다. 나아가 평가결과를 교묘하게 변경시켜서 발표하거나, 아예 평가결과를 공표하지 않은 채 은폐할 수도 있다. 특히, 우리나라의 경우에 대부분의 평가수요가 정부 및 공공부문에서 발생되고, 평가와 관련된 의사결정은 정부의 주도아래 이루어지는 경향이 있다. 이런 점들은 관료적 및 정치적 개입을 방지하여 평가의 독립성을 확보하는 것이 매우 중요한 과제임을 시사한다.

    이런 점에서 평가의 전문직업화(professionalization)를 통하여 민간의 역할을 강화하는 방안을 적극 검토할 필요가 있다.16) 외국의 사례를 보면, 평가협회를 구성하여 이를 중심으로 직업윤리의 일환으로 평가윤리를 정립해 나가고 있다.17) 가령, 미국과 영국 및 캐나다와 호주 등의 평가협회는 모두 윤리강령이나 윤리지침을 명시하고 있으며, 윤리정보에 관한 소식지와 저널을 발간하여 배포하는 것으로 조사되었다. 그러나 캐나다평가협회는 윤리교육과 훈련을 실시하고 있으며, 미국과 호주의 평가협회는 웹이나 전화 등을 통해 윤리자문을 실시하기도 한다(TBCS, 2006). 이들은 의사협회나 변호사협회와 같은 전문직업적 단체를 지향하며, 평가윤리원칙이나 평가표준을 포함한 평가윤리정책은 평가의 전문직업화를 추구하는 직업윤리의 차원으로 간주하고 있는 것이다.

    외국의 평가협회들이 전문직업화의 일환으로 평가윤리를 정립하고자 노력하는 근본적인 배경은 평가업무를 수행하는 상설조직과 평가업무에 종사하는 사람들이 증가한 데 있다. 우리나라의 경우,「정부업무평가기본법」을 비롯한 각종 법령을 통해서 평가의 제도화가 되어 있을 뿐 아니라, 감사연구원과 조세연구원(공공기관정책연구센터) 및 지방공기업평가원 등과 같이 평가를 전문적으로 연구하거나 수행하는 상설조직들이 증가하고 있다.18) 이러한 조직들은 평가업무를 주요기능으로 설정하고 있을 뿐 아니라, 여기서 근무하는 사람들은 평가연구와 평가실무에 종사하고 있다. 또 정부와 공공기관을 비롯한 피평가기관들도 평가업무를 전담하는 부서를 설치하거나 인력을 배치하고 있는데, 이는 평가업무가 상시업무로 전환되고 있음을 보여주는 것이다. 이런 점들은 우리나라도 평가의 전문직업화를 추구할 만한 여건이 성숙되고 있음을 보여주는 증거가 될 수 있다. 따라서 평가에 관심을 가진 교수와 연구자, 그리고 평가관련 조직의 종사자 등을 중심으로 외국의 평가협회와 같은 전문직 단체를 구성하는 방안을 검토할 필요가 있다.19)

    일반적으로 전문가(professional)는 과학 또는 고도의 지식을 바탕으로 개개 의뢰인의 구체적인 요구에 응하여 업무활동을 행함으로써 사회 전체의 이익에 기여하는 직업으로 정의된다. 윤리적 측면에서 이들은 일반적인 성실의무 이상의 직업윤리 원칙에 구속되며, 때로는 공공성을 의뢰인의 이익보다 우선하는 공공적 책임이 요구된다(김두형, 2008). 따라서 평가의 전문직업화를 위해서는 무엇보다도 평가와 관련된 윤리의식과 직업적 책임의식이 수반되어야 한다. 이것은 상설조직에서 평가업무를 전담하는 사람들뿐만 아니라, 교수와 연구자 등 평가참여자뿐 아니라 평가와 관련된 모든 이해관계자들에게 요구되는 것이다. 평가품질을 제고하기 위해서는 평가결과에 대한 수용성과 평가결과를 적극적으로 활용하려는 노력이 긴요한데, 평가윤리나 평가에 대한 책임성이 확보되지 않는다면 평가의 유효성이 약화될 것이기 때문이다. 따라서 평가가 확산될수록, 그리고 평가의 제도화와 유효성 제고를 위해서는 평가자의 책임의식이나 윤리의식이 요청되며, 이를 위해서는 궁극적으로 평가의 전문직업화를 위한 노력이 긴요하다고 하겠다.

    14)Welfel & Kitchener(1992 : 179)는 ‘어떤 상황에 대한 도덕적 차원의 인식 능력’을 도덕적 민감성(moral sensitivity)으로 설명하는데, 평가윤리의 민감성은 이를 원용한 것이다. Newman & Brown(1996 : 89)은 평가윤리에 관한 실태조사에서 “평가와 윤리가 무슨 관계가 있는가?”라고 응답하는 사람들을 일관되게 발견하였다고 보고하였는데, 이는 평가윤리의 민감성이 높지 않다는 점을 보여준다.  15)MacKay & O’Neill(1992)에 따르면, 이런 상황은 혼합적 딜레마로 분류될 수 있다. 혼합적 딜레마(mixed dilemma)는 외부적 요인 때문에 윤리원칙을 준수하기 어려운 상황을 지칭하는 것으로, 둘 이상의 윤리원칙 사이에 갈등이 존재하는 순수한 윤리적 딜레마(ethical dilemma)와 구분된다. 윤리적 딜레마 상황에서는 평가자가 상호 갈등적인 윤리원칙 사이에서 무엇(what)을 해야 할지가 명확하지 않다. 이와 달리 혼합적 딜레마 상황은 평가자가 윤리적으로 무엇이 옳은지를 분명하게 알 수 있지만, 개인적인 손해 때문에 어떻게(how) 해야 할지가 문제가 된다는 점에서 다르다.  16)이는 평가윤리원칙이나 평가표준을 포함한 평가윤리정책을 누가, 그리고 어떻게 조직화할 것인가에 관한 것으로, 평가윤리의 실효성 확보와 직접적으로 관련된 문제이기도 하다.  17)국가마다 평가윤리정책의 세부내용에 차이가 있고, 전문직 단체의 평가윤리정책을 부분적으로 채택하고 있으며, 공개장치를 운영하는 평가협회는 한 나라도 없는 것으로 나타났다(TBCS, 2006). 이런 점들은 외국의 평가협회들이 평가윤리를 평가분야의 직업윤리로 정착시켜 나가는 과정에 있기 때문으로 생각된다.  18)이외에도 평가업무에 종사하는 상설기구가 더 존재할 수 있다. 가령, 한국산업기술진흥원은「산업기술단지 지원에 관한 특례법」과「지역산업지원사업 공통운영요령」을 근거로 지역테크노파크에 대한 경영평가를 전담하고 있다.  19)외국 평가협회와 유사한 조직으로 정책분석평가학회와 정책분석평가사협회 등을 생각할 수 있다. 그러나 외국의 평가협회가 전문직업적 단체의 성격을 띠는데 비해서 정책분석평가학회는 학술단체에 해당된다는 점에서 다르다. 또 정책분석평가사협회 등은 관련 종사자들의 참여도가 낮아 평가공동체의 대표성을 인정하기 어렵고, 전문직업적 단체로서의 공적책임성과 역할을 기대할 수 없다는 점에서 한계가 있다.

  • 1. 김 규일 (1995) 정책분석가의 윤리문제. [「한국정책학회보」] Vol.4 P.161-184 google
  • 2. 김 기홍 (1999) 「한국인의 직업윤리에 관한 연구」. google
  • 3. 김 두형 (2008) 전문자격사의 업무상 특성과 직업윤리. [「계간 세무사」] P.16-25 google
  • 4. 문 태현 (1995) 정책윤리의 논거 : 공리주의, 의무론, 의사소통적 접근. [「한국정책학회보」] Vol.4 P.87-110 google
  • 5. 송 희준 (2006) 정책평가윤리에 대한 통합적 접근방법. [「행정논총」] Vol.44 P.405-427 google
  • 6. 이 영균 (2002) 행정윤리의 본질과 관점. [「한국정책과학학회보」] Vol.6 P.113-137 google
  • 7. 홍 준현 (2004) 정책분석가의 윤리인식 및 실태에 관한 연구. [「한국정책과학학회보」] Vol.8 P.150-160 google
  • 8. (2004) Guiding Principles for Evaluators. google
  • 9. (2010) Guidelines for Ethical Conduct of Evaluations. google
  • 10. Berends. . L. (2007) Ethical Decision-making in Evaluation. [Evaluation Journal of Australasia] Vol.7 P.40-45 google
  • 11. Guidelines for Ethical Conduct. google
  • 12. Cheetham G., Chievers G. (1996) Towards a holistic model of professional competence. [Journal of European Industrial Training] Vol.20 P.20-30 google doi
  • 13. Russ-Eft Darlene, Preskill Hallie (2009) Evaluation in Organizations - A Systematic Approach to Enhancing Learning, Performance, and Change. google
  • 14. Charter of Evaluation Guiding Principles for Public Policies and Programmes. google
  • 15. Guba E. G., Lincoln Y. S. (1987) The Countenances of Fourth-Generation Evaluation : Description, Judgement and Negotiation. in The Politics of Program Evaluation, ed. by D. J. Palumbo. P.202-234 google
  • 16. Gussman T. K. (2005) Improving the Professionalism of Evaluation. google
  • 17. Keith Gwen (2003) The Canadian Evaluation Society(CES) Experience in Developing Standards for Evaluation & Ethical Issues. [Paper presented in The 5th European Conference on the Evaluation of Structural Funds in Budapest, Hungary. Workshop 6 : Developing STANDARDS for Evaluation & Ethical Issues] google
  • 18. Houle Cyril (1980) Continuing Learning in the Professions. google
  • 19. (1994) The Program Evaluation Standards. google
  • 20. The Program Evaluation Standards. google
  • 21. Kitchener K. S. (1984) Intuition, Critical Evaluation and Ethical Principles : The Foundation for Ethical Decisions in Counselling Psychology. [The Counselling Psychologist] Vol.12 P.43-55 google doi
  • 22. MacKay E., O’Neill P. (1992) What Create the Dilemma in Ethical Dilemmas? : Examples from Psychological Practice. [Ethics and Behavior] Vol.2 P.227-244 google doi
  • 23. Morris Michael (2008) Evaluation Ethics for Best Practices - Cases and Commentaries. google
  • 24. Morris M., Cohn R. (1993) Program Evaluators and Ethical Challenges : A National Survey. [Evaluation Review] Vol.17 P.621-642 google doi
  • 25. Newman D. L., Brown R. D. (1996) Applied Ethics for Program Evaluation. google
  • 26. Simons. Helen (2011) Standards & Ethics in Evaluation. google
  • 27. Smith. N. L. (2002) An Analysis of Ethical Challenges in Evaluation. [American Journal of Evaluation.] Vol.23 P.199-206 google
  • 28. Stiffman A. R., Brown E., Striley C. W., Ostmann E., Chowa G. (2005) Cultural and Ethical Issues concerning Research on American Indian Youth. [Ethics and Behavior] Vol.15 P.1-14 google doi
  • 29. Stufflebeam D. M. (2003) Professional Standards and Principles for Evaluation. in T. Kellaghan & D. L. Stufflebeam (eds.). International Handbook of Educational Evaluation : Part One. Perspective P.279-302 google
  • 30. (2006) Professional Ethics and Standards for the Evaluation Community in the Government of Canada. google
  • 31. Turner D. (2003) Evaluation Ethics and Quality : Results of a Survey of Australasian Evaluation Society Members. google
  • 32. Guidelines for Evaluators. google
  • 33. Weiss C. H. (1987) Where Politics and Evaluation Research Meet, in The Politics of Program Evaluation, ed. by D. J. Palumbo. google
  • 34. Welfel E. R., Kitchener K. S. (1992) Introduction to the Special Section : Ethics Education - an Agenda for the 90's. [Professional Psychology : Research and Practice] Vol.23 P.179-181 google doi
  • 35. Welfel E. R. (2006) Ethics in counseling and psychotherapy: Standards, Research, and Emerging Issues google
  • [<표 1>] 미국평가협회(AEA)의 평가자를 위한 지도원칙
    미국평가협회(AEA)의 평가자를 위한 지도원칙
  • [<표 2>] 교육평가표준합동위원회(JCSEE)의 프로그램 평가표준
    교육평가표준합동위원회(JCSEE)의 프로그램 평가표준
  • [<표 3>] 캐나다평가협회(CES)의 윤리적 행동을 위한 지침
    캐나다평가협회(CES)의 윤리적 행동을 위한 지침
  • [<표 4>] 영국평가협회(UKES)의 평가자를 위한 지침(guidelines for evaluators)
    영국평가협회(UKES)의 평가자를 위한 지침(guidelines for evaluators)
  • [<표 5>] 프랑스평가협회(SFE)의 평가지도원칙
    프랑스평가협회(SFE)의 평가지도원칙
  • [<표 6>] 호주평가협회(AES)의 윤리적 평가를 위한 지침
    호주평가협회(AES)의 윤리적 평가를 위한 지침
  • [<표 7>] 평가윤리원칙 및 평가표준의 차원별 구분
    평가윤리원칙 및 평가표준의 차원별 구분
  • [<표 8>] 외국 평가윤리 및 평가표준의 주요 내용 비교
    외국 평가윤리 및 평가표준의 주요 내용 비교