The purposes of this study were to examine the reliability and validity of the Korean version of Social Communication Questionnaire (K-SCQ) and to determine cut-off scores for diagnosis of autism spectrum disorder (ASD).
A total of 166 subjects with ASD and their 186 unaffected siblings were recruited through child psychiatry clinics of university hospitals. Board certified child psychiatrists screened all probands suspected to have ASD based on the Diagnostic and Statistical Manual of Mental Disorders, fourth edition. To confirm the diagnoses, the Korean versions of the Autism Diagnostic Observation Schedule and the Autism Diagnostic Interview-Revised (K-ADI-R) were administered to all the subjects. All parents completed the K-SCQ and Social Responsiveness Scale (SRS). The non-ASD siblings were evaluated with the same instruments as the probands with ASD. We performed a factor analysis to examine the structure of K-SCQ. For testing the validity of K-SCQ, we compared the difference in Lifetime and Current scores of probands with ASD and their non-ASD siblings using t-test and analysis of covariance. Correlations between the K-SCQ and other measurements of ASD symptomatology, including K-ADI-R totals and domain scores and SRS, were examined. Receiver operation characteristic curve analysis was performed to extract cutoff scores discriminating affection status.
Four factors were extracted through factor analysis of K-SCQ ; 1) social relation and play, 2) stereotyped behavior, 3) social behavior, and 4) abnormal language. Cronbach’s internal consistency was .95 in K-SCQ Lifetime, and .93 in K-SCQ Current. There were significant differences in total score of K-SCQ, both in Lifetime and Current between the ASD group and non-ASD siblings group (p<.05). K-SCQ scores were significantly correlated with K-ADI-R subdomain scores and SRS total scores (p<.05). The best-estimate cut-off scores of K-SCQ for diagnosis of ASD were 12 for 48 months and over, and 10 for below 47 months.
Our findings suggest that the K-SCQ is a reliable and valid instrument for screening autistic symptoms in the Korean population. Lower cut-off scores than the original English version might be considered when using it as a screening instrument of ASD.
자폐스펙트럼 장애(Autism Spectrum Disorders, ASD)는 사회적 의사소통 및 상호작용의 지속적 손상이 특징적인 장애로, 장애로 인한 일상생활 기능의 저해가 심각하여 본인의 부적응뿐만 아니라, 가족 및 주변인들의 심리적 고통까지 야기하는 장애 중 하나이다. ASD는 Diagnostic and Statistical Manual of Mental Disorders, 4th edition(DSM-IV)1)에서 전반적 발달장애(Pervasive Developmental Disorder) 범주하에 자폐장애(Autism), 아스퍼거 장애(Asperger’s Disorder), 소아기 붕괴성 장애(Childhood Disintegrative Disorder), 레트 장애(Rett’s Disorder), 달리 구분되지 않는 광범위 발달장애(Pervasive Developmental Disorder Not Otherwise Specified, PDD NOS)로 구분되어 있다가, 최근 개정된 DSM, 5th edition(DSM-5)2)에 이르러, 이 장애들을 하나의 동일 스펙트럼상의 장애로 여기고 ASD로 진단하여 세부사항으로 구체화 하고 있다. ASD의 빈도는 지난 30여 년에 걸쳐 점차 증가하는 추세를 보이고 있으며, 우리나라에서도 자폐 장애인 등록수가 2010년 14,888명이었던 것이 2014년 19,524명으로 대폭 증가하였다.3) ASD는 아동기 초기부터 그 증상이 관찰되기 시작하며 조기개입 여부에 따라 이후 발달 양상에 현저한 차이를 보이는 것으로 알려져 있는 바,4) 조기진단과 개입의 중요성이 매우 강조되며, 이에 따라 자폐 스펙트럼 장애의 초기 선별을 위한 도구의 필요성 또한 함께 대두되고 있다.
ASD 진단을 위해서는 전문가의 면밀한 관찰과 인터뷰가 요구되는데, 현재 국내외에서 활용되고 있는 진단도구로는 자폐증 진단 관찰 스케줄(Autism Diagnostic Observation Schedule, ADOS)5)과 자폐증 진단 면담(Autistic Diagnostic Interview-Revised, ADI-R)6)이 대표적이다. ADOS와 ADI-R의 진단적 활용도는 국내외에서 많은 전문가들에 의해 이미 지지되었지만 일부 한계점들이 지적되고 있다. 즉, 평가 과정에 상당히 긴 시간이 소요될 뿐만 아니라 실시과정이 까다로워 전문적으로 훈련 받은 전문가만이 평가에 임할 수 있고, 국내의 경우 이러한 전문가를 양성하기 위한 훈련체계 마저 잘 마련되어 있지 않아 더욱 어려움이 따르고 있다. 물론, 보다 간편한 형식의 진단도구들도 존재한다. 대표적으로 Childhood Autism Rating Scale7,8)은 시간적 소모가 크지 않고 실시에도 큰 어려움이 없는 진단도구로서 임상 현장에서 가장 많이 사용되고 있지만 사실상 아스퍼거 장애와 같은 기능이 양호한 ASD를 진단하는 데 역부족이라는 견해가 크다.9) 결과적으로 현재 ASD의 신속하고 정확한 조기진단을 위한 체제 마련이 시급하며, 이를 위해서는 ASD 조기진단을 위한 선별도구의 마련이 첫걸음이 될 것이다.
사회적 의사소통 질문지(Social Communication Questionnaire, SCQ, 이전의 Autism Screening Questionnaire)10)는 다른 도구들보다 ASD의 선별에 뛰어난 척도로 알려져 있으며,11,12) 최근까지 국외에서 다양한 연령층과 집단을 대상으로 그 심리 측정적 속성에 대한 연구가 활발히 진행되어 왔다.13-16) SCQ는 ASD의 증상을 더욱 심도 있게 평가하는 도구인 ADI-R을 기반으로, 정상적인 발달에서 일탈적인 특성을 보이는 주요 문항을 선택하여 만들어진 1차 선별 척도이다. SCQ는 전반적인 문항이 모든 부모가 이해하기 쉽게 제시되어 있어서 전문가의 도움 없이 부모 보고를 통해 ASD 증상을 평정할 수 있으며, 전체 문항에 응답하는 데 10분 이내의 시간이 소요되어 부모와의 면담 시간에 약 90분 이상 소요되는 ADI-R 대비 상당한 시간과 비용이 절감된다. 또한 원 저자에 의해 검토된 SCQ의 요인구조는 4요인으로, 사회적 상호관계 요인, 의사소통 요인, 비정상적 언어 요인, 상동적 행동 요인이 확인되었으며, 전체 영역에 대한 신뢰계수는 Cronbach’s α=.90으로, 타당하고 신뢰도가 높은 검사로 검증되었다. 특히, ADI-R의 알고리듬 분류에 따른 자폐증 증상의 세 가지 주요 영역 중 어느 것에 해당하는지 비교해 봤을 때, 요인 1은 주고받는 상호작용 영역과 대부분 일치하고, 요인 4는 대부분 제한적이고 반복적이며 상동화된 행동 패턴 영역과 일치하며, 요인 2와 3은 의사소통 영역에 해당하는 바, SCQ의 각 요인들이 세 가지 주요 자폐 증상을 잘 반영하는 것으로 나타났다. 무엇보다 SCQ가 진단적 도구로 개발된 것이 아님에도 불구하고 진단 도구인 ADI-R과 견줄만한 선별 기능이 확인되었다는 점에서17) 1차 선별도구로서 SCQ의 활용도는 매우 높다고 할 수 있다.
이러한 SCQ의 유용성에 따라 국내에서도 SCQ를 번역하여 시판하였으며,18) 현장에서도 ASD의 선별도구로 활발히 사용되고 있다.19) 그러나 국내에서는 아직까지 SCQ의 타당도 검증이 이루어지지 않은 상태이며, ASD와 non-ASD 구분을 위해 국내 실정에 적합한 분할점(cut-off score)도 마련되어 있지 않다. 사실상 국외에서도 15점이라는 분할점이 발표된 이래 ASD 선별을 위한 최적의 분할점과 관련하여 여전히 논란이 있는 바,13,20,21) 국내에서도 하루빨리 적정 수준의 분할점을 산출하고 확인하는 연구가 요구되고 있다. 이에 본 연구에서는 국내에서 SCQ를 적절히 활용하기 위한 타당도를 검증하고, 그와 더불어 ASD 선별을 위한 연령 범주에 따른 최적의 분할점을 산출하여 국내실정에 맞게 SCQ 활용성을 규명하고자 하였다. 이를 위하여 ASD로 진단받은 대상을 임상집단으로, ASD가 없는 것으로 확진된 그의 형제자매들을 대조집단(비자폐 형제자매 집단)으로 구분한 뒤, 이들에게 Korean version of Social Communication Questionnaire(K-SCQ)18) 를 실시하였다. 먼저, 요인분석을 통해 K-SCQ의 하위요인을 분석하여 K-SCQ가 ASD에서 나타나는 세 가지 주요 문제에 대한 개념적 차이를 드러내는지 검토하였다. 그후 전체 문항에 대한 신뢰도와 각 하위요인별 신뢰도를 검증하였고, 집단간 K-SCQ 총점을 비교하여 임상군과 대조군 간의 분류정확성을 평가하고자 하였다. 그리고 자폐 특성을 평가하는 또 다른 척도인 사회 반응성 척도(Social Responsiveness Scale, SRS)22)와 보다 정밀한 자폐진단 면담 평가인 Korean version of Autistic Diagnostic Interview-Revised(KADI-R)23)와의 상관관계를 분석하여 수렴 타당도를 검증하였고, 마지막으로 receiver operation characteristic curve(ROC curve) 분석을 통해서 ASD 집단과 ASD가 아닌 집단을 잘 변별해줄 수 있는 진단 분할점을 산출하여 집단 분류 적중률을 확인하였다. 원판에서는 48개월 이상의 아동들만을 대상으로 진단 분할점을 산출하였으나,10) 본 연구에서는 48개월을 기준으로 24개월부터 47개월 이하의 유아 집단과 48개월 이상의 아동·청소년 집단으로 나누어 ROC curve 분석을 통해 각기 다른 분할점을 산출하였다.
본 연구의 대상은 한국 자폐스펙트럼 장애의 유전 연구 컨소시엄에 참여한 대상군들 중 일부로, 대학병원(수도권 대학 병원 3곳, 각 지역 국립병원 3곳)의 소아정신과 외래에 발달 지연을 주된 문제로 내원한 24개월부터 19세 11개월까지의 ASD 아동, 청소년들과 그들의 형제자매들이다. 모든 대상자는 일차로 보호자에게 연구에 참여할 것을 서면 동의 받아 선별과정에 응하도록 하였다. 본 연구는 병원의 연구윤리위원회(Institutional Review Board)의 승인을 받아 진행되었다.
대상자들은 병원에 방문하기 일주일 전 K-SCQ와 SRS를 우편으로 받아 작성한 뒤 검사 당일 지참하도록 하였다. 일차 선별과정은 소아정신과 전문의에 의해 DSM-IV, Korean version of the Asperger Syndrome Diagnostic Scale 24)을 기반으로 먼저 이루어진 후에, ASD 확진을 위해서 모든 대상에게 Korean versions of the Autism Diagnostic Observation Schedule25)과 K-ADI-R이 실시되었다. 지적 수준을 파악하기 위하여 Korean version of the Leiter International Performance Scale(K-Leiter-R)26)도 함께 실시되었다. 그리고 그들의 형제, 자매로 구성된 비자폐 형제자매 집단에 대해, 6세 이상을 대상으로 공존병리 확인과 감별진단을 위한 Kiddie Schedule for Affective Disorders and Schizophrenia-Present and Lifetime version27)을 실시하였고, 그 결과 기분장애 2명, 주의력결핍 과잉행동장애 2명, 특정공포증 1명, 틱장애 3명, 역치하 강박장애 1명, 역치하 조현병 1명, 주의력결핍 과잉행동장애/역치하 우울장애 중복진단 1명, 주의력결핍 과잉행동장애/역치하 분리불안장애 중복진단 1명, 해리성 정체감 장애/기면증 중복진단 1명이 비자폐 형제자매 집단에 포함되어 있었다. 연구 참여자 중 임상적으로 심각한 신경학적 질환이나 내과적 질환, 또는 염색체 이상 소견이 있는 경우는 자료 분석에서 제외되었다.
ASD 아동은 총 175명이었으나 이 중 K-SCQ의 작성이 제대로 이루어지지 않은 9명을 제외하여 총 166명이 임상집단에 속하였으며, 비자폐 형제자매 집단은 총 208명이 모집되었으나 선별검사 후 자폐로 분류될 가능성이 있는 12명과 K-SCQ의 작성이 제대로 이루어지지 않은 10명을 제외하고 총 186명의 자료가 분석에 사용되었다. 최종적으로 총 352명을 분석대상으로 하였으며 이들의 인구통계학적인 배경은 Table 1과 같다.
[Table 1.] Characteristics of subjects (N=352)
Characteristics of subjects (N=352)
연구 대상의 연령 범위는 25개월부터 19세 11개월까지였으며, 평균연령은 ASD 집단 94.42개월, 비자폐 형제자매 집단 98.81개월이었다(Table 1). 성별은 남자 총 250명, 여자 총 102명이 포함되었는데, 비자폐 형제자매 집단의 남녀 비율 차이가 크지 않은 반면(남성 54.3%, 여성 45.7%), ASD 집단에서는, ASD 유병률에서 남성이 약 4배가량 높듯이 역시 남성의 비율이 훨씬 더 높았다(남성 89.8%, 여성 10.2%). 다만 K-SCQ의 총점을 비교해봤을 때, ASD 집단 내에서 성별에 따른 K-SCQ 점수의 차이가 유의미하지 않았기 때문에(일생 : t=.02, p=.981, 현재 : t=.78, p=.439), 분석에서 성별의 차이는 더 이상 고려하지 않았다. 그러나 지능의 경우, 비자폐 형제자매 집단의 평균이 118.90(17.27)이었던 것에 비해 ASD 집단 평균은 86.33(26.99)으로 낮아 두 집단 간의 지능 차이가 유의미하였다(t=11.88, p<.001). 집단 내 성별에 따른 지능은 비자폐 형제자매 집단은 남자가 116.10(19.02), 여자가 122.28(14.28)로 여자가 유의하게 높았고(t=2.37, p<.05), ASD 집단은 남자가 86.90(27.08), 여자가 80.27(26.48)로 유의한 차이가 없었다(t=.78, p=.438).
K-ADI-R 점수도 집단 간 유의한 차이를 보였는데, 세 알고리듬(사회적 상호작용과 의사소통, 제한적, 반복적, 상동적 행동)의 점수를 합한 총점 평균은 비자폐 형제자매 집단이 3.70, ASD 집단이 39.40으로 ASD 집단이 더 높았고(t=36.19, p<.001), 사회적 상호작용 점수는 비자폐 형제자매 집단 1.90, ASD 집단 22.60(t=44.71, p<.001), 의사소통 점수는 비자폐 형제자매 집단 1.32, ASD 집단 16.71(t=31.45, p<.001), 제한적, 반복적, 상동적 행동 점수는 비자폐 형제자매 집단 0.50, ASD 집단 5.53(t=24.85, p<.001)으로 전반적으로 ASD 집단의 점수가 유의하게 높았다.
SRS 점수도 비자폐 형제자매 집단이 21.32, ASD 집단이 94.47로 ASD 집단이 비자폐 형제자매 집단보다 유의하게 높은 점수를 보였다(t=29.77, p<.001).
1) 한국어판 사회적 의사소통 설문지(Korean version of Social Communication Questionnaire, K-SCQ)
SCQ10,18)는 ADI-R6)을 바탕으로 제작되었으며, 부모나 양육자에게 아동의 ASD와 관련된 증상(의사소통, 상호 사회적 상호작용, 제한적이고 반복적인 행동과 관심)에 대해 질문하는 총 40개의 문항으로 구성된 선별도구이다. 유형은 SCQ 일생(SCQ AutoScoreTM form : Lifetime), SCQ 현재(SCQ AutoScoreTM form : Current) 두 가지의 양식이 있으며, SCQ(일생)은 개인의 전반적인 발달력에 근거하여 답을 하게 되고 SCQ(현재)는 최근 3개월 동안의 개인의 행동을 바탕으로 답을 하게 된다. 각 문항은 ‘예’, ‘아니오’로 응답하게 되어 있으며, 1번 문항은 아동이 2개 이상의 단어를 말하는 능력이 있는지 확인하는 문항으로 점수와는 무관하다. 1번 문항이 ‘예’로 기입될 경우 2-40번의 점수를 합산하게 되고, ‘아니오’로 기입될 경우 8-40번의 점수를 합산하게 된다. Berument 등28)의 연구에서는 합산 점수가 15점 이상일 때 ASD 위험군으로 분류하는 것이 가장 적합하다고 하였으며, 점수가 높을수록 ASD와 관련된 증상이 심각함을 의미한다. 한국어판 SCQ(K-SCQ)의 출판을 위해 한국어로 번역 및 영문 역번역을 시행하였고, 저자가 역번역본을 검토하고, 이후 두 차례의 수정을 거쳐 완성본을 출판하였다.18) 영어판 SCQ에서 전체 영역에 대한 신뢰도는 Cronbach’s α=.90이었다.28)
2) 사회 반응성 척도(Social Responsiveness Scale, SRS)
SRS22)는 부모나 교사에게 지난 6개월 동안 아동이 보인 사회적 상호작용의 특징에 대해 질문하는 설문지로, 총 65문항으로 구성되어 있다. 각 문항은 ‘전혀 그렇지 않다(0점)’에서 ‘거의 항상 그렇다(3점)’로 응답하도록 되어 있으며, 총 0-195점으로 채점될 수 있다. 평가 내용은 사회적 통찰, 사회정보처리, 상호 사회적 의사소통 능력, 사회적 불안/회피, 자폐적 몰입과 특질로 구성되어 있으며, 점수가 높을수록 사회적 기능이 낮음을 의미한다. 국내에서는 Western Psychological Services(WPS)에서 번역한 한국어 판을 사용할 수 있으나 저자들이 아는 한 타당화 연구는 진행된 바 없으며, Constantino등29) 의 연구에서 검사-재검사 신뢰도 계수는 .83이었다. 본 연구에서의 신뢰도 계수는 Cronbach’s α=.98이었다.
3) 한국판 자폐증 진단 면담(Korean version of Autism Diagnostic Interview-Revised, K-ADI-R)
K-ADI-R6,23)은 반구조화된 부모 면담도구로, 정신연령 만 2세 이상의 자녀를 지닌 부모를 대상으로 실시한다. 일반적으로 아동을 직접 관찰하여 평정하는 ADOS와 함께 실시되어 결과 해석에 상호보완적으로 활용된다. 면접지의 내용은 초기발달, 언어/기타 기능의 습득과 상실, 언어와 의사소통 능력, 사회적 발달과 놀이, 흥미와 행동, 일반적 행동들로 이루어져 있으며, 진단적 평가는 DSM-IV와 International Statistical Classification of Diseases and Related Health Problems 10th Revision30)의 진단적 알고리듬에 따라 만들어져서 ASD의 특징적인 세 가지 부적응 행동, 즉 의사소통, 상호 사회적 상호작용, 제한적이고 반복적인 행동과 관심에 대해 평가한다. 각 문항들은 진단적 알고리듬에 따라 부적응 양상이 전혀 없는 경우 0점, 일부 부적응 양상이 있는 경우 1점, 현저한 부적응 양상이 있는 경우 2점으로 변환되어 부호화 한다. 그리고 세 가지 행동 영역의 모든 점수가 분할점을 초과할 경우 자폐증으로 진단을 내리게 된다. 분할점은 의사소통은 8점(의사소통이 어려울 경우 7점), 사회적 상호작용은 10점, 제한적이고 반복적인 행동과 관심은 3점이다.
4) 한국판 라이터 국제 동작 척도(Korean version of Leiter International Performance Scale-Revised, K-Leiter-R)
K-Leiter-R26,31)은 개별적으로 실시되는 표준화된 비언어적 지능측정도구로, 2세 0개월에서 7세 11개월에 해당하는 아동의 인지기능을 평가한다. 평가 내용은 크게 시각화 및 추론(Visualization and Reasoning), 주의력 및 기억력(Attention and Memory)으로 구성되며, 총 19개의 소검사로 구성되어 있다. 19개 소검사의 원점수는 표준화된 환산 점수(M=10, standard deviation=3)로 변환되며, 전체지능지수(full scale IQ)와 함께 유동적 추론, 기본적 시각화, 기억선별, 연합기억, 기억 폭, 주의력, 기억과정, 재인 기억 등의 복합점수가 산출된다. 지능 점수에 대한 기술적인 분류는 다른 지능검사와 마찬가지로 90-109점을 평균으로 10점 단위마다 최우수/영재, 우수, 평균 상, 평균, 평균 하, 경계선, 경도 지체, 중등도 지체, 중증 지체로 구분한다.
연구 대상의 인구통계학적 특성을 검토하기 위하여 빈도와 백분율을 산출하고, 이러한 인구통계학적 특성이 임상집단과 비자폐 형제자매 집단 간에 유의한 차이가 있는지 확인하기 위하여 t-검증을 실시하였다. 그리고 K-SCQ가 자폐증에서 나타나는 세 가지 주요 이상 영역(사회적 상호작용, 의사소통, 상동화된 행동패턴)에 대한 개념적 차이를 드러내는지 검증하기 위해 2-40번까지의 39개 문항에 대한 요인분석을 실시한 뒤(주축분해법, 사각회전), 전체 및 하위요인별 내적 일관성 계수(internal consistency coefficient, Cronbach’s α)를 산출하였다. 임상 집단과 비자폐 형제자매 집단 간의 K-SCQ 총점에 차이가 있는지를 검토하기 위해서 K-SCQ(일생)의 경우 t-검증을 통해, K-SCQ(현재)의 경우 연령에 따라 나타나는 발달적 특성 차이가 클 것을 감안하여 연령을 통제하고자 analysis of covariance(ANCOVA)를 통해 차이 검증을 실시하였다. 더불어 K-SCQ의 총점이 ASD의 특성을 잘 반영하는지를 규명하고자 SRS 총점과의 상관관계 분석을, 그리고 같은 증상에 대해서 부모에 의한 보고(SCQ)와 부모와의 면담을 통한 평가자의 평가(ADI-R)가 일치하는지를 검토하기 위해 K-ADI-R과의 상관관계 분석을 실시하였다. 마지막으로 ASD에 대한 진단 분할점(cut-off score) 산출을 위해서 ROC curve 분석을 시행하였다. ROC 분석에서는 민감도와 특이도의 수준을 근거로 가장 적합한 수준의 집단 분류 점수를 제시해준다. ROC 곡선 아래 면적(area under curve, AUC) 점수가 수행 정도의 지표로, .50이면 gold standard에 대한 검사 도구의 변별력이 전혀 없음을, 1이면 완전함을 의미하는데, .70 이상이면 판별의 정확도 수준이 적합하다고 볼 수 있다.
원판인 SCQ의 지침서에는 평가대상이 만 4.0세 이상부터 가능하다고 제안하고 2세 0개월에서 3세 11개월의 대상에 적용하는 것은 적절한 주의가 필요하다고 하면서 48개월 이상의 아동들만을 대상으로 한 진단 분할점을 제시하였다.10) 그러나, SCQ의 기반이 되는 ADI-R에서는 적용 대상을 만 2세 0개월 이상으로 확장할 것을 제안하고 있다.6) 한편으로, ADI-R의 일부 문항은 발달적으로 4세 이상의 아동에게만 관련이 있어(예 : 상상놀이, 또래와의 상상놀이, 집단 놀이와 관련된 내용 등32)), 4세 미만의 아동들에게는 적용되지 않는 문항들이 있다. 이에 ADI-R 알고리듬은 4세를 기준으로 구분되어 있으며, 4세 미만과 4세 이상의 아동들에게 다른 분할점을 사용하고 있다. ADI-R을 기반으로 제작된 SCQ 역시 4세를 기준으로 다른 분할점을 제시해야 할 필요성이 있으므로, 본 연구에서는 48개월을 기준으로 47개월 이하의 집단과 48개월 이상의 집단으로 나누어 ROC curve 분석을 통해 각기 다른 분할점을 산출하였다.
모든 결과들은 SPSS ver. 21.0(SPSS Inc., Chicago, IL, USA)을 이용하여 산출되었다.
39개의 문항(2-40번)에서 3요인과 4요인에 대한 분석을 한 결과, 4요인 모델이 더 적합한 것으로 나타났는데, 52.82%의 총 변량을 설명하는 네 가지 요인을 산출하였다(Table 2). 네 가지 요인 중 요인 1이 23.20%(고유값 : 14.33), 요인 2가 11.63%(고유값 : 3.16), 요인 3이 9.15%(고유값 : 1.65), 요인 4가 8.84%(고유값 : 1.46)를 설명하였다. K-SCQ(일생)의 2-40번까지 총 39문항에 대한 내적 합치도 계수는 Cronbach’s α=.95로 높은 편이고, K-SCQ(현재)도 Cronbach’s α=.93으로 역시 높은 수준의 신뢰도를 나타내었다. K-SCQ(일생)의 요인분석에 의한 각 하위요인별 신뢰도는 요인 1이 .95, 요인 2가 .86, 요인 3이 .80, 요인 4가 .78이었다.
[Table 2.] Factor loading (4 factors)
Factor loading (4 factors)
산출된 네 가지 요인들이 K-ADI-R 알고리듬 분류에 따른 자폐증 증상의 세 가지 주요 영역 중 어느 것에 얼마만큼 해당하는지를 각 문항별 영역 지정을 통해 알 수 있는데, 요인 1은 K-ADI-R의 알고리듬 중 주고받는 사회적 상호작용 영역에 해당하는 문항들이 주로 포함되어 있어 사회적 상호작용과 놀이(social relation and play)라 명명하였다. 요인 2는 제한적이고 반복적이며 상동화된 행동 패턴 영역과 일치하여 상동적인 행동(stereotyped behavior)이라 명명하였고, 요인 3은 주고받는 사회적 상호작용과 의사소통 영역이 혼재되어 있는 사회적 행동(social behavior)이라 하였으며, 요인 4는 의사소통 영역 중 두드러진 특징인 비정상적 언어(abnormal language)라고 명명하였다.
비자폐 형제자매 집단과 ASD 집단의 K-SCQ(일생) 총점의 차이가 있는지 검토하기 위하여 독립표본 t-검증을 실시하였다(Table 3). 그 결과, ASD 집단의 평균 점수는 19.76이었던 반면 비자폐 형제자매 집단의 평균은 2.38점으로 현저히 낮아 ASD 집단과 비자폐 형제자매 집단 간에 유의한 차이를 보였다(t=30.24, p<.001). 각 하위영역별 점수 역시 유의한 차이를 보였는데, 요인 1은 비자폐 형제자매 집단이 .85, ASD 집단이 10.39(t=27.45, p<.001), 요인 2는 비자폐 형제자매 집단이 .72, ASD 집단이 5.22(t=19.66, p<.001), 요인 3은 비자폐 형제자매 집단이 .16, ASD 집단이 1.67(t=12.80, p<.001), 요인 4는 비자폐 형제자매 집단이 .67, ASD 집단이 2.27(t=8.85, p<.001)로 모두 ASD 집단이 유의하게 높았다.
[Table 3.] Difference in K-SCQ lifetime and current (mean/SD)
Difference in K-SCQ lifetime and current (mean/SD)
K-SCQ(현재) 점수는 연령에 따라 나타나는 발달적 특성 차이가 크므로 연령을 통제하여 ANCOVA로 분석하였다(Table 3). 그 결과, 비자폐 형제자매 집단에서는 2.72점, ASD 집단에서는 15.97점을 나타내 역시 ASD 집단이 유의하게 높았다(F=440.50, p<.001). 각 하위영역은, 요인 1은 비자폐 형제자매 집단이 1.24, ASD 집단이 8.56(F=525.78, p<.001), 요인 2는 비자폐 형제자매 집단이 .71, ASD 집단이 4.33(F=304.44, p<.001), 요인 3은 비자폐 형제자매 집단이 .15, ASD 집단이 1.19(F=116.13, p<.001), 요인 4는 비자폐 형제자매 집단이 .54, ASD 집단이 1.99(F=79.40, p<.001)로 모두 ASD 집단이 유의하게 높았다.
수렴 타당도를 검증하기 위하여, 요인분석에 의한 K-SCQ 하위요인과 K-ADI-R의 하위요인 간의 상관관계를 분석한 결과, K-SCQ(일생)과 K-ADI-R(일생)의 경우 .43에서 .89의 범위, K-SCQ(현재)와 K-ADI-R(현재)의 경우 .31에서 .84의 범위로 양호한 상관관계를 보였다(Table 4). 또한 K-SCQ(일생)은 SRS와 매우 높은 상관관계를 보였으며(r=.88, p<.001), K-SCQ(현재) 역시 유사하게 높은 상관관계를 보였다(r=.84, p<.001)(Table 4).
[Table 4.] Correlations between K-SCQ and K-ADI-R/SRS
Correlations between K-SCQ and K-ADI-R/SRS
연령을 구분하지 않고 전체로 분석하였을 때, AUC는 .99로 상당히 높은 분류 정확도를 보였다(Table 5).
[Table 5.] Corresponding AUC for each ROC curve
Corresponding AUC for each ROC curve
진단 분할점을 찾기 위해 연령을 48개월을 기준으로 하여 두 집단으로 구분하였는데, 47개월 이하의 40명을 대상으로 하였을 때 AUC값은 .96, 48개월 이상의 307명을 대상으로 한 AUC값은 .99로 역시 매우 높은 정확도 수준이었다(Table 5).
47개월 이하의 집단에서 적정한 진단 분할점을 찾기 위해 각 점수에 대한 민감도와 특이도를 Table 6에 제시하였다. K-SCQ(일생) 총점을 10점으로 하였을 때, 민감도(정확하게 진단한 확률)는 93.75%, 특이도(ASD가 아니라고 올바르게 판단할 확률)가 95.83%로 가장 높았으며, 양성 예측도와 음성 예측도도 .94, .96으로 역시 다른 점수에 비해서 가장 높았다(Table 6).
Sensitivity, specificity, positive predictive value, negative predictive value (47 months below, lifetime, N=40)
48개월 이상의 집단에서는 적정한 진단 분할점을 12점으로 보았을 때, 89.12%의 민감도와 98.75%의 특이도로 나타났으며, 양성 예측도와 음성 예측도가 각각 .98, .91로 가장 높았다(Table 7).
Sensitivity, specificity, positive predictive value, negative predictive value (48 months above, lifetime, N=307)
ASD 선별에 유용한 SCQ를 국내에서 적용하는 데 타당한지 알아보기 위해 ASD 집단 166명과 비자폐 형제자매 집단 186명을 대상으로 K-SCQ를 시행하여 분석을 실시하였다. 먼저 K-SCQ(일생)의 요인구조를 파악하기 위하여 요인분석을 실시한 결과, 원 저자의 연구28)와 마찬가지로 4요인 모델이 더 적합한 것으로 나타났으며, 원 저자 연구에서의 42.4% 설명량 보다 더 높은 52.82%의 설명량을 보였다. 전체 39문항에 대한 내적 합치도 계수 또한 원 저자에서 .90이었던 것에 비해 본 연구에서는 Cronbach’s α=.95, 각 하위요인별 신뢰도 또한 .78-.95의 범위로 비교적 높은 수준이었다. 추출된 각 요인을 사회적 상호작용과 놀이(social relation and play), 상동적인 행동(stereotyped behavior), 사회적 행동(social behavior), 비정상적 언어(abnormal language)라고 명명하였다.
각 요인을 구성하고 있는 문항들을 살펴보면, 원 저자의 4요인(사회적 상호작용 요인, 의사소통 요인, 비정상적 언어 요인, 상동적 행동 요인)과 비교했을 때, 원 저자의 사회적 상호 작용 요인은 요인 1의 사회적 상호작용과 놀이의 문항과 거의 일치하였고, 본 연구 요인 2의 상동적인 행동과, 요인 3의 비정상적 언어도 원 저자의 각 요인 부하를 구성하는 문항들을 거의 포함하고 있었다. 다만 원 저자의 의사소통 요인과 요인 3의 사회적 행동은 요인 명칭이 다르듯 구성하고 있는 문항도 차이가 있었는데, 원 저자의 의사소통 요인으로 구성되었던 ‘고개 끄덕이기, 고개 젓기, 손의 매너리즘’ 문항이 본 연구에서는 상동적인 행동 요인으로 분류되었다. ‘손의 매너리즘’은 ASD의 제한적이고 반복적이며 상동화된 행동 패턴을 나타내는 것이므로 본 연구에서의 결과와 같이 상동적인 행동 요인에 포함되는 것이 더 적합한 것으로 보인다. 하지만 ‘고개 끄덕이기와 고개 젓기’는 비언어적인 의사소통 행위이므로 원 저자의 의사소통 요인으로 포함되는 것이 더 적절한데, 본 연구에서는 이 세 가지 문항이 모두 아동의 행동적인 특성을 평가하는 것으로 여겨져 상동적인 행동 요인으로 분류된 것으로 생각된다.
더불어 원 저자 연구에서는 사회적 상호작용 요인에 포함되었던 ‘관심 보이기와 끌기, 즐거움 나누기, 나눌 것 제의하기’의 세 문항은 ‘사회적 교섭 개시의 성질’ 문항과 함께 세 번째 요인인 사회적 행동으로 분류되었는데, 이 네 문항이 모두 사회적 관계를 시작하고 유지하는 과정에서 친밀감을 표현하는 행동들이므로 단순 사회적 상호작용보다는 한 단계 위인 타인과 긴밀한 관계를 형성하기 위한 친사회적 행동으로 볼 수 있다. 따라서 사회적 상호작용 영역에서 분리되어 보다 상위의 사회적 행동 요인을 구성하는 것으로 여겨진다.
DSM-IV에서는 ASD의 문제 영역을 사회적 상호작용의 질적인 손상, 의사소통의 질적인 손상, 제한적이며 반복적인 행동이나 흥미의 세 가지 영역으로 보았으나 개정된 DSM-5에서는 사회적 의사소통 및 사회적 상호작용에서의 지속적 결함과 제한적이고 반복적인 행동이나 흥미의 두 가지 영역으로 바뀌었듯이, ASD 아동들의 언어적 특성은 단순히 언어 발달이 지연된 것이 아니라 사회적인 상황에서의 독특하고 제한적인 방식의 의사소통 사용이 두드러진다는 것을 의미한다. 따라서 본 연구에서의 요인 부하에서 의사소통 영역이 존재하지 않는 것은 ASD를 바라보는 최근의 기조처럼 실제 사회적 상황에서 아동이 사용하는 언어와 행동에 초점을 두고 평가해야 한다는 점을 반영하는 것으로 볼 수 있다. 때문에 이 4개의 요인이 K-ADI-R 알고리듬 분류에 따른 세 가지 영역(사회적 상호작용, 의사소통, 제한적이고 반복적이며 상동적인 행동)의 문항들과 완전히 일치하지는 않지만, ASD의 실질적인 문제 영역을 잘 나타내주는 결과라고 할 수 있다.
K-SCQ 총점에 대해 집단 간 비교를 하였을 때, ASD 집단과 비자폐 형제자매 집단 간의 K-SCQ 총점 차이가 현저하였는데, 이는 K-SCQ 문항들이 정상 발달을 보이는 아동들에게는 해당되지 않는 ASD의 특성을 잘 반영하는 문항으로 이루어져 있다는 것을 의미한다. 이와 함께, ASD 특성을 측정하는 또 다른 검사인 SRS와의 상관관계를 분석한 결과, K-SCQ(일생)이 r=.88(p<.001), K-SCQ(현재)가 r=.84(p<.001)로 높은 상관관계를 보였다. 또한 부모의 보고와 부모와의 면담을 통한 평가자의 평가가 일치하는지 확인하기 위한 K-SCQ의 총점 및 각 요인별 점수와 K-ADI-R의 총점 및 각 알고리듬과의 상관관계도 일생은 .43-.89의 범위, 현재는 .31-.84의 범위로 양호하게 나타났다. 원 저자의 연구28)에서는 ADI-R의 각 알고리듬 영역에 기초하여 SCQ도 동일하게 하위 영역을 구성하고 그 연관성을 살펴보았는데, .31-.71의 상관관계를 보인 결과와 유사하게 나타났다. 이러한 결과는 K-SCQ의 문항들이 ASD의 특성을 나타내는 문항들로 구성되어 있으며, ASD의 특성을 평가하는 다른 검사들과 대등할 정도로 타당한 검사라는 것을 뒷받침하는 결과이다. 특히 이 설문지의 모체가 되는 K-ADI-R의 각 영역별 점수와 높은 상관관계를 보인 것은 의미가 있다. K-SCQ는 보호자가 ‘예, 아니오’로 평가하는 자가 보고형 설문지이며 K-ADI-R은 보호자의 면담에서 나타난 행동의 자세한 묘사에 근거하여 평가자가 점수를 부여하는, 평가자 기반 면담(investigator-based interview)이라는 차이가 있다. 그럼에도 불구하고 두 평가도구 사이에 높은 상관관계를 보였다는 점은, 오랜 시간이 소요되는 K-ADI-R 면담의 일부 과정에 대해 K-SCQ가 사전 정보 수집 도구의 역할을 함으로써 면담의 효율성을 높이는 데 사용될 수 있다는 가능성을 시사하는 것이다.
다음으로, K-SCQ의 판별력을 평가하기 위하여 ROC 분석을 하였을 때, 전체를 대상으로 한 AUC는 .99로 상당히 높은 정확도를 보였으며, 연령을 48개월을 기준으로 하여 두 집단으로 구분하였을 때에도 47개월 이하에서 .96, 48개월 이상에서 .99로 역시 매우 높은 정확도 수준을 나타냈다. ASD와 non-ASD를 구분하기 위한 진단 분할점을 찾기 위 하여 각 점수에 대한 민감도와 특이도를 검토한 결과, 본 연구의 48개월 이상 집단에서는 12점 이상을 진단 분할점으로 하였을 때 89.12%와 98.75%의 가장 높은 민감도와 특이도를 보였다. SCQ의 원 저자들28)은 48개월 이상의 아동들에 대해서 15점의 진단 분할점을 제안하였는데, 본 연구에서 15점을 진단 분할점으로 하였을 때 민감도는 77.55%로 떨어져, ASD를 정확하게 분류할 확률이 감소하였다. Corsello 등17)에 따르면, 많은 연구들에서 ADI-R과 SCQ 사이의 높은 일치성을 발견하였지만 ADI-R이 SCQ(≥15)보다 자폐 아동들을 더 잘 찾아낸다고 하였다. 또 이론적으로, 선별 검사가 진단적 검사보다는 더 포괄적이어야 하므로, 선별 검사로서 SCQ를 보다 유용하게 사용하기 위해서는 15점으로 제안하는 진단 분할점을 낮출 필요가 있다고 권고하였다. 실제로 그들의 연구에서 SCQ의 진단 분할점을 12점 이상으로 하였을 때, 자폐 아동과 자폐가 아닌 아동을 구분하는 민감성이 73%(≥15)에서 83%로 증가하였고, ADI-R과 ADOS를 함께 사용하여 구분하는 민감성(85%)과도 견줄만하다는 결과를 제시하면서, SCQ를 선별 도구로 사용하고자 한다면 12점을 진단 분할점으로 사용하는 것이 더 유용하다는 제안을 하고 있다.17) 이에 본 연구에서도 K-SCQ를 48개월 이상의 아동들 중에서 ASD 가능성을 조기 발견하기 위한 선별 도구(screening instrument)로 사용하기 위해서는 12점이 적정한 수준이라 제안하는 바이다.
다른 선별 도구와 차별화된 SCQ의 장점은 다른 선별 도구들은 현재 시점의 증상과 관련된 정보만 수집하는 반면, SCQ는 ASD 증상이 가장 원형적인 양상을 보이는 4-5세의 증상과 관련된 정보를 회상하여 수집한다는 것이다. ASD의 증상이 시간에 따라 변화할 수 있고, 교육 및 치료적 개입에 따라 증상이 가려질 수 있다는 점을 고려하면, SCQ의 문항들은 보다 풍부한 정보 수집과 정확한 ASD 선별에 기여할 수 있다. 하지만 47개월 이하의 유아들에서도 ASD를 특정할 수 있는 증상이 나타날 수 있고, 이를 조기 발견하여 개입을하면 더 긍정적인 발달 경과를 보일 수 있으므로, 47개월 이하의 유아들을 대상으로 선별하는 별개의 진단 분할점을 찾을 필요가 있다. 이에 본 연구에서는 47개월 이하의 유아들을 따로 분리하여 진단 분할점을 탐색하였는데, 그 결과 10점 이상이 93.75%의 민감도와 95.83%의 특이도를 보여 가장 적정 수준인 것으로 나타났다. Corsello 등17)은 연령 범위에 따라서 장애를 변별할 수 있는 민감도와 특이도가 달라진다는 것을 밝히며, 연령에 따라 진단 분할점을 달리 해야 한다는 제안을 하였다. 즉, 더 어린 아동들은 연령이 높은 아동들보다 SCQ에서 더 낮은 점수를 받았으므로, 15점을 진단 분할점으로 할 경우 ASD의 가능성을 가진 유아들 중 많은 수가 위음성으로 분류될 가능성이 있다. 이와 같은 맥락에서, Wiggins 등21)은 11개월에서 45개월의 유아들을 대상으로 ASD를 다른 발달 지연들과 구분하기 위해서는 11점의 진단분할점이 가장 적절하다고 하였으며, Snow와 Lecavalier20)는 18개월에서 70개월의 유아를 대상으로 PDD와 non-PDD의 구분을 위해 13점의 진단 분할점이 가장 적절하다고 제안하였다. 이처럼 47개월 이하의 유아에서 분할점이 낮아진 이유는 SCQ의 문항들이 아직 언어 발달이나 사회화 발달이 충분히 이루어지지 않은 47개월 이하의 어린 유아들에게 해당되지 않는 내용들이 일부 포함되어 있어 48개월 이상의 아동들에 비해 전체 점수가 낮아지는 측면이 있기 때문인 것으로 보인다. 따라서 47개월 이하의 유아들에서 ASD의 분류 정확도를 높이기 위해서는 진단 분할점도 48개월 이상의 아동들을 대상으로 한 것보다는 낮출 필요가 있음을 시사한다. 하지만 다른 한편으로 이는 SCQ가 47개월 이하의 유아들에게서 나타나는 ASD 특성을 충분히 반영하지 못할 가능성도 있음을 의미하기도 한다. 이러한 맥락에서, 형식적인 측정치들이 3세 미만의 아동들에서 예측 타당도가 떨어지는 경향이 있으며,33) 20개월에서 40개월의 유아들에게는 SCQ가 ASD의 위험을 감지하는 데 유용하지 않다는 보고도 있다.34) 본 연구에서, 47개월 이하의 아동들에 대한 K-SCQ의 판별력이 높다는 것이 증명되기는 하였으나 47개월 미만의 연구 대상이 40명으로, 48개월 이상의 연구 대상(307명)에 비해서 그 수가 현저히 적으므로, 연구 대상의 수를 늘려 ASD의 여부를 판별할 수 있는 적정한 진단 분할점에 대한 재검증을 해볼 필요가 있겠다.
본 연구의 제한점은 비자폐 형제자매 집단과 ASD 집단 사이의 IQ 차이가 유의미하였고, 연구 대상자들 사이에 지능의 범위가 30에서 159까지 인지 기능의 차이가 큼에도 이를 고려하지 못했다는 점이다. K-SCQ를 통한 진단의 구별이 지능의 차이에 의해 인위적으로 생긴 것일 수도 있으므로, Berument등28)의 연구에서는 지능 지수의 범위(IQ 70 이상/50-69/30-49)를 구분하여 구간별로 분석하였는데, 본 연구에서는 비자폐 형제자매 집단에서 IQ 70 이하의 수가 3명에 불과하여 지능에 따라 구간을 나누어 집단 간 비교를 하는 것이 무의미하였다. 또한, 지능이 높고 자폐적 특성이 경미한 아동들은 선별 검사에서 위음성으로 분류될 수 있으므로,35) 지능의 수준이 ASD를 변별하는 데 중요한 고려사항이 될 수 있음에도 임상 집단과 대조 집단의 비교 시 지능을 차이를 고려하지 못하였다. 게다가 자폐 스펙트럼 장애가 아닌 다른 발달 지연 문제를 가지고 있는 집단이 비자폐 형제자매 집단외의 비교 집단으로 포함되어야 K-SCQ 점수에 의한 ASD 선별이 다른 발달상의 문제나 지적 기능의 문제가 아닌 ASD의 특성에 의한 것임을 명확히 할 수 있는데, 본 연구에 다른 비교 집단이 포함되지 못하였다. 이와 더불어, 대조군으로 분류된 집단이 가족력이 높은 ASD의 형제자매들로 구성되어 있을 뿐만 아니라 비자폐 형제자매 집단에 타 정신과 질환으로 진단된 아동들이 포함되어 있어 정상 대조군으로 볼 수 없다는 것 또한 타당화 연구의 한계점으로 볼 수 있다. 따라서 추후 K-SCQ 표준화를 위해서, ASD 집단과 지능 수준이 고려된 다른 비교 집단, 신체적 및 정신과적 장애가 없는 정상 대조군을 포함하여 선별 검사로서 K-SCQ의 타당성을 더 높이는 후속 연구가 진행되어야 하겠다.
본 연구에서는 ASD의 선별 도구로서 K-SCQ의 국내 타당화 연구를 진행하고 ASD 변별력을 확인하고자 하였다. ASD를 판별하기 위한 진단 분할점은 47개월 이하는 10점, 48개월 이상은 12점으로 제안하였다. 선별 검사는 진단적 도구가 아니므로 이를 통한 확진을 기대할 수 없다. 따라서 K-SCQ 단독으로 ASD를 진단하는 데는 한계가 있지만, ADOS와 ADI-R에 기반한 임상적 판단과 비교했을 때 SCQ는 가장 신중하게 결론을 내리고 진단적 타당성을 가지는 가장 정확한 평가 도구라는 것이 국외 여러 연구들을 통해 검증되었으며,36) 본 연구에서도 확인되었다. 따라서 K-SCQ가 ASD의 가능성을 가지고 있는 아동들을 선별하여 확진을 위한 정밀검사와 조기 개입 여부를 판단할 수 있는 일차적 평가 도구로서 유용하다고 할 수 있다.