검색 상세

구조방정식 모형에서의 높은 다중공선성 조정을 위한 탐색적 연구

Exploratory Study for Handling Multicollinearity

초록/요약

다중공선성이란 회귀분석이나 구조방정식 모형에서 한 종속변수에 대한 여러 독립변수들 사이의 선형관계 정도를 나타낸다. 다중공선성이 높으면 구조방정식을 이용한 매개모형 등을 분석시 분산을 크게 추정하여 2종 오류를 발생시키거나 불안정한 추정치로 해석의 문제를 일으킨다. 본 연구에서는 이를 해결하는 방법을 조직화하기 위해 구조방정식 매개모형에서 높은 다중공선성으로 인해 발생할 수 있는 추정 문제의 원인을 크게 네 가지로 분류하고 그에 따른 조정 방법을 탐색하여 정리하였다. 연구자들이 설정한 네 가지 원인은 구조방정식 분석을 위한 가정을 만족하지 못하는 경우, 조건을 만족하지 못하는 경우, 자료에 문제가 발생한 경우, 잘못된 모형 설정의 경우이다. 가정을 만족하지 못하는 경우는 추정 방법을 변경하거나 지표변수의 오차 상관을 추정하는 방법, 조건을 만족하지 못하는 경우는 경로계수나 요인부하량을 제약하는 방법, 자료 문제인 경우는 문항묶음을 변경하는 방법, 문항을 삭제하는 방법, 경로분석 및 재척도 방법, 모형이 잘못된 경우는 완전매개모형이나 교차요인부하 방법 등을 시도해 볼 수 있음을 설명과 함께 제공하였다. 이지은과 김수영(2018)에서 사용된 자료를 이용하여 다중공선성으로 인한 추정의 안정성 문제를 실제로 조정하는 예를 보였으며, 예시 자료의 경우에는 지표변수의 오차 상관을 추정하는 방법과 문항묶음 변경, 문항 삭제, 경로분석 방법이 효과적이었고 BSEM, PLS-SEM이 추정의 안정성을 획득할 가능성이 있음을 확인하였다.

more

초록/요약

Multicollinearity refers to the degree of the linear relationship between independent variables for one dependent variable in multiple regression analysis or structural equation models. When there is serious multicollinearity, the variances are overestimated in the structural equation mediation model, causing inflated Type II errors or some problems in interpretation with those unstable estimates. In order to organize the methods to solve this problem, the reasons that may cause problems of estimation by high multicollinearity in the structural equation mediation model were classified into four main categories, and some possible solutions were summarized accordingly in this study. The four reasons that authors chose are the case of dissatisfaction of assumptions for structural equation analysis, the case of dissatisfaction of conditions for data, the case of data problems and lastly the case of model misspecification. If the assumption is not satisfied, the estimation method may be changed or the error correlation between the indicator variables may be estimated. If the condition is not satisfied, the path coefficient or factor loading may be constrained. If there is a problem in the data, researchers may try deleting items, path analysis, or rescaling method. Lastly if the model is incorrectly specified, complete mediation model or the cross-factor loading method may be tried. The present study shows examples using the Lee and Kim’s(2018) data, and the estimation of error correlation of indicators, changing of item parceling, deleting items, and path analysis were effective then BSEM and PLS-SEM show the possibility for stable estimation in this case.

more