경제/CFA

CFA Level 1 정복기 (9): 두 변수는 관계가 있을까? 독립성 검정

공부하는 맨더블 2025. 8. 14. 21:00
반응형

'주가와 금리는 반대로 움직인다', '경기 성장률과 기업 이익은 함께 움직인다' 등 우리는 수많은 변수들의 관계에 대한 가설을 가지고 있습니다. 그렇다면 두 변수가 실제로 통계적으로 유의미한 관계를 가지는지, 아니면 그저 우연의 일치인지를 어떻게 판단할 수 있을까요? Reading 9에서는 두 변수 간의 '독립성'을 검정하는 다양한 통계적 방법론을 소개합니다.


1. 모수적 검정 vs. 비모수적 검정: 데이터에 맞는 연장 선택


독립성 검정 방법은 크게 두 가지로 나뉩니다. 어떤 연장을 사용할지는 우리가 가진 데이터의 성격과 분포 가정에 따라 달라집니다.

- 모수적 검정 (Parametric Test): 데이터가 특정 확률 분포(주로 정규분포)를 따른다는 '가정' 하에 수행하는 검정입니다. 데이터가 연속적인 숫자(등간척도, 비율척도)이고 정규분포 가정을 만족할 때 강력한 검정력을 보입니다. 피어슨 상관계수(Pearson correlation coefficient)에 대한 t-검정이 대표적입니다.

- 비모수적 검정 (Non-Parametric Test): 데이터의 분포에 대한 특별한 가정이 필요 없는 검정 방법입니다. 데이터의 수가 적거나, 정규분포 가정을 만족하지 못하거나, 데이터가 순위(ranking)와 같은 서열 척도일 때 유용합니다. 스피어만 순위상관계수(Spearman rank correlation) 검정이나 카이제곱(Chi-squared) 검정이 여기에 속합니다.


 2. 상관관계 분석: 선형 관계의 강도와 방향 측정


상관관계 분석은 두 '연속형' 변수 간의 '선형적인' 관계를 측정하는 데 초점을 맞춥니다. 표본 데이터에서 계산된 상관계수가 0과 유의미하게 다른지 가설검정을 통해 판단합니다.

- 귀무가설(H₀): 모집단의 상관계수는 0이다. (두 변수는 선형 관계가 없다.)
- 대립가설(Hₐ): 모집단의 상관계수는 0이 아니다. (두 변수는 선형 관계가 있다.)

이 검정을 통해 우리는 표본에서 나타난 상관관계가 우연에 의한 것인지, 아니면 통계적으로 의미 있는 관계인지를 결론 내릴 수 있습니다. 스피어만 순위상관계수는 각 변수의 실제 값 대신 그 순위를 이용하여 계산하므로, 비선형 관계나 이상치에 덜 민감한 특징이 있습니다.


 3. 카이제곱 검정: 범주형 데이터의 연관성 분석


만약 우리가 분석하려는 두 변수가 모두 '범주형' 데이터라면 어떨까요? 예를 들어, '투자자의 투자 성향(안정형, 중립형, 공격형)'과 '주로 거래하는 금융상품(주식, 채권, 펀드)' 사이에 연관성이 있는지를 보고 싶을 수 있습니다.

이럴 때 사용하는 것이 바로 분할표(Contingency Table)와 카이제곱(χ²) 검정입니다. 분할표를 통해 각 범주의 조합에 해당하는 빈도를 정리하고, '두 변수가 독립이라면 기대되는 기대빈도'와 '실제 관측빈도'의 차이를 카이제곱 통계량으로 계산합니다. 이 값이 충분히 크다면, 우리는 두 변수가 독립적이라는 귀무가설을 기각하고 서로 연관이 있다고 결론 내릴 수 있습니다.


 핵심 용어 정리

영어 한글
Parametric Test 모수적 검정
Non-parametric Test 비모수적 검정
Pearson Correlation 피어슨 상관계수
Spearman Rank Correlation 스피어만 순위상관계수
Contingency Table 분할표
Chi-squared Test 카이제곱 검정


마치며


이 글에서는 CFA Level 1의 Reading 9를 통해 두 변수 간의 관계를 통계적으로 검증하는 방법들을 배웠습니다. 데이터의 특성에 따라 모수적 또는 비모수적 검정을 선택해야 함을 이해하고, 연속형 변수 간의 선형 관계를 분석하는 상관관계 분석과 범주형 변수 간의 연관성을 분석하는 카이제곱 검정의 원리를 파악했습니다. 이러한 독립성 검정은 변수 간의 실제 관계를 파악하여 더 정교한 투자 모델을 만드는 데 필수적인 과정입니다.

반응형