대한민국 모든 주식 투자자의 평균 수익률을 알고 싶다고 가정해봅시다. 수백만 명에 달하는 모든 투자자를 전수조사하는 것은 현실적으로 불가능합니다. 이럴 때 우리는 일부 '표본(Sample)'을 추출하여, 이를 바탕으로 전체 '모집단(Population)'의 특성을 '추정(Estimation)'하고 '추론(Inference)'합니다. Reading 7에서는 신뢰할 수 있는 추정을 위한 과학적인 표본추출 방법과 그 강력한 이론적 기반을 배웁니다.
1. 신뢰할 수 있는 표본을 얻는 법: 확률적 표본추출
표본이 모집단을 잘 대표하기 위해서는 편향 없이 무작위로 추출하는 것이 중요합니다. 좋은 표본이 좋은 추정의 첫걸음입니다.
- 단순무작위추출 (Simple Random Sampling): 가장 기본적인 방법으로, 모집단의 모든 개체가 표본으로 뽑힐 확률이 동일하도록 추출합니다. 마치 제비뽑기와 같습니다.
- 층화추출 (Stratified Sampling): 모집단을 특정 기준(예: 산업, 시가총액)에 따라 의미 있는 여러 개의 '층(Stratum)'으로 나눈 뒤, 각 층의 비율에 맞게 무작위로 표본을 추출하는 방법입니다. 모집단의 구조를 표본에 체계적으로 반영할 수 있어 단순무작위추출보다 더 정교한 추정이 가능합니다. 예를 들어, KOSPI200 지수를 추종하는 인덱스 펀드를 만들 때, 각 산업별 비중을 맞추어 주식을 샘플링하는 것이 층화추출의 좋은 예입니다.
- 군집추출 (Cluster Sampling): 모집단을 여러 개의 '군집(Cluster)'으로 나눈 뒤, 특정 군집 몇 개를 무작위로 선택하여 그 군집에 속한 모든 개체를 표본으로 사용하는 방법입니다. 지리적으로 넓게 퍼져있는 모집단을 조사할 때 비용 효율적일 수 있지만, 군집 간 특성이 다를 경우 오차가 커질 수 있습니다.
2. 통계적 추론의 반석: 중심극한정리 (CLT)
중심극한정리(Central Limit Theorem)는 통계학에서 가장 중요하고 아름다운 정리 중 하나로 꼽힙니다. 그 내용은 다음과 같습니다.
> 모집단의 원래 분포 모양과 상관없이, 표본의 크기(n)가 충분히 크다면(일반적으로 30 이상), 표본평균들의 분포는 근사적으로 정규분포를 따른다.
이 정리가 강력한 이유는, 우리가 모집단의 분포를 몰라도 표본평균의 분포는 예측 가능한 정규분포를 따른다는 것을 보장해주기 때문입니다. 덕분에 우리는 정규분포의 잘 알려진 통계적 특성을 이용하여 모집단의 평균에 대해 신뢰구간을 추정하거나 가설검정을 수행하는 등 통계적 추론을 할 수 있게 됩니다. 즉, 불확실한 추론의 세계에 확실한 다리를 놓아주는 역할을 합니다.
3. 추정의 정밀도: 표준오차 (Standard Error)
우리가 표본을 통해 계산한 표본평균은 진짜 모집단의 평균(모평균)과 얼마나 가까울까요? '표준오차(Standard Error of the Sample Mean)'는 여러 번 표본을 뽑았을 때, 그 표본평균들이 진짜 모평균으로부터 평균적으로 얼마나 떨어져 있는지를 나타내는 값입니다. 즉, 우리 추정치의 정밀도를 의미합니다.
> 표준오차 (σₓ) = σ / √n (σ: 모집단 표준편차, n: 표본 크기)
표준오차는 표본의 크기(n)가 커질수록 작아지므로, 더 많은 데이터를 사용할수록 더 정밀하고 신뢰할 수 있는 추정이 가능해집니다.
핵심 용어 정리
| 영어 | 한글 |
| Population | 모집단 |
| Sample | 표본 |
| Simple Random Sampling | 단순무작위추출 |
| Stratified Random Sampling | 층화추출 |
| Cluster Sampling | 군집추출 |
| Central Limit Theorem (CLT) | 중심극한정리 |
| Standard Error | 표준오차 |
| Resampling | 재표본추출 |
마치며
이 글에서는 CFA Level 1의 Reading 7을 통해 표본으로 모집단을 추정하는 통계적 추론의 기초를 다졌습니다. 신뢰성 있는 추론을 위해 층화추출과 같은 과학적 표본추출 방법의 중요성을 이해하고, 통계적 추론의 이론적 기반이 되는 강력한 도구인 중심극한정리(CLT)의 의미를 파악했습니다. 또한, 추정치의 정밀도를 나타내는 표준오차의 개념을 통해 표본 크기의 중요성을 다시 한번 확인했습니다.
'경제 > CFA' 카테고리의 다른 글
| CFA Level 1 정복기 (9): 두 변수는 관계가 있을까? 독립성 검정 (4) | 2025.08.14 |
|---|---|
| CFA Level 1 정복기 (8): 가설 검증, 숫자로 증명하라 (4) | 2025.08.13 |
| CFA Level 1 정복기 (6): 미래를 예측하는 도구, 시뮬레이션 기법 (3) | 2025.08.11 |
| CFA Level 1 정복기 (5): 분산투자의 마법, 포트폴리오 수학 (2) | 2025.08.10 |
| CFA Level 1 정복기 (4): 불확실성 속에서 최적의 답 찾기, 확률의 세계 (6) | 2025.08.09 |