PDF download PDF 다운로드 PDF download PDF 다운로드

신뢰 구간이란 통계적으로 측정한 값이 얼마나 정확한지 알려주는 지표이다. 또한 예측한 값이 얼마나 안정적인지, 다시 말해, 측정을 여러 번 반복할 경우, 측정된 값이 얼마나 원래 값에 가깝게 나올지 보여 주는 데 쓰인다. 이 글을 읽고 신뢰 구간을 어떻게 계산하는지 알아 보자.

  1. 예를 들어, “가나다 대학 남학생들의 평균 몸무게는 70kg이다.”라는 주장이 옳은지 확인해 보고 싶다고 하자. 이제 주어진 신뢰 구간 내에서 가나다 대학의 남학생들의 몸무게를 측정하려면 어떻게 해야 할지 고민하게 될 것이다.
  2. 주장이 맞는지 확인해 보기 위해서 정보를 수집할 차례이다. 예를 들어, 1,000명의 남학생을 무작위로 뽑았다고 하자.
  3. 모수(population parameter, 모집단과 관련된 통계값)를 예측하기 위해 표본과 관련된 통계값들(표본 평균과 표본 표준편차 등)을 계산한다. 모수를 통해 모집단의 특징에 대해 파악할 수 있다. 다음은 표본 평균과 표본 표준편차를 계산하는 방법이다.
    • 표본 평균을 계산하고 싶다면, 1000명의 남학생의 몸무게를 전부 더한 후 남학생의 숫자인 1,000으로 나누어 주면 된다. 통계학 시험을 보고 있다면 70kg 같은 값이 주어질 것이다.
    • 표본 표준편차를 구하고 싶다면, 우선 표본 평균을 구한 후, 표본의 분산을 계산해야 한다. 표본의 각 값에서 표본 평균을 빼 준 후 제곱한 값들의 평균을 구하면 분산이 나온다. 이제 그 값에 루트를 씌워 주면 표본 표준 편차가 된다. 계산 결과 10kg이 나왔다고 해 보자. (통계 시험을 보고 있다면 이 값도 주어지는 경우가 있을 것이다.)
  4. 가장 흔하게 쓰이는 신뢰도는 90%, 95%, 99%이다. 통계 문제를 풀고 있다면, 어떤 것을 선택해야 할지 문제에서 정해 줄 것이다. 이 글에서는 95%를 사용할 것이다.
  5. Z a/2 * σ/√(n). 라는 공식을 쓰면 된다. 여기서 Z a/2 를 신뢰계수라고 부르며, a는 신뢰도, σ는 표준 편차, n는 표본의 크기이다. 이 공식을 임계값과 표준오차의 곱이라고 표현하기도 한다. 이제 이 값을 어떻게 구하는지 예제를 통해 확인해 보자.
    • 임계값(Z a/2 )을 계산하자. 신뢰도는 95%를 사용할 것이다. 95% 신뢰도를 소수로 변환하면 0.95이며, 이것을 2로 나누면, 0.475가 된다. z 분포표 를 보고 0.475에 해당하는 값이 무엇인지 알아 보자. 1.9인 행과 0.06인 열을 따라가면 0.475가 나올 것이다. 따라서 그 값은 1.96이다.
    • 표준 오차를 구하기 위해, 위에서 구한 표본 표준 편차 10을 1000의 루트값으로 나누어 주자. 10/31.6 = 0.32kg을 얻게 될 것이다.
    • 1.96과 0.32를 곱해 주자. (임계값과 표준 오차를 곱하는 것이다.) 그러면 0.63라는 오차 한계를 구할 수 있을 것이다.
  6. 이제 평균인 70kg 옆에 ±와 오차 한계를 적어 주자. 답은 70 ± 0.63가 될 것이다. 평균값에서 오차 한계를 더하고 빼 주면, 신뢰 구간의 상한값과 하한값을 알 수 있게 될 것이다. 다시 말해, 하한값은 70 - 0.63 = 69.37이며, 상한값은 70 + 0.63 = 70.63이다.
    • 신뢰 구간을 구할 때 x̅ ± Z a/2 * σ/√(n) 라는 간편한 공식을 이용해도 된다. 여기서 x̅는 표본 평균이다.
    광고

  • t점수나 z 점수는 손으로 계산해도 되고, 그래프를 그릴 수 있는 공학용 계산기를 활용해도 되지만, 대개 통계학 교과서 부록에 있는 분포표를 사용하게 된다. Z 점수는 표준 분포 계산기를 활용하면 얻을 수 있으며, t 점수는 t 분포 계산기를 이용하면 된다. 인터넷에서도 관련된 계산 프로그램을 찾을 수 있다.
  • 신뢰 구간이 유효하려면 표본이 정규 집단이어야 한다.
  • 오차 한계를 계산하는데 사용되는 임계값은 상수인 t 점수나 z 점수로 표현된다. T 점수는 집단의 표준 편차를 알 수 없는 경우나, 표본의 개수가 적을 때 사용한다.
  • 단순 무작위 추출, 계통 추출(systematic sampling), 층별 추출(stratified sampling)처럼 모집단을 대표할 수 있는 표본을 추출하는 방법들이 존재한다.
  • 신뢰 구간은 특정 결과에 대한 확률을 의미하는 것이 아니다. 예를 들어, 95% 신뢰도로 계산했을 때 모집단의 평균이 75에서 100 사이에 있다고 하자. 이 말은 모집단의 평균이 95%의 확률로 이 구간 안에 있다는 의미가 아니다.
광고

필요한 것들

  • 표본
  • 컴퓨터
  • 인터넷 접속
  • 통계학 교과서
  • 그래프를 그릴 수 있는 공학용 계산기

이 위키하우에 대하여

이 문서는 56,441 번 조회 되었습니다.

이 글이 도움이 되었나요?

광고