PDF 다운로드 PDF 다운로드

표준 편차는 자료들이 전체적으로 어떻게 분포되어 있는지를 보여준다. [1] 따라서 표준 편차를 구하려면 먼저 주어진 자료의 평균과 분산을 계산해야 할 필요가 있다. 분산은 자료들이 평균 주위에 어떻게 흩어져 있는지를 나타내는 지표인데 [2] , 표준 편차는 분산의 제곱근을 구하는 것으로 쉽게 계산할 수 있다. 이 글에서는 평균과 분산, 표준 편차를 구하는 법에 대해 배워보겠다.

파트 1
파트 1 의 3:

평균 구하기

PDF 다운로드
  1. 통계적인 계산을 할 때는 항상 주어진 자료를 먼저 자세히 살펴보는 습관을 지녀야 한다. 심지어 평균이나 중간값 같은 단순한 수치를 구한다 해도 말이다. [3]
    • 일단 주어진 자료에 얼마나 많은 숫자가 있는지 살펴본다.
    • 숫자가 작은 수부터 큰 수까지 널리 분포되어 있는가? 아니면 크기가 비슷한 숫자끼리 모여 있는가? 주어진 자료의 숫자가 아주 약간의 차이밖에 안 나는가?
    • 주어진 자료가 나타내는 것이 무엇인지 이해해야 한다. 자료의 숫자들은 성적일 수도 있고, 심박수일 수도 있으며, 키나 몸무게일 수도 있다.
    • 예를 들어 우리에게 주어진 시험 성적 자료가 10, 8, 10, 8, 8, 4로 나타날 수 있을 것이다.
  2. 자료에 속한 모든 숫자를 동원해 먼저 평균을 계산하도록 한다. [4]
    • 평균값은 말그대로 평균을 구하면 된다.
    • 평균을 구하려면 먼저 주어진 자료(n)의 모든 숫자를 더한 뒤에 더한 숫자의 개수로 나누면 된다.
    • 아까 주어진 성적 자료의 평균을 구해보면 다음과 같다. 먼저 자료는 (10, 8, 10, 8, 8, 4)처럼 집합으로 나타내고 숫자가 6개 있으므로 n = 6이 된다.
  3. 평균을 구하기 위한 첫 번째 단계이다. [5]
    • 아까의 예시를 계속 이어서 풀어보겠다. 시험 성적 자료는 다음과 같았다: 10, 8, 10, 8, 8, 4.
    • 10 + 8 + 10 + 8 + 8 + 4 = 48. 이처럼 먼저 자료의 수를 다 더해준다.
    • 다시 한 번 덧셈을 해 검산을 한다.
  4. 그러면 현재 주어진 자료의 평균값이 나오게 된다. [6]
    • 아까 계산한 시험 성적 자료 (10, 8, 10, 8, 8, 4)에는 숫자가 여섯 개 있었으므로 n = 6으로 쓸 수 있다.
    • 시험 성적을 다 합치면 48이 되므로 이제 이를 n으로 나눠 평균을 구할 수 있다.
    • 48 / 6 = 8
    • 즉 시험 성적의 평균은 8점이다.
    광고
파트 2
파트 2 의 3:

분산 구하기

PDF 다운로드
  1. 분산이란 주어진 자료의 숫자가 평균을 기준으로 어떻게 흩어져 있는지 나타내는 지표이다. [7]
    • 분산은 전체적으로 숫자가 어떻게 흩어져 있는지 설명해준다.
    • 분산이 작으면 숫자가 평균값 근처에 모여있다는 말과 같다.
    • 분산이 크면 말 그대로 숫자가 평균값과 멀리 떨어져 있다는 뜻이다.
    • 분산은 두 자료의 흩어진 정도를 비교할 때 자주 사용된다.
  2. 이 과정을 통해 자료 속의 각 숫자가 평균값에서 얼마나 멀리 떨어져 있는지를 알 수 있다. [8]
    • 예를 들어 아까 시험 성적을 다시 보도록 하자. (10, 8, 10, 8, 8, 4)의 평균으로 8을 구했었다.
    • 이제 각 숫자에서 평균을 빼면 다음처럼 될 것이다. 10 - 8 = 2, 8 - 8 = 0, 10 - 8 = 2, 8 - 8 = 0, 8 - 8 = 0, 4 - 8 = -4.
    • 이 과정을 다시 한 번 반복해 검산하도록 한다. 한 번 실수하면 이후의 과정이 다 틀려질 수 있으므로 꼭 검산을 하도록 한다.
  3. 자료 속의 숫자에서 평균을 뺀 값을 각각 따로 제곱해 놓는다. [9]
    • 아까 시험 성적 자료(10, 8, 10, 8, 8, 4) 에서 평균값 8을 빼고 남은 숫자는 2, 0, 2, 0, 0, -4 였다.
    • 이제 각 숫자를 제곱하도록 한다. 그러면 2 2 , 0 2 , 2 2 , 0 2 , 0 2 , (-4) 2 = 4, 0, 4, 0, 0, 16로 정리된다.
    • 다음 단계로 넘어가기 전에 빠르게 검산을 하도록 한다.
  4. 이 과정을 제곱합이라고 부른다. [10]
    • 다시 시험 성적 자료를 놓고 보면 제곱한 값은 4, 0, 4, 0, 0, 16가 나왔었다.
    • 다시 설명하자면 위 값은 각 성적에서 평균값 8을 빼고 각각 제곱한 것이다. (10-8)^2 + (8-8)^2 + (10-8)^2 + (8-8)^2 + (8-8)^2 + (4-8)^2
    • 이제 제곱한 값을 다 더해보자. 4 + 0 + 4 + 0 + 0 + 16 = 24.
    • 제곱의 합은 24이다.
  5. 아까 위에서 썼지만, n은 처음 주어진 자료에 속한 숫자의 개수이다. 이 과정을 거치면 분산이 나오며, 여기서 n-1로 나누는 이유는 표본 분산과 모분산을 분리하기 위해서이다. [11]
    • 시험 성적을 놓고 다시 보면 (10, 8, 10, 8, 8, 4)로 6개의 숫자가 있었다. 따라서 n = 6이다.
    • n - 1 = 5.
    • 제곱의 합이 24가 나왔다는 점을 참고하자.
    • 24 / 5 = 4.8
    • 따라서 시험 성적의 분산은 4.8가 된다.
    광고
파트 3
파트 3 의 3:

표준 편차 구하기

PDF 다운로드
  1. 표준 편차를 구하기 위해서는 분산이 필요하다는 점을 먼저 알도록 하자. [12]
    • 분산은 주어진 자료의 숫자가 평균값을 기준으로 어떻게 분포되어 있는지 나타내는 지표다.
    • 표준 편차도 분산과 마찬가지로 자료 내의 숫자가 어떻게 분포되어 있는지를 나타낸다.
    • 시험 성적 예시를 다시 보자. 아까 위에서 구한 분산은 4.8이었다.
  2. 분산 값에 루트를 씌워 제곱근을 구하면 표준 편차가 나온다. [13]
    • 일반적으로 어떤 자료의 데이터 중 68%는 평균값을 기준으로 표준 편차 값을 더하거나 뺀 값의 범위를 벗어나지 않는다.
    • 아까 시험 성적의 분산은 4.8이었다.
    • 루트를 씌우면 다음과 같이 표준 편차가 나온다. √4.8 = 2.19. 우리가 구하고자 한 표준 편차의 값이 2.19가 됨을 알 수 있다.
    • 우리 시험 성적 자료 (10, 8, 10, 8, 8, 4)를 보면 평균값 (8)에서 표준 편차 (2.19)를 더하고 뺀 값의 범위 내에 6개 중 5개, 즉 83%의 수가 속해 있는 것을 확인할 수 있다.
  3. 이 글을 다시 쭉 따라가며 모든 수치가 맞게 계산되었는지 확인한다. [14]
    • 표준 편차를 구할 때 계산기를 썼던 손으로 풀었던 모든 과정을 종이에 적어가며 푸는 것이 중요하다.
    • 두 번째 구했을 때 다른 값이 나왔다면 과정을 차근차근 훑어보도록 한다.
    • 어디가 틀렸는지 찾기 힘들다면 마지막으로 다시 한 번 문제를 풀어본다.
    광고

이 위키하우에 대하여

이 문서는 307,577 번 조회 되었습니다.

이 글이 도움이 되었나요?

광고