PDF download PDF 다운로드 PDF download PDF 다운로드

통계에서 최빈값 이라 하면 어떤 수의 집합에서 가장 빈번하게 등장하는 수 를 의미한다. 어떤 집합의 최빈값은 하나 이상일 수 있으며 두 수가 동시에 "최빈"인 경우에는 그 집합을 "바이모달" 또는 "멀티모달"이라고 부른다. 두 용어가 다르긴 하지만 결국 최빈값이 존재한다는 사실은 같다. 어떤 데이터 집합(수의 집합을 의미한다)에서 최빈값을 구하는 방법을 알고 싶다면 이 글을 읽어보도록 하자.

방법 1
방법 1 의 2:

수의 집합에서 최빈값 찾기

PDF download PDF 다운로드
  1. 보통 최빈값은 통계자료나 주어진 숫자의 집합이 있으면 쉽게 구할 수 있다. 먼저 최빈값을 구하기 위해 가진 자료를 모두 적거나 쉽게 볼 수 있도록 정리한다. 암산을 할 수도 있겠지만 집합의 크기가 커진다면 상당히 힘들어질 것이다. 그냥 연필을 집어 종이에 모든 숫자를 적어 시간을 절약하도록 하자. 만약 컴퓨터가 있다면 엑셀 을 이용해 쉽게 최빈값을 찾을 수 있다. [1]
    • 아무래도 특정 집합의 최빈값을 찾는 방법을 쉽게 이해하려면 직접 예시를 보면서 같이 풀어보는 것이 좋을 것이다. 일단 우리에게 다음 수의 집합이 주어졌다고 가정하자: {18, 21, 11, 21, 15, 19, 17, 21, 17} . 이제 아래 단계를 따라가며 최빈값을 구해보도록 하겠다.
  2. 다음으로 해야 할 것은 수를 오름차순으로 정렬하는 것이다. 물론 꼭 하지 않아도 괜찮긴 하지만 최빈값을 쉽게 구하고 싶으면 정렬하는 것을 추천한다. 아무래도 자주 등장하는 수를 쉽게 보려면 같은 수끼리 옆에 정렬되어 있는 것이 낫지 않겠는가? 집합의 크기가 크다면 거의 무조건 하는 것이 시간을 절약하는데 도움이 될 것이다. 정리되지 않은 집합을 보면서 수를 일일히 세게 되면 실수를 할 확률이 증가하기 때문이다. [2]
    • 종이에 연필로 집합을 적어 놨다면 다시 정렬해 적는 것이 장기적으로 봤을 때 시간이 더 적게 걸릴 것이다. 먼저 집합을 훑어 가장 작은 수를 적고 다른 종이에 옮겨 적도록 하자. 그리고 다음에는 집합의 두 번째 작은 수, 다음으로 작은 수 등 계속해서 집합의 각 원소를 오름차순으로 정리하도록 하자. 만약 주어진 집합에서 같은 수가 여러 개 있다면 같은 부분에 나란히 쓰도록 한다.
    • 컴퓨터로 데이터를 정리하고 있다면 여러가지 기능을 선택해 편하게 작업할 수 있을 것이다. 대부분의 스프레드시트 프로그램에서는 수의 집합을 몇 번 클릭하는 것으로 오름차순으로 쉽게 정렬할 수 있다.
    • 우리에게 주어진 수의 집합을 정렬하면 다음처럼 보일 것이다: {11, 15, 17, 17, 18, 19, 21, 21, 21} .
  3. 다음으로는 집합에 같은 수가 몇 번이나 반복되는지 적는 것이다. 이 방법으로 집합에서 가장 많이 반복되는 숫자가 무엇인지 쉽게 찾을 수 있을 것이다. 작은 집합이라면 그래프로 나타냈을 때 점의 수가 가장 많이 뭉쳐있는 부분의 값을 고르면 된다. 그래프가 아니더라도 수가 많지 않으므로 쉽게 최빈값을 찾을 수 있을 것이다. [3]
    • 종이와 연필로 작업하고 있다면 위 그림처럼 수를 적어 몇 번씩 나왔는지 옆에 적도록 하자. 여러 번 등장한 수를 왼쪽에 적고 몇 번 등장했는지를 오른쪽에 적는다. 만약 컴퓨터에서 스프레드시트로 작업하고 있었다면 같은 방식으로 옆 칸에 수를 쓰고 몇 번 등장했는지 타이핑하도록 한다. 만약 수를 세어주는 기능이 있다면 사용해 쉽게 구할 수 있다.
    • 우리에게 주어진 집합을 보면, ({11, 15, 17, 17, 18, 19, 21, 21, 21}) 이처럼 11이 한 번, 15가 한 번, 17이 두 번, 18이 한 번, 19가 한 번, 마지막으로 21이 세 번 나오는 것을 볼 수 있다 . 따라서 21이 가장 자주 반복된 숫자가 될 것이다.
  4. 이제 모든 자료가 눈 앞에 있으니 숫자 중 집합 내에서 가장 많이 반복된 것을 고르면 된다. 이 것이 바로 집합의 최빈값이다 . 처음에 설명했듯이 최빈값은 한 개 이상이 있을 수 있다 . 따라서 두 수가 똑같이 집합 내에서 등장했으면 두 개의 최빈값을 지닌 집합이라는 의미로 바이모달 이라고 부른다. 최빈값이 세 개면 트라이모달 같은 식으로 계속해서 쓸 수 있다. [4]
    • 우리에게 주어진 집합을 다시 보도록 하자. ({11, 15, 17, 17, 18, 19, 21, 21, 21}), 여기서는 21이 가장 많이 반복되었기 때문에 21이 최빈값이라고 할 수 있다.
    • 만약 21이 아닌 다른 값이 똑같이 세 번 반복되었으면 (예를 들어 17이 한 번 더 반복되었다고 한다면), 21과 마찬가지로 위 집합의 최빈값이 될 것이다.
  5. 통계학에서 가장 빈번하게 등장하는 것들이 바로 최빈값, 중간값, 평균값의 세 가지 개념이다. 특히 원서로 공부를 하고 있다면 means, medians, modes 처럼 이름이 비슷하기 때문에 더 헷갈릴 수 있다. 게다가 가끔씩은 세 값을 계산했을 때 값이 겹치기도 한다. 하지만 값이 같아도 최빈값과 중간값, 평균값은 전혀 다른 개념이기에 절대 서로 같다고 생각해서는 안 된다. 아래를 참고해 각각의 개념이 어떤 것인지 예시와 함께 알아보도록 하자 [5] :
    광고
방법 2
방법 2 의 2:

특수한 집합에서 최빈값 구하기

PDF download PDF 다운로드
  1. 제목에 설명한대로다. 만약 위 그림처럼 집합 내의 원소가 딱 한 번씩만, 아니면 두 번씩만, 같은 숫자만큼 반복된다면 최빈값은 존재하지 않는다. 어떤 수가 다른 수보다 월등하게 자주 등장하지 않기 때문이다. [6]
    • 만약 우리에게 주어진 집합을 {11, 15, 17, 18, 19, 21}처럼 바꿨다면 모든 숫자가 같은 횟수만큼 반복되기 때문에 중간값이 존재하지 않는다 . 집합을 다음처럼 모든 수가 두 번씩 반복되게 만들어도 중간값이 존재하지 않는다. {11, 11, 15, 15, 17, 17, 18, 18, 19, 19, 21, 21}.
  2. 최빈값은 꼭 숫자가 아니어도 된다. 기본적으로 세상에 존재하는 모든 데이터 집합은 "수치"로 나타낼 수 있다. 결국에는 양을 측정해 숫자로 표현할 수 있다는 말이다. 최빈값의 정의는 어떤 집합에서 가장 많이 반복되는 수를 의미한다고 했는데, 꼭 수가 아니더라도 가장 많이 반복되는 글자, 그림, 문장을 골라 최빈값을 구할 수 있다. 따라서 집합의 원소가 어떤 형태를 가지던 최빈값을 구하는 것은 가능하다. [7] 위 그림을 예로 들어 설명하도록 하겠다.
    • 위 그림에 적힌 단어들은 나무 종류를 영어로 적은 것이다. 그것도 특정 지역에 존재하는 나무를 적은 것인데 이를 집합으로 표현하면 다음처럼 쓸 수 있을 것이다. {Cedar, Alder, Cedar, Pine, Cedar, Cedar, Alder, Alder, Pine, Cedar}. 이런 데이터 집합을 명목형 자료라고 부르는데, 집합의 원소가 수가 아닌 글로 표현되어 있기 때문이다. 이 경우 집합의 최빈값은 가장 많이 반복되는 Cedar 가 될 것이다(Alder가 세 번, Pine이 두 번 반복된 것에 비해 Cedar는 다섯 번 반복되었다).
    • 하지만 위의 데이터 집합에서는 중간값이나 평균값을 구할 수 없다. 각 원소에 수치적인 개념이 없기 때문이다.
  3. 위에서 언급한대로 어떤 집합의 최빈값, 중간값, 평균값은 상황에 따라 같은 값을 가질 수도 있다. 특히 데이터 집합을 좌표계에 나타냈을 때 완벽하게 대칭을 이루는 특수한 경우에는 (정규 분포나 종형 곡선처럼) 중간값과 최빈값, 평균값이 같은 값을 가지게 된다. 분포 그래프에서는 특정 데이터가 얼마나 자주 등장했는지가 y값을 결정짓기 때문에 높이 위치한 점은 즉, 그만큼 자주 등장했다는 말과 같다. 위 그림에서도 볼 수 있듯이 정규 분포같이 특수한 경우에서는 그래프의 가장 높은 값, 즉 가장 빈번하게 등장하는 원소가 데이터 집합의 정확히 중간에 위치하며 평균을 나타내고 있기 때문이다.
    • 예를 들어 다음과 같은 집합이 있다고 하자. {1, 2, 2, 3, 3, 3, 4, 4, 5}. 이 데이터 집합을 그래프로 그리면 x = 3일 때 높이가 3인 대칭 곡선이 나올 것이다. 이 곡선은 또한 x = 1, x = 5일 때 높이 1을 가진다. 따라서 3이 가장 자주 등장한 원소, 최빈값 이 될 것이다. 그리고 3을 중심으로 해 좌우로 4개씩 원소가 존재하므로 중간값 이기도 하다. 마지막으로 평균을 구해보면 1 + 2 + 2 + 3 + 3 + 3 + 4 + 4 + 5 = 27/9 = 3이 나오므로 3이 평균값이 된다.
    • 여기서 설명한 대칭 곡선에서의 규칙에는 예외가 있는데 집합이 한 개 이상의 최빈값을 가질 때가 바로 그것이다. 이 경우에는 최빈값은 두 개가 되지만 평균과 중간값은 하나만 존재할 수 있으므로 같은 값을 가지지 않으며, 따라서 그래프의 다른 부분에 표시되게 된다.
    광고

  • 한 집합에는 한 개 이상의 최빈값이 존재할 수 있다.
  • 모든 숫자가 한 번씩만 등장한다면 최빈값은 존재하지 않는다.
광고

필요한 것

  • 종이, 연필, 지우개

이 위키하우에 대하여

이 문서는 13,720 번 조회 되었습니다.

이 글이 도움이 되었나요?

광고