Baixe em PDF
Baixe em PDF
Um outlier é um dado observacional consideravelmente diferente em termos numéricos das outras observações em uma amostra. O termo é usado em estudos estatísticos e podem apontar anormalidades do conjunto de dados ou erros na medição realizada. Saber como calcular os outliers é importante para assegurar uma compreensão adequada dos dados e levará a conclusões mais corretas do estudo. Há um processo bem simples para calculá-los em um determinado conjunto de observações.
Passos
-
Aprenda a reconhecer um potencial outlier. Antes de calcular se um dado observacional representa ou não um outlier, é sempre útil examinar o conjunto de dados e reconhecer potenciais outliers. Por exemplo, considere um conjunto de dados que represente a temperatura de 12 diferentes objetos em um cômodo. Se 11 objetos tiverem a temperatura em torno de 21º C, mas o décimo segundo (talvez um forno) tiver uma temperatura de 150º C, uma examinação rápida poderá dizer que o forno é um outlier.
-
Organize os dados observacionais a partir do menor até o maior. Continuando com o exemplo acima, considere o seguinte conjunto de dados representando as temperaturas de diversos objetos: {22, 21, 24, 21, 21, 20, 21, 23, 22, 150, 22, 20}. Esse conjunto deverá ser distribuído como: {20, 20, 21, 21, 21, 21, 22, 22, 22, 23, 24, 150}.
-
Calcule a mediana do conjunto de dados. A mediana é o dado observacional localizado acima da metade de baixo dos dados e abaixo da metade de cima. Se o conjunto de dados contiver um número par de observações, então os dois termos do meio devem ser fatorados. No exemplo acima, os dois termos do meio são 21 e 22, portanto a mediana é ((21 + 22) / 2), ou 21,5.
-
Calcule o quartil inferior. Esse ponto, chamado Q1, é o dado observacional localizado abaixo de 25% das observações. No exemplo acima, dois termos terão que ser fatorados novamente, dessa vez o 21 e o 21. A média dos dois será ((21 + 21) / 2), ou 21.
-
Calcule o quartil superior. Esse ponto, chamado Q3, é o dado observacional localizado acima de 25% das observações. Continuando com o nosso exemplo, tirar a média dos dois dados 22 e 23 leva ao Q3, que é 22,5.
-
Encontre as “barreiras internas” do conjunto de dados. O primeiro passo é multiplicar a diferença entre Q1 e Q3 (chamada amplitude interquartílica) por 1,5. No exemplo acima, a amplitude interquartílica é (22,5 - 21), ou seja, 1,5. Multiplicar esse valor por 1,5 gera 2,25. Adicione esse número ao Q3 e subtraia do Q1 para construir as barreiras. Neste exemplo, as barreiras internas superior e inferior seriam 24,75 e 18,75.
- Todos os dados observacionais que estiverem fora dessa amplitude são considerados outliers moderados. No conjunto de dados desse exemplo, apenas a temperatura do forno (150º C) é considerado um outlier moderado.
-
Encontre as “barreiras externas” do conjunto de dados. Isso é feito da mesma forma que as barreiras internas, com exceção de que a amplitude interquartílica é multiplicada por 3, em vez de 1,5. Ao multiplicar a amplitude interquartílica acima por 3, temos (1,5 * 3), ou 4,5. Deste modo, as barreiras externas superior e inferior são 27 e 16,5.
- Qualquer valor observacional que se encontrar fora das barreiras externas é considerado um outlier extremo. Neste exemplo, a temperatura do forno, 150º C, também é um outlier extremo.
Publicidade
Dicas
- Quando forem encontrados outliers, tente explicar a presença deles antes de descartá-los do conjunto de dados; eles podem apontar para erros na medição ou anormalidades na distribuição.
Publicidade
Materiais Necessários
- Calculadora
Referências
Publicidade