Num conjunto de dados, se todas as observações de uma variável estão próximas, isso indica que os indivíduos não são muito diferentes com relação a essa variável. Por outro lado, se as observações estão dispersas, isso indica diferenças entre os indivíduos. Quanto maior a dispersão, maior a diferença. Nas pesquisas estatísticas, são fundamentais a compreensão e quantificação dessa dispersão. Para exemplificar, pense em um caso extremo: se todos os indivíduos de uma população forem iguais com relação a determinada característica, basta um único indivíduo para representar essa população!
Uma medida de dispersão bastante intuitiva é a amplitude dos dados, definida como a distância entre os valores máximo e mínimo. Mas como essa medida considera apenas dois valores, qualquer que seja o tamanho do conjunto de dados, ela tem propriedades limitadas para descrever a dispersão. Nesta atividade você irá conhecer e explorar outras medidas de dispersão, que se baseiam nos desvios em torno da média, definidos como
Di = Xi - X
Na atividade sobre as medidas de posição, vimos que a média é o centro de massa. Logo, sempre haverá observações maiores e menores que a média. Isso significa que sempre haverá desvios positivos e negativos. Mas usar esses desvios como medida de proximidade entre as observações significa que estamos pensando em distância e, assim, temos que trabalhar com números não negativos. Para "tirar" o sinal negativo dos desvios, podemos usar o valor absoluto ou elevar ao quadrado os desvios. Isso nos leva a duas medidas absolutas de dispersão:
Desvio Médio Absoluto - é a média dos valores absolutos dos desvios;
Variância - é a média dos desvios quadráticos, isto é, dos quadrados dos desvios.
Como a variabilidade é uma característica muito importante dos dados, é necessário analisá-la no contexto de cada distribuição. Por exemplo, se dois conjuntos têm as mesmas medidas de dispersão, em qual delas o impacto dessa variabilidade é maior? Respostas a esse tipo de pergunta são dadas pelas medidas relativas de dispersão. Nessa atividade iremos explorar o coeficiente de variação, que é a razão entre o desvio padrão e a média da distribuição.
Clique nas opções acima para iniciar as atividades de exploração dessas medidas. É importante que você faça as atividades na ordem dada.