Introdução

Num conjunto de dados, se todas as observações de uma variável estão próximas, isso indica que os indivíduos não são muito diferentes com relação a essa variável. Por outro lado, se as observações estão dispersas, isso indica diferenças entre os indivíduos. Quanto maior a dispersão, maior a diferença. Nas pesquisas estatísticas, são fundamentais a compreensão e quantificação dessa dispersão. Para exemplificar, pense em um caso extremo: se todos os indivíduos de uma população forem iguais com relação a determinada característica, basta um único indivíduo para representar essa população!

Uma medida de dispersão bastante intuitiva é a amplitude dos dados, definida como a distância entre os valores máximo e mínimo. Mas como essa medida considera apenas dois valores, qualquer que seja o tamanho do conjunto de dados, ela tem propriedades limitadas para descrever a dispersão. Nesta atividade você irá conhecer e explorar outras medidas de dispersão, que se baseiam nos desvios em torno da média, definidos como

Di = Xi - X

Na atividade sobre as medidas de posição, vimos que a média é o centro de massa. Logo, sempre haverá observações maiores e menores que a média. Isso significa que sempre haverá desvios positivos e negativos. Mas usar esses desvios como medida de proximidade entre as observações significa que estamos pensando em distância e, assim, temos que trabalhar com números não negativos. Para "tirar" o sinal negativo dos desvios, podemos usar o valor absoluto ou elevar ao quadrado os desvios. Isso nos leva a duas medidas absolutas de dispersão:

Desvio Médio Absoluto - é a média dos valores absolutos dos desvios;

Variância - é a média dos desvios quadráticos, isto é, dos quadrados dos desvios.

Como a variabilidade é uma característica muito importante dos dados, é necessário analisá-la no contexto de cada distribuição. Por exemplo, se dois conjuntos têm as mesmas medidas de dispersão, em qual delas o impacto dessa variabilidade é maior? Respostas a esse tipo de pergunta são dadas pelas medidas relativas de dispersão. Nessa atividade iremos explorar o coeficiente de variação, que é a razão entre o desvio padrão e a média da distribuição.

Clique nas opções acima para iniciar as atividades de exploração dessas medidas. É importante que você faça as atividades na ordem dada.


Creative Commons License


Responsável: Ana Maria Lima de Farias.
Idealização: Ana Maria Lima de Farias.
Programação: Hugo de Oliveira Barbalho e João Marcos de Souza Carvalho.
Colaboração: Rafael Machado Alves
Revisão: Vera Regina Flores

Medidas de Dispersão - Versão 05/12/2009
Atualizações desta atividade estarão disponíveis nos seguintes endereços:
http://www.uff.br/cdme/
http://www.cdme.im-uff.mat.br/

Dúvidas? Sugestões? Nós damos suporte! Contacte-nos pelo e-mail:
conteudosdigitais@im.uff.br.