Medidas de dispersão
Em estatística, o conceito de "medidas de dispersão" é muito importante. Ele nos diz quanto um conjunto de dados se espalha ou varia. Simplificando, embora você possa conhecer a média de um grupo de números, as medidas de dispersão ajudam a entender quão distantes outros números geralmente estão dessa média. Vamos olhar isso em mais detalhes.
Entendendo a dispersão com um exemplo
Imagine que temos dois pequenos conjuntos de números representando as notas obtidas por dois estudantes em cinco disciplinas diferentes:
- Estudante A: 80, 85, 78, 90, 82
- Estudante B: 60, 95, 70, 100, 55
Ambos Estudante A e Estudante B têm uma pontuação média (média) de 83. No entanto, há alguma diferença no desempenho deles, que podemos entender usando medidas de dispersão. Enquanto as notas do Estudante A estão próximas umas das outras, as notas do Estudante B variam amplamente. Essa diferença na dispersão é exatamente o que as medidas de dispersão medem.
Tipos de medidas de dispersão
Existem várias maneiras de medir a dispersão dos dados. A medida de dispersão mais comum é:
- Categoria
- Intervalo interquartil
- Variância
- Desvio padrão
- Desvio absoluto médio
Categoria
A medida mais simples de dispersão é o intervalo. O intervalo mede a diferença entre os valores máximo e mínimo em um conjunto de dados. A fórmula para calcular o intervalo é:
Intervalo = Valor Máximo - Valor Mínimo
Use nosso exemplo:
- Estudante A: Intervalo = 90 – 78 = 12
- Estudante B: Intervalo = 100 – 55 = 45
Como você pode ver, as notas do Estudante B estão mais espalhadas, indicando que as notas estão mais espalhadas do que as do Estudante A.
Intervalo interquartil
Os quartis dividem nosso conjunto de dados em quatro partes iguais. Isso nos ajuda a entender a dispersão em mais detalhes, concentrando-se não apenas nos extremos, mas também nos valores intermediários. O intervalo interquartil (IIQ) é a diferença entre o terceiro quartil (Q3) e o primeiro quartil (Q1). É uma medida da dispersão nos 50% intermediários dos dados:
IIQ = Q3 - Q1
Para cada estudante, organize as notas em ordem crescente para encontrar os quartis:
- Estudante A: 78, 80, 82, 85, 90
- Estudante B: 55, 60, 70, 95, 100
Para o Estudante A:
- Q1 = 80, Q2 (mediana) = 82, Q3 = 85
Para o Estudante B:
- Q1 = 60, Q2 (mediana) = 70, Q3 = 95
Portanto, IIQ para o estudante A: 85 - 80 = 5 e para o estudante B: 95 - 60 = 35.
Variância
A variância é uma medida de quão grande é a variação de cada número em um conjunto de dados a partir do quadrado da média. É mais complexa, mas muito útil. A fórmula para calcular a variância é:
Variância (σ²) = Σ (xᵢ - x̄)² / N
Onde:
Σ
significa a soma...xᵢ
é cada número individual no conjuntox̄
é a média dos númerosN
é o número de observações no conjunto
Para uma demonstração prática, vamos calcular a variância das notas do Estudante A:
- Média = 83
- (80-83)² + (85-83)² + (78-83)² + (90-83)² + (82-83)² = 9 + 4 + 25 + 49 + 1 = 88
- Variância = 88 / 5 = 17,6
Desvio padrão
O desvio padrão é simplesmente a raiz quadrada da variância e nos dá uma medida clara, equivalente à escala da dispersão. A fórmula é:
Desvio Padrão (σ) = √Variância
Usando a variância do Estudante A, o desvio padrão é √17,6 ≈ 4,2.
Este número dá uma boa noção de quão distribuído está o conjunto de dados em termos das unidades originais, neste caso, números.
Desvio absoluto médio
Outra medida simples de dispersão é o desvio absoluto médio (DAM). Esta é a média das diferenças absolutas entre cada ponto de dados e a média:
DAM = Σ |xᵢ - x̄| / N
Usando o Estudante A:
- Média = 83
- |80-83| + |85-83| + |78-83| + |90-83| + |82-83| = 3 + 2 + 5 + 7 + 1 = 18
- DAM = 18 / 5 = 3,6
Por que as medidas de dispersão são importantes
Entender as medidas de dispersão fornece uma visão essencial de um conjunto de dados:
- Avaliação de Risco: Em finanças, entender o risco (variância) de um investimento.
- Garantia de Qualidade: Na fabricação, garantir que os produtos atendam a um certo padrão e que as variações sejam mínimas.
- Análise Comparativa: Na educação, comparar desempenho em diferentes avaliações.
Conclusão
As medidas de dispersão nos ajudam a entender melhor os dados além de saber apenas sobre a média. Elas mostram quão distribuídos estão os dados, os riscos envolvidos ou a volatilidade. Desde cálculos simples como o intervalo a cálculos complexos como variância e desvio padrão, cada medida fornece insights únicos, levando a uma análise mais rica dos dados.