Medidas de dispersión
En estadística, el concepto de "medidas de dispersión" es muy importante. Nos indica cuánto se dispersa o varía un conjunto de datos. Para simplificar, aunque puedas conocer el promedio de un grupo de números, las medidas de dispersión te ayudan a entender qué tan lejos caen típicamente otros números de este promedio. Veamos esto con más detalle.
Entendiendo la dispersión con un ejemplo
Imagina que tenemos dos pequeños conjuntos de números que representan las calificaciones obtenidas por dos estudiantes en cinco materias diferentes:
- Estudiante A: 80, 85, 78, 90, 82
- Estudiante B: 60, 95, 70, 100, 55
Tanto el Estudiante A como el Estudiante B tienen una calificación promedio (media) de 83. Sin embargo, hay alguna diferencia en su rendimiento, que podemos entender utilizando medidas de dispersión. Mientras que las calificaciones del Estudiante A están cercanas entre sí, las calificaciones del Estudiante B varían ampliamente. Esta diferencia en la dispersión es exactamente lo que miden las medidas de dispersión.
Tipos de medidas de dispersión
Hay varias formas de medir la dispersión de los datos. La medida más común de dispersión es:
- Categoría
- Rango Cuartil e Intercuartil
- Varianza
- Desviación Estándar
- Desviación media absoluta
Categoría
La medida más simple de dispersión es el rango. El rango mide la diferencia entre los valores máximo y mínimo en un conjunto de datos. La fórmula para calcular el rango es:
Rango = Valor Máximo - Valor Mínimo
Usando nuestro ejemplo:
- Estudiante A: Rango = 90 – 78 = 12
- Estudiante B: Rango = 100 – 55 = 45
Como puedes ver, las calificaciones del Estudiante B están más dispersas, lo que indica que las calificaciones están más dispersas que las del Estudiante A.
Rango cuartil e intercuartil
Los cuartiles dividen nuestro conjunto de datos en cuatro partes iguales. Esto nos ayuda a entender la dispersión con más detalle, centrándonos no solo en los extremos sino también en los valores medios. El rango intercuartil (IQR) es la diferencia entre el tercer cuartil (Q3) y el primer cuartil (Q1). Es una medida de la dispersión en el 50% medio de los datos:
IQR = Q3 - Q1
Para cada estudiante, organiza las calificaciones en orden ascendente para encontrar los cuartiles:
- Estudiante A: 78, 80, 82, 85, 90
- Estudiante B: 55, 60, 70, 95, 100
Para el Estudiante A:
- Q1 = 80, Q2 (mediana) = 82, Q3 = 85
Para el Estudiante B:
- Q1 = 60, Q2 (mediana) = 70, Q3 = 95
Por lo tanto, el IQR para el estudiante A: 85 - 80 = 5 y para el estudiante B: 95 - 60 = 35.
Varianza
La varianza es una medida de cuánto varía cada número en un conjunto de datos del cuadrado de la media. Es más compleja, pero muy útil. La fórmula para calcular la varianza es:
Varianza (σ²) = Σ (xᵢ - x̄)² / N
Donde:
Σ
significa la suma...xᵢ
es cada número individual en el conjuntox̄
es la media de los númerosN
es el número de observaciones en el conjunto
Para una demostración práctica, calculemos la varianza para las calificaciones del Estudiante A:
- Media = 83
- (80-83)² + (85-83)² + (78-83)² + (90-83)² + (82-83)² = 9 + 4 + 25 + 49 + 1 = 88
- Varianza = 88 / 5 = 17.6
Desviación estándar
La desviación estándar es simplemente la raíz cuadrada de la varianza y nos da una medida clara y equivalente en escala de la dispersión. La fórmula es:
Desviación Estándar (σ) = √Varianza
Utilizando la varianza del Estudiante A, la desviación estándar es √17.6 ≈ 4.2.
Este número da una buena idea de qué tan disperso está el conjunto de datos en términos de las unidades originales, en este caso números.
Desviación media absoluta
Otra medida simple de dispersión es la desviación media absoluta (MAD). Esta es el promedio de las diferencias absolutas entre cada punto de datos y la media:
MAD = Σ |xᵢ - x̄| / N
Usando el Estudiante A:
- Media = 83
- |80-83| + |85-83| + |78-83| + |90-83| + |82-83| = 3 + 2 + 5 + 7 + 1 = 18
- MAD = 18 / 5 = 3.6
Por qué las medidas de dispersión son importantes
Comprender las medidas de dispersión proporciona una perspectiva esencial sobre un conjunto de datos:
- Evaluación de Riesgos: En finanzas, comprender el riesgo (varianza) de una inversión.
- Aseguramiento de la Calidad: En manufactura, asegurando que los productos cumplan con un cierto estándar y que las variaciones se mantengan al mínimo.
- Análisis Comparativo: En educación, comparando el rendimiento en diferentes evaluaciones.
Conclusión
Las medidas de dispersión nos ayudan a comprender mejor los datos más allá de solo conocer el promedio. Muestran qué tan dispersos están los datos, los riesgos involucrados o la volatilidad. Desde cálculos simples como el rango hasta cálculos complejos como la varianza y la desviación estándar, cada medida proporciona ideas únicas, llevando a un análisis más rico de los datos.