Universitario

UniversitarioProbabilidad y estadísticaFiguras


Estadística inferencial


La estadística inferencial es una rama de la estadística que se ocupa de extraer conclusiones sobre una población basándose en una muestra. Cuando recopilamos datos, generalmente los recolectamos de una muestra en lugar de toda la población debido a las limitaciones prácticas como el costo, el tiempo y el esfuerzo. La estadística inferencial nos permite hacer predicciones o inferencias sobre la población analizando estos datos de muestra.

Entender los conceptos básicos

Para entender la estadística inferencial, necesitamos estar claros sobre algunos conceptos básicos: población y muestra.

  • Población: Este es el grupo completo de personas, objetos o eventos en los que estamos interesados. Por ejemplo, si estamos estudiando la altura promedio de los estudiantes universitarios, nuestra población consiste en todos los estudiantes universitarios.
  • Muestra: Un subconjunto de la población que se observa o recolecta para el estudio. En nuestro ejemplo, esto podría ser un grupo de 100 estudiantes universitarios seleccionados al azar.

La estadística inferencial va más allá de simplemente describir las propiedades de una muestra (estadística descriptiva). Utiliza la teoría de la probabilidad para estimar los parámetros de la población, testar hipótesis y hacer predicciones.

Ejemplo de población y muestra

En el SVG anterior, imagina que cada círculo representa un individuo en la población. El círculo rojo es una muestra seleccionada de la población.

Procedimientos clave en la estadística inferencial

Hay dos procedimientos principales utilizados en la estadística inferencial:

  • Estimación: Se trata de estimar parámetros de la población (como la media o proporción) a partir de estadísticas de la muestra. Por ejemplo, si queremos estimar la altura promedio de todos los estudiantes universitarios, calculamos la altura promedio de nuestra muestra y la usamos como estimador.
  • Prueba de hipótesis: Esto implica hacer una afirmación o hipótesis sobre un parámetro de población y luego usar datos de muestra para probar esa afirmación. Por ejemplo, podríamos hipotetizar que la altura promedio de los estudiantes universitarios es de 170 cm y probar esta hipótesis usando datos de muestra.

Ejemplo de estimación

Supongamos que seleccionamos una muestra de 100 estudiantes y encontramos que su altura promedio es de 168 cm. Esta media de muestra (168 cm) se utiliza para estimar la media de la población. Lo representamos de la siguiente manera:

Estimación de la Media de la Población = Media de la Muestra = 168 cm

Ejemplo de prueba de hipótesis

Supongamos que suponemos que la altura promedio de los estudiantes universitarios es de 170 cm. Recolectamos una muestra y calculamos que la altura promedio es de 168 cm. Basándonos en estos datos, la estadística inferencial nos ayudará a decidir si aceptar o rechazar nuestra hipótesis.

Tipos de evaluaciones

Hay dos tipos de inferencias en la estadística inferencial:

  • Estimación puntual: Proporciona un valor único como estimación de un parámetro de población. Por ejemplo, utilizando una media de muestra de 168 cm como estimación de la media de población.
  • Estimación por intervalo: Proporciona un rango de valores, llamado intervalo de confianza, dentro del cual se espera que se encuentre el parámetro de población. Por ejemplo, estimando que la altura promedio está entre 165 cm y 171 cm con un nivel de confianza del 95%.

Ejemplo de intervalo de confianza

Basado en nuestra muestra de 100 estudiantes con una altura media de 168 cm, supongamos que calculamos el intervalo de confianza del 95% para la media de la población desde 165 cm hasta 171 cm:

Intervalo de Confianza: (165 cm, 171 cm)

Esto significa que estamos al 95% seguros de que la verdadera altura promedio de todos los estudiantes universitarios cae dentro de este rango.

Elementos de la prueba de hipótesis

Al llevar a cabo pruebas de hipótesis, seguimos los siguientes pasos:

  • Formular la hipótesis:

La hipótesis nula (H0) representa la ausencia de efecto o diferencia, mientras que la hipótesis alternativa (H1) representa el efecto o diferencia que queremos probar.

H0: La altura media de la población es de 170 cm.
H1: La altura media de la población no es de 170 cm.
  • Elegir un nivel de significancia (α): Usualmente elegido como 5% (0.05), esta es la probabilidad de rechazar la hipótesis nula cuando en realidad es verdadera.
  • Calcular las estadísticas de prueba: Dependiendo de los datos recolectados y el tipo de prueba que se esté realizando (p. ej., prueba t, prueba z).
  • Tomar una decisión: Comparar la estadística de prueba con el valor crítico o usar el p-valor para decidir si rechazar o no rechazar la hipótesis nula.

Haciendo visibles las decisiones de prueba con hipótesis nulas y alternativas

Rechazar H0 Rechazar H0 No rechazar H0

El p-valor en la prueba de hipótesis

El p-valor es un concepto importante en la prueba de hipótesis. Es la probabilidad de obtener resultados de prueba al menos tan extremos como los resultados observados, suponiendo que la hipótesis nula sea verdadera. Cuanto más bajo sea el p-valor, más fuerte es la evidencia contra la hipótesis nula. Si el p-valor es menor o igual al nivel de significancia (α), rechazamos la hipótesis nula.

Ejemplo de p-valor

Imagina calcular un p-valor de 0.03 para nuestra prueba de hipótesis de altura:

p-valor = 0.03

Dado que 0.03 < 0.05 (nuestro α elegido es 0.05), rechazamos la hipótesis nula y sugerimos que la altura promedio no es de 170 cm.

Pruebas de normalidad en la estadística inferencial

Hay varias pruebas comunes en la estadística inferencial para abordar diferentes tipos de datos y preguntas de investigación:

  • Prueba t: Se usa para comparar las medias de dos grupos. Por ejemplo, comparando las alturas promedio de estudiantes universitarios femeninos y masculinos.
  • Prueba z: Se utiliza cuando el tamaño de la muestra es grande (n > 30) y la varianza de la población se conoce o al comparar proporciones.
  • Prueba chi-cuadrado: Se usa para comparar variables categóricas. Por ejemplo, para ver si la preferencia de los estudiantes universitarios por una materia es independiente de su año de estudio.
  • ANOVA (Análisis de Varianza): Se utiliza para comparar las medias de más de dos grupos. Por ejemplo, comparando las alturas de los estudiantes de diferentes campos de estudio.

Ejemplo de prueba t

Realicemos una prueba t para comparar las alturas de los estudiantes masculinos y femeninos. Supongamos que nuestra muestra muestra lo siguiente:

Estudiantes masculinos: altura media = 175 cm, tamaño de muestra = 50
Estudiantes femeninos: altura media = 165 cm, tamaño de muestra = 50

Usamos una prueba t para determinar si la diferencia observada es estadísticamente significativa.

El papel del muestreo aleatorio

Una parte importante de la estadística inferencial es garantizar que las muestras se seleccionen aleatoriamente. El muestreo aleatorio ayuda a asegurar que cada persona tenga una oportunidad igual de ser seleccionada, lo que reduce el sesgo y mejora la validez de los resultados. Las muestras aleatorias representan toda la población, haciendo las estimaciones más precisas.

En el SVG anterior, el color rojo representa las muestras seleccionadas aleatoriamente del grupo entero de individuos azules.

Conclusión

La estadística inferencial es un aspecto esencial del análisis de datos. Permite a los estadísticos extraer conclusiones basadas en datos sobre poblaciones grandes a partir de datos de muestra pequeños y manejables. Al estimar cuidadosamente los parámetros de la población y realizar pruebas de hipótesis, podemos responder preguntas sobre tendencias de datos, relaciones y predicciones. Además, un conocimiento y aplicación adecuados de conceptos como distribuciones de muestreo, intervalos de confianza y p-valores son cruciales para obtener conclusiones precisas a través del análisis estadístico.

Palabras comúnmente utilizadas

  • Población: El grupo completo que se está estudiando.
  • Muestra: Un subconjunto de una población que se usa para obtener información sobre el grupo completo.
  • Parámetro: Una característica numérica de una población.
  • Estadísticas: Características numéricas de una muestra.

La estadística inferencial es poderosa porque convierte las observaciones basadas en muestras en generalizaciones o predicciones sobre poblaciones más grandes e influye en decisiones cotidianas en muchos campos como la ciencia, los negocios y la política pública.


Universitario → 6.2.2


U
username
0%
completado en Universitario


Comentarios