Graduação → Probabilidade e estatística → Figuras ↓
Estatística inferencial
Estatística inferencial é um ramo da estatística que trata de tirar conclusões sobre uma população com base em uma amostra. Quando coletamos dados, geralmente coletamos dados de uma amostra em vez de toda a população devido a restrições práticas como custo, tempo e esforço. A estatística inferencial nos permite fazer previsões ou inferências sobre a população analisando esses dados da amostra.
Compreendendo o básico
Para entender a estatística inferencial, precisamos estar claros sobre alguns conceitos básicos: população e amostra.
- População: Este é o grupo inteiro de pessoas, objetos ou eventos nos quais estamos interessados. Por exemplo, se estamos estudando a altura média dos estudantes universitários, nossa população consiste em todos os estudantes universitários.
- Amostra: Um subconjunto da população que é realmente observado ou coletado para estudo. Em nosso exemplo, isso poderia ser um grupo de 100 estudantes universitários selecionados aleatoriamente.
A estatística inferencial vai além de simplesmente descrever as propriedades de uma amostra (estatística descritiva). Ela usa a teoria da probabilidade para estimar parâmetros da população, testar hipóteses e fazer previsões.
Exemplo de população e amostra
No SVG acima, imagine que cada círculo representa um indivíduo na população. O círculo vermelho é uma amostra selecionada da população.
Procedimentos principais na estatística inferencial
Existem dois procedimentos principais utilizados na estatística inferencial:
- Estimativa: Isso envolve estimar parâmetros da população (como a média ou proporção) a partir de estatísticas da amostra. Por exemplo, se quisermos estimar a altura média de todos os estudantes universitários, calculamos a altura média de nossa amostra e a usamos como estimador.
- Teste de hipótese: Isso envolve fazer uma declaração ou hipótese sobre um parâmetro da população e depois usar dados da amostra para testar essa declaração. Por exemplo, podemos hipotetizar que a altura média dos estudantes universitários é 170 cm e testar essa hipótese usando dados da amostra.
Exemplo de estimativa
Suponha que selecionemos uma amostra de 100 estudantes e encontremos que a altura média deles é de 168 cm. Esta média amostral (168 cm) é usada para estimar a média populacional. Nós a representamos da seguinte forma:
Média Populacional Estimada = Média Amostral = 168 cm
Exemplo de teste de hipótese
Suponha que hipotetizamos que a altura média dos estudantes universitários é 170 cm. Coletamos uma amostra e calculamos a altura média para ser 168 cm. Com base nesses dados, a estatística inferencial nos ajudará a decidir se devemos aceitar ou rejeitar nossa hipótese.
Tipos de avaliações
Existem dois tipos de inferência na estatística inferencial:
- Estimativa pontual: Fornece um único valor como uma estimativa de um parâmetro da população. Por exemplo, usar uma média amostral de 168 cm como estimativa da média populacional.
- Estimativa intervalar: Fornece um intervalo de valores, chamado de intervalo de confiança, dentro do qual se espera que o parâmetro da população esteja. Por exemplo, estimar que a altura média esteja entre 165 cm e 171 cm com um nível de confiança de 95%.
Exemplo de intervalo de confiança
Com base em nossa amostra de 100 estudantes com uma altura média de 168 cm, suponha que calculamos o intervalo de confiança de 95% para a média populacional de 165 cm a 171 cm:
Intervalo de Confiança: (165 cm, 171 cm)
Isso significa que estamos 95% confiantes de que a verdadeira altura média de todos os estudantes universitários está dentro deste intervalo.
Elementos do teste de hipóteses
Ao conduzir testes de hipóteses, seguimos os seguintes passos:
- Formular a hipótese:
A hipótese nula (H0
) representa nenhuma efeito ou diferença, enquanto a hipótese alternativa (H1
) representa o efeito ou diferença que queremos testar.
H0: A altura média populacional é 170 cm.
H1: A altura média populacional não é 170 cm.
- Escolher um nível de significância (
α
): Geralmente escolhido como 5% (0,05), essa é a probabilidade de rejeitar a hipótese nula quando ela é realmente verdadeira. - Cálculo dos estatísticos de teste: Dependendo dos dados coletados e do tipo de teste realizado (por exemplo,
t-test
,z-test
). - Tomar uma decisão: Comparar o estatístico de teste com o valor crítico ou usar o valor-p para decidir se rejeitar ou não rejeitar a hipótese nula.
Tornando visíveis as decisões de teste com hipóteses nulas e alternativas
Valor-p no teste de hipóteses
O valor-p é um conceito importante no teste de hipóteses. Ele é a probabilidade de obter resultados de teste pelo menos tão extremos quanto os resultados observados, assumindo que a hipótese nula é verdadeira. Quanto menor o valor-p, mais forte é a evidência contra a hipótese nula. Se o valor-p é menor ou igual ao nível de significância (α
), rejeitamos a hipótese nula.
Exemplo de valor-p
Imagine calcular um valor-p de 0,03 para o nosso teste de hipótese de altura:
valor-p = 0,03
Como 0,03 < 0,05 (nosso α escolhido é 0,05), rejeitamos a hipótese nula e sugerimos que a altura média não é 170 cm.
Testes de normalidade na estatística inferencial
Existem vários testes comuns na estatística inferencial para abordar diferentes tipos de dados e questões de pesquisa:
- T-teste: Usado para comparar as médias de dois grupos. Por exemplo, comparando as alturas médias de estudantes universitários do sexo feminino e masculino.
- Z-teste: É usado quando o tamanho da amostra é grande (n > 30) e a variância da população é conhecida ou ao comparar proporções.
- Teste qui-quadrado: Usado para comparar variáveis categóricas. Por exemplo, para ver se a preferência dos estudantes universitários por uma matéria é independente do seu ano de estudo.
- ANOVA (Análise de Variância): Usado para comparar as médias de mais de dois grupos. Por exemplo, comparando as alturas de estudantes de diferentes áreas de estudo.
Exemplo de T-teste
Vamos realizar um t-teste para comparar as alturas de estudantes do sexo masculino e feminino. Suponha que nossa amostra mostre o seguinte:
Estudantes do sexo masculino: altura média = 175 cm, tamanho da amostra = 50
Estudantes do sexo feminino: altura média = 165 cm, tamanho da amostra = 50
Nós usamos um t-teste para determinar se a diferença observada é estatisticamente significativa.
O papel da amostragem aleatória
Uma parte importante da estatística inferencial é garantir que as amostras sejam selecionadas aleatoriamente. A amostragem aleatória ajuda a garantir que cada pessoa tenha uma chance igual de ser selecionada, o que reduz o viés e melhora a validade dos resultados. Amostras aleatórias representam a população inteira, tornando as estimativas mais precisas.
No SVG acima, a cor vermelha representa amostras selecionadas aleatoriamente do grupo inteiro de indivíduos azuis.
Conclusão
A estatística inferencial é um aspecto essencial da análise de dados. Ela permite que estatísticos tirem conclusões baseadas em dados sobre grandes populações com base em dados de amostras pequenas e manejáveis. Estimando cuidadosamente os parâmetros da população e realizando testes de hipóteses, podemos responder a perguntas sobre tendências, relacionamentos e previsões de dados. Além disso, um entendimento e aplicação adequados de conceitos como distribuições amostrais, intervalos de confiança e valores-p são cruciais para tirar conclusões precisas por meio da análise estatística.
Palavras comumente usadas
- População: O grupo inteiro sendo estudado.
- Amostra: Um subconjunto de uma população que é usado para obter informações sobre o grupo inteiro.
- Parâmetro: Uma característica numérica de uma população.
- Estatísticas: Características numéricas de uma amostra.
A estatística inferencial é poderosa porque transforma observações baseadas em amostras em generalizações ou previsões sobre populações maiores e influencia decisões cotidianas em muitos campos, como ciência, negócios e políticas públicas.