× Estatística 1 Estatística 2 Matemática Financeira Logística 1 Administração Financeira Logística 2

open

Estatística 2 - Aula 7

Aula 07 - Introdução à inferência estatística e modelagem de dados

Introdução à inferência estatística e modelagem de dados

Introdução

Vimos anteriormente que a estatística se divide em 4 áreas:

  • Coleta dos dados;
  • Redução dos dados;
  • Análise dos dados;
  • Modelagem dos dados (inferência estatística);

Até o momento realizamos a análise dos dados a partir de dados já coletados e reduzidos previamente. Iremos agora focar nossos estudos na modelagem de dados e seguir com o processo de inferência estatística.

A palavra inferência tem, para este contexto, o significado de conclusivo. Para inferência estatística, queremos obter conclusões sobre nosso conjunto de dados a partir de modelos.

A inferência estatística faz proposições sobre um universo, usando dados tirados de uma amostragem. Dada um hipótese sobre um universo, para o qual nós queremos tirar inferências, a inferência estatística consiste em (primeiramente) selecionar um modelo estatístico do processo que gera os dados e (segundamente) deduzir as proposições a partir do modelo.

Duas situações da inferência estatística serão vistas nesse curso:

  • Teste de hipótese;
  • Intervalos de confiança para média de uma amostra;

As duas situações são muito vistas em artigos acadêmicos e na televisão (o famoso 1% de erro para cima ou para baixo em amostras eleitorais).

Artigos acadêmicos

Alguns artigos acadêmicos que utilizam de estatística:

https://pdfs.semanticscholar.org/a5c5/a0abdd57388eb8a568d43db8a147a3cf09fc.pdf

http://www.bibliotecadigital.ufmg.br/dspace/bitstream/handle/1843/SFSA-9RMGC8/tese_junia_alves.pdf?sequence=1

Podemos notar uma palavra (ou letra neste caso) em comum:

  • valor P

O valor p é a probabilidade do que estamos testando ocorrer. No ramo científico nunca há certeza absoluta de algo, nunca podemos provar ao certo qual a causa de algum problema. Podemos apenas afirmar se algo é pouco ou muito provável. Neste caso não estamos preocupados com a causalidade e sim se há correlações.

Exemplo prático

Na ciência dificilmente podemos provar causalidade, mas temos diversos assuntos que gostaríamos de testar:

  • Testar se mais homens que mulheres sofrem com pesadelos.
  • Estabelecer autoria de documentos.
  • Avaliar o efeito da lua cheia no comportamento.
  • Determinar o intervalo no qual um morcego pode detectar um inseto pelo eco.
  • Decidir se o carpete de hospital resulta em mais infecções.
  • Selecionar os melhores meios para parar de fumar.
  • Checar se adesivos refletem no comportamento de proprietários de carros.
  • Testar as reivindicações de analistas de manuscritos.
  • Verificar se há diferenças salariais entre brancos e negros.

Nestes casos, o que faríamos? Vamos usar o último exemplo. Como verificar se há diferenças salariais entre brancos e negros? Podemos seguir os seguintes passos:

  • Coletar dados de salários de pessoas brancas;
  • Coletar dados de salários de pessoas negras;
  • Retirar a média de cada amostra;
  • Comparar a média de cada amostra e dizer se há diferenças.

É óbvio que haverá diferenças, mas no caso podemos tolerar se a diferença for pequena. O "pequena" nesse caso gera muitas dúvidas, o que seria pequena? Testes estatísticos existem para padronizar a noção de "pequena" e não gerar dúvidas entre pesquisas.

No caso, em estatística, dizemos que há diferença salarial entre brancos e negros quando a probabilidade de uma pessoa branca receber a média de um negro for extremamente pequena!

Para isso há o cálculo de probabilidade e teste de hipóteses, mas percebe-se que em nenhum momento é discutido porque existe diferença salarial. O porque sai do escopo da estatística e passa a fazer partes de outras áreas da ciência.

In [ ]: